FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB8363, 503 aa 1>>>pF1KB8363 503 - 503 aa - 503 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.5243+/-0.00103; mu= 16.6555+/- 0.061 mean_var=67.1336+/-13.740, 0's: 0 Z-trim(103.4): 69 B-trim: 0 in 0/49 Lambda= 0.156532 statistics sampled from 7336 (7408) to 7336 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.59), E-opt: 0.2 (0.228), width: 16 Scan time: 2.970 The best scores are: opt bits E(32554) CCDS10139.1 CYP19A1 gene_id:1588|Hs108|chr15 ( 503) 3319 758.9 0 CCDS33491.1 CYP24A1 gene_id:1591|Hs108|chr20 ( 514) 348 88.0 2.7e-17 CCDS34119.1 CYP4V2 gene_id:285440|Hs108|chr4 ( 525) 335 85.1 2.1e-16 CCDS33285.1 CYP27C1 gene_id:339761|Hs108|chr2 ( 372) 320 81.6 1.7e-15 CCDS9954.1 CYP46A1 gene_id:10858|Hs108|chr14 ( 500) 307 78.7 1.6e-14 CCDS64723.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 393) 303 77.8 2.5e-14 CCDS5676.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 503) 303 77.8 3.1e-14 CCDS5675.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 504) 293 75.6 1.5e-13 CCDS55123.1 CYP51A1 gene_id:1595|Hs108|chr7 ( 404) 289 74.6 2.3e-13 CCDS5673.1 CYP3A7 gene_id:1551|Hs108|chr7 ( 503) 286 74.0 4.4e-13 CCDS75639.1 CYP3A51P gene_id:100861540|Hs108|chr7 ( 535) 286 74.0 4.7e-13 CCDS7686.1 CYP2E1 gene_id:1571|Hs108|chr10 ( 493) 285 73.8 5.1e-13 CCDS55721.1 CYP2C8 gene_id:1558|Hs108|chr10 ( 388) 282 73.0 6.6e-13 CCDS12569.1 CYP2A7 gene_id:1549|Hs108|chr19 ( 494) 283 73.3 6.9e-13 CCDS73166.1 CYP2C8 gene_id:1558|Hs108|chr10 ( 420) 282 73.0 7.1e-13 CCDS7438.1 CYP2C8 gene_id:1558|Hs108|chr10 ( 490) 282 73.1 8.1e-13 CCDS34047.1 CYP2U1 gene_id:113612|Hs108|chr4 ( 544) 281 72.9 1e-12 CCDS5674.1 CYP3A4 gene_id:1576|Hs108|chr7 ( 503) 280 72.6 1.1e-12 CCDS7818.1 CYP2R1 gene_id:120227|Hs108|chr11 ( 501) 279 72.4 1.3e-12 CCDS5672.1 CYP3A5 gene_id:1577|Hs108|chr7 ( 502) 278 72.2 1.5e-12 CCDS7426.1 CYP26A1 gene_id:1592|Hs108|chr10 ( 497) 273 71.0 3.3e-12 CCDS12568.1 CYP2A6 gene_id:1548|Hs108|chr19 ( 494) 272 70.8 3.9e-12 CCDS7437.1 CYP2C9 gene_id:1559|Hs108|chr10 ( 490) 269 70.1 6.2e-12 CCDS7427.1 CYP26A1 gene_id:1592|Hs108|chr10 ( 428) 268 69.9 6.4e-12 CCDS7436.1 CYP2C19 gene_id:1557|Hs108|chr10 ( 490) 260 68.1 2.5e-11 CCDS7435.1 CYP2C18 gene_id:1562|Hs108|chr10 ( 490) 257 67.4 4e-11 CCDS12570.1 CYP2B6 gene_id:1555|Hs108|chr19 ( 491) 255 67.0 5.5e-11 CCDS33657.1 CYP2D6 gene_id:1565|Hs108|chr22 ( 446) 254 66.7 6e-11 CCDS46721.1 CYP2D6 gene_id:1565|Hs108|chr22 ( 497) 254 66.8 6.5e-11 CCDS44460.1 CYP2C18 gene_id:1562|Hs108|chr10 ( 431) 253 66.5 6.8e-11 CCDS12571.1 CYP2A13 gene_id:1553|Hs108|chr19 ( 494) 253 66.5 7.6e-11 CCDS81318.1 CYP4B1 gene_id:1580|Hs108|chr1 ( 497) 253 66.5 7.6e-11 CCDS542.1 CYP4B1 gene_id:1580|Hs108|chr1 ( 511) 253 66.5 7.8e-11 CCDS41328.1 CYP4B1 gene_id:1580|Hs108|chr1 ( 512) 253 66.5 7.8e-11 >>CCDS10139.1 CYP19A1 gene_id:1588|Hs108|chr15 (503 aa) initn: 3319 init1: 3319 opt: 3319 Z-score: 4050.0 bits: 758.9 E(32554): 0 Smith-Waterman score: 3319; 99.4% identity (99.4% similar) in 503 aa overlap (1-503:1-503) 10 20 30 40 50 60 pF1KB8 MVLEMLNPIHYNITSIVPEAMPAATMPVLLLTGLFLLVWNYEGTSSIPGPGYCMGIGPLI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MVLEMLNPIHYNITSIVPEAMPAATMPVLLLTGLFLLVWNYEGTSSIPGPGYCMGIGPLI 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB8 SHGRFLWMGIGSACNYYNRVYGEFMRVWISGEGTLIISKSSSMFHIMKHNHYSSRFGSKL :::::::::::::::::::::::::::::::: ::::::::::::::::::::::::::: CCDS10 SHGRFLWMGIGSACNYYNRVYGEFMRVWISGEETLIISKSSSMFHIMKHNHYSSRFGSKL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB8 GLQCIGMHEKGIIFNNNPELWKTTRPFFMKALSGPGLVRMVTVCAESLKTHLDRLEEVTN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 GLQCIGMHEKGIIFNNNPELWKTTRPFFMKALSGPGLVRMVTVCAESLKTHLDRLEEVTN 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB8 ESGYVDVLTLLRRVMLDTSNTLFLRISLDESAIVVKIQGYFDAWQALLIKPDIFFKISWL :::::::::::::::::::::::::: ::::::::::::::::::::::::::::::::: CCDS10 ESGYVDVLTLLRRVMLDTSNTLFLRIPLDESAIVVKIQGYFDAWQALLIKPDIFFKISWL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB8 YKKYEKSVKDLKDAIEVLIAEKRRRISTEEKLEECMDFATELILAEKRGDLTRENVNQCI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 YKKYEKSVKDLKDAIEVLIAEKRRRISTEEKLEECMDFATELILAEKRGDLTRENVNQCI 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB8 LEMLIAAPDTMSVSLFFMLFLIAKHPNVEEAIIKEIQTVIGERDIKIDDIQKLKVMENFI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LEMLIAAPDTMSVSLFFMLFLIAKHPNVEEAIIKEIQTVIGERDIKIDDIQKLKVMENFI 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB8 YESMRYQPVVDLVMRKALEDDVIDGYPVKKGTNIILNIGRMHRLEFFPKPNEFTLENFAK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 YESMRYQPVVDLVMRKALEDDVIDGYPVKKGTNIILNIGRMHRLEFFPKPNEFTLENFAK 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB8 NVPYRYFQPFGFGPRGCAGKYIAMVMMKAILVTLLRRFHVKTLQGQCVESIQKIHDSSLH :::::::::::::::::::::::::::::::::::::::::::::::::::::::: ::: CCDS10 NVPYRYFQPFGFGPRGCAGKYIAMVMMKAILVTLLRRFHVKTLQGQCVESIQKIHDLSLH 430 440 450 460 470 480 490 500 pF1KB8 PDETKNMLEMIFTPRNSDRCLEH ::::::::::::::::::::::: CCDS10 PDETKNMLEMIFTPRNSDRCLEH 490 500 >>CCDS33491.1 CYP24A1 gene_id:1591|Hs108|chr20 (514 aa) initn: 258 init1: 98 opt: 348 Z-score: 423.9 bits: 88.0 E(32554): 2.7e-17 Smith-Waterman score: 364; 21.2% identity (56.9% similar) in 480 aa overlap (42-495:53-514) 20 30 40 50 60 70 pF1KB8 NITSIVPEAMPAATMPVLLLTGLFLLVWNYEGTSSIPGPGYCMGIGPLISHGRFLWMGIG ......::: .: :. ..:: : : CCDS33 QPPRLVTSTAYTSPQPREVPVCPLTAGGETQNAAALPGPTSWPLLGSLL---QILWKG-G 30 40 50 60 70 80 90 100 110 120 pF1KB8 SACNY-----YNRVYGEFMRVWISGEGTLIISKSSSMFHIMK-HNHYSSRFGSKLGLQCI .. :.. ::...:. ... .. ... . ... .. : .:. : CCDS33 LKKQHDTLVEYHKKYGKIFRMKLGSFESVHLGSPCLLEALYRTESAYPQRLEIKPWKAYR 80 90 100 110 120 130 130 140 150 160 170 180 pF1KB8 GMHEKGI-IFNNNPELWKTTRPFFMKALSGPGLV-RMVTVCAESLKTHLDRLEEVTNESG ....: .. . : :. .: :.: : :: : .. . : : . :..:. .: : CCDS33 DYRKEGYGLLILEGEDWQRVRSAFQKKLMKPGEVMKLDNKINEVLADFMGRIDELCDERG 140 150 160 170 180 190 190 200 210 220 230 pF1KB8 YV-DVLTLLRR--------VMLDTSNTLFLRISLDESA-IVVKIQGYFDAWQALLIKPDI .: :. . : . :. . :. . . ::.. ... :. ..... ... : CCDS33 HVEDLYSELNKWSFESICLVLYEKRFGLLQKNAGDEAVNFIMAIKTMMSTFGRMMVTPVE 200 210 220 230 240 250 240 250 260 270 280 290 pF1KB8 FFKI--SWLYKKYEKSVKDLKDAIEVLIAEKRRRISTEEKLEECMDFATELILAEKRGDL . : . ... . . . .... : .. .. : . . :: . : ..: : CCDS33 LHKSLNTKVWQDHTLAWDTIFKSVKACIDNRLEKYSQQPS----ADFLCD-IYHQNR--L 260 270 280 290 300 310 300 310 320 330 340 350 pF1KB8 TRENVNQCILEMLIAAPDTMSVSLFFMLFLIAKHPNVEEAIIKEIQTVIGERDI-KIDDI ..... . :. .:: .: . ::...:. ....:.:.. ..::::.:. : .. . .:. CCDS33 SKKELYAAVTELQLAAVETTANSLMWILYNLSRNPQVQQKLLKEIQSVLPENQVPRAEDL 320 330 340 350 360 370 360 370 380 390 400 pF1KB8 QKLKVMENFIYESMRYQPVVDLVMRKALEDDVIDGYPVKKGTNIILNIGRMHRLE-FFPK ... .. . :::: : : .. : . :. : . ::: ..:: . : : CCDS33 RNMPYLKACLKESMRLTPSVPFTTRTLDKATVLGEYALPKGTVLMLNTQVLGSSEDNFED 380 390 400 410 420 430 410 420 430 440 450 460 pF1KB8 PNEFT----LENFAKNVPYRYFQPFGFGPRGCAGKYIAMVMMKAILVTLLRRFHVKTLQG ..: :.. : :. .. ::: : : : :. .: .... : ..:.. ... .. CCDS33 SSQFRPERWLQEKEKINPFAHL-PFGVGKRMCIGRRLAELQLHLALCWIVRKYDIQATDN 440 450 460 470 480 490 470 480 490 500 pF1KB8 QCVESIQKIHDSSLHPDETKNMLEMIFTPRNSDRCLEH : .. .:...: :.. : . : : CCDS33 ---EPVEMLHSGTLVPSRE---LPIAFCQR 500 510 >>CCDS34119.1 CYP4V2 gene_id:285440|Hs108|chr4 (525 aa) initn: 227 init1: 105 opt: 335 Z-score: 407.8 bits: 85.1 E(32554): 2.1e-16 Smith-Waterman score: 343; 29.0% identity (62.4% similar) in 255 aa overlap (233-464:246-494) 210 220 230 240 250 260 pF1KB8 FLRISLDESAIVVKIQGYFDAWQALLIKPDIFFKISWLYKKYEKSVKDLKDAIEVLIAEK ..:: .: .:: :.. :. . .:::. CCDS34 DSEYVRAVYRMSEMIFRRIKMPWLWLDLWYLMFKEGWEHKK---SLQILHTFTNSVIAER 220 230 240 250 260 270 270 280 290 300 pF1KB8 RRRISTEE--------------KLEECMDFATELILAEKRGD-LTRENVNQCILEMLIAA .....: : . .:. : ... .:. :..:.. . . ... . CCDS34 ANEMNANEDCRGDGRGSAPSKNKRRAFLDLL--LSVTDDEGNRLSHEDIREEVDTFMFEG 280 290 300 310 320 330 310 320 330 340 350 360 pF1KB8 PDTMSVSLFFMLFLIAKHPNVEEAIIKEIQTVIGERD--IKIDDIQKLKVMENFIYESMR :: .... . :.:....:.:.. . .:.. :.:. : ..:..::. .: : :..: CCDS34 HDTTAAAINWSLYLLGSNPEVQKKVDHELDDVFGKSDRPATVEDLKKLRYLECVIKETLR 340 350 360 370 380 390 370 380 390 400 410 420 pF1KB8 YQPVVDLVMRKALEDDVIDGYPVKKGTNIILNIGRMHRL-EFFPKPNEFTLENF-AKNV- : : : :.. :: . :: : :::. .. .:: ..::.:.:: : : .:. CCDS34 LFPSVPLFARSVSEDCEVAGYRVLKGTEAVIIPYALHRDPRYFPNPEEFQPERFFPENAQ 400 410 420 430 440 450 430 440 450 460 470 pF1KB8 ---PYRYFQPFGFGPRGCAGKYIAMVMMKAILVTLLRRFHVKTLQGQCVESIQKIHDSSL :: : ::. :::.: :. .:.. :.:: .::.: ... : CCDS34 GRHPYAYV-PFSAGPRNCIGQKFAVMEEKTILSCILRHFWIESNQKREELGLEGQLILRP 460 470 480 490 500 480 490 500 pF1KB8 HPDETKNMLEMIFTPRNSDRCLEH CCDS34 SNGIWIKLKRRNADER 510 520 >>CCDS33285.1 CYP27C1 gene_id:339761|Hs108|chr2 (372 aa) initn: 284 init1: 138 opt: 320 Z-score: 391.9 bits: 81.6 E(32554): 1.7e-15 Smith-Waterman score: 330; 29.8% identity (58.4% similar) in 255 aa overlap (219-462:102-343) 190 200 210 220 230 240 pF1KB8 TLLRRVMLDTSNTLFLRISLDESAIVVKIQGYFDAW-QALLIKPDIFFKISW--LYKKYE : . : . .. :: : :: :.: . CCDS33 CLENSIPQLTVEYIEALELMFSMFKTSMYAGAIPRWLRPFIPKPWREFCRSWDGLFKFSQ 80 90 100 110 120 130 250 260 270 280 290 300 pF1KB8 KSVKD-LKDAIEVLIAEKRRRISTEEKLEECMDFATELILAEKRGDLTRENVNQCILEML : . :.: :. . .. ::.: . : :.:.. :: ... . ::: CCDS33 IHVDNKLRD-IQYQM-DRGRRVSG--------GLLTYLFLSQA---LTLQEIYANVTEML 140 150 160 170 310 320 330 340 350 360 pF1KB8 IAAPDTMSVSLFFMLFLIAKHPNVEEAIIKEIQTVIGERDIKID-DIQKLKVMENFIYES .:. :: : .: . ..:.:.::.:.... .:: .::: . :. :. ... .. :. CCDS33 LAGVDTTSFTLSWTVYLLARHPEVQQTVYREIVKNLGERHVPTAADVPKVPLVRALLKET 180 190 200 210 220 230 370 380 390 400 410 420 pF1KB8 MRYQPVVDLVMRKALEDDVIDGYPVKKGTNIIL-NIGRMHRLEFFPKPNEFTLENFAKNV .: ::. : . :: :: :: . :::.. : . . .. : ::. .:: : . .. CCDS33 LRLFPVLPGNGRVTQEDLVIGGYLIPKGTQLALCHYATSYQDENFPRAKEFRPERWLRKG 240 250 260 270 280 290 430 440 450 460 470 pF1KB8 PYRYFQ-----PFGFGPRGCAGKYIAMVMMKAILVTLLRRFHVKTLQGQCVESIQKIHDS . ::: : :.: :. :: . .. ... ::..:..:: CCDS33 DLDRVDNFGSIPFGHGVRSCIGRRIAELEIHLVVIQLLQHFEIKTSSQTNAVHAKTHGLL 300 310 320 330 340 350 480 490 500 pF1KB8 SLHPDETKNMLEMIFTPRNSDRCLEH CCDS33 TPGGPIHVRFVNRK 360 370 >>CCDS9954.1 CYP46A1 gene_id:10858|Hs108|chr14 (500 aa) initn: 168 init1: 109 opt: 307 Z-score: 374.0 bits: 78.7 E(32554): 1.6e-14 Smith-Waterman score: 341; 21.5% identity (57.5% similar) in 447 aa overlap (41-466:30-466) 20 30 40 50 60 pF1KB8 YNITSIVPEAMPAATMPVLLLTGLFLLVWNYEGTSSIPGPGYCMGIGPLISH-----GRF :: . : :.. .: : . . :: CCDS99 MSPGLLLLGSAVLLAFGLCCTFVHRARSRYEHIPGPPRPSFLLGHLPCFWKKDEVGGRV 10 20 30 40 50 70 80 90 100 110 120 pF1KB8 LWMGIGSACNYYNRVYGEFMRVWISGEGTLIISKSSSMFHIMKHNHYSSRFGSKLGLQCI : .. . . :: .:: . . ..:... :. ... ..:.. .:: . CCDS99 LQ----DVFLDWAKKYGPVVRVNVFHKTSVIVTSPESVKKFLMSTKYNKDSKMYRALQTV 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB8 -G--MHEKGIIFNNNPELWKTTRPFFMKALSGPGLVRMVTVCAESLKTHLDRLEEVTNES : . .:.. . : : :. : . :.: .:: .. . :. . .. :: .. . CCDS99 FGERLFGQGLVSECNYERWHKQRRVIDLAFSRSSLVSLMETFNEKAEQLVEILEAKADGQ 120 130 140 150 160 170 190 200 210 220 230 pF1KB8 GYVDVLTLLRRVMLDTSNTLFLRISLD-ESAIVVKIQGYFDAWQALLIKPDIFFK--ISW :.. .: . .: .. . .. :..... : .. :... . .. CCDS99 TPVSMQDMLTYTAMD----ILAKAAFGMETSMLLGAQKPLSQAVKLMLEGITASRNTLAK 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB8 LYKKYEKSVKDLKDAIEVL--IAE---KRRRISTEEKLEECMDFATELILAEKRGDLTRE . .:........:. : ... .::: . .. : :. :... ::. : : CCDS99 FLPGKRKQLREVRESIRFLRQVGRDWVQRRREALKRGEEVPADILTQILKAEE-GAQDDE 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB8 NVNQCILEMLIAAPDTMSVSLFFMLFLIAKHPNVEEAIIKEIQTVIG-ERDIKIDDIQKL .. . .. ..::. .: . : : .. ....:.. . :.. ::: .: . ..:. .: CCDS99 GLLDNFVTFFIAGHETSANHLAFTVMELSRQPEIVARLQAEVDEVIGSKRYLDFEDLGRL 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB8 KVMENFIYESMRYQPVVDLVMRKALEDDVIDGYPVKKGTNIILNIGRMHRLE-FFPKPNE . . . . ::.: : . ..: :. .::: : .: .... : :.. .: : CCDS99 QYLSQVLKESLRLYPPAWGTFRLLEEETLIDGVRVPGNTPLLFSTYVMGRMDTYFEDPLT 360 370 380 390 400 410 420 430 440 450 460 pF1KB8 FTLENFAKNVP---YRYFQPFGFGPRGCAGKYIAMVMMKAILVTLLRRFHVKTLQGQCVE :. . :. ..: . :: ::..: :.: :. .:.. .:.... ::.:.. . . :: CCDS99 FNPDRFGPGAPKPRFTYF-PFSLGHRSCIGQQFAQMEVKVVMAKLLQRLEFRLVPGQRFG 420 430 440 450 460 470 480 490 500 pF1KB8 SIQKIHDSSLHPDETKNMLEMIFTPRNSDRCLEH CCDS99 LQEQATLKPLDPVLCTLRPRGWQPAPPPPPC 470 480 490 500 >>CCDS64723.1 CYP3A43 gene_id:64816|Hs108|chr7 (393 aa) initn: 177 init1: 96 opt: 303 Z-score: 370.7 bits: 77.8 E(32554): 2.5e-14 Smith-Waterman score: 303; 28.4% identity (60.4% similar) in 225 aa overlap (251-461:139-356) 230 240 250 260 270 280 pF1KB8 FDAWQALLIKPDIFFKISWLYKKYEKSVKDLKDAIEVLIAEKRRRISTEEKLEECMDFAT ::..:: . :. :.. ..: . .:: CCDS64 TEKCGALFPFLTPVFEALNIGLFPKDVTHFLKNSIERM---KESRLKDKQKHR--VDFFQ 110 120 130 140 150 160 290 300 310 320 330 pF1KB8 ELILAEKRGDLTR-------ENVNQCILEMLIAAPDTMSVSLFFMLFLIAKHPNVEEAII ..: ... . : : : :. ...:: :: :..: :... .: ::.:.. . CCDS64 QMIDSQNSKETKSHKALSDLELVAQSII-IIFAAYDTTSTTLPFIMYELATHPDVQQKLQ 170 180 190 200 210 220 340 350 360 370 380 390 pF1KB8 KEIQTVIGER-DIKIDDIQKLKVMENFIYESMRYQPVVDLVMRKALEDDVIDGYPVKKGT .::..:. .. . : . ... .. . :..: :::. : : .: :.: . :: CCDS64 EEIDAVLPNKAPVTYDALVQMEYLDMVVNETLRLFPVVSRVTRVCKKDIEINGVFIPKGL 230 240 250 260 270 280 400 410 420 430 440 pF1KB8 NIILNIGRMHRL-EFFPKPNEFTLENFAKNVP-----YRYFQPFGFGPRGCAGKYIAMVM ... : .:. ... .:..: : :.:. :::. ::: :::.: : .:.. CCDS64 AVMVPIYALHHDPKYWTEPEKFCPERFSKKNKDSIDLYRYI-PFGAGPRNCIGMRFALTN 290 300 310 320 330 340 450 460 470 480 490 500 pF1KB8 MKAILVTLLRRFHVKTLQGQCVESIQKIHDSSLHPDETKNMLEMIFTPRNSDRCLEH .: .. :. : : CCDS64 IKLAVIRALQNFSFKPCKETQIPLKLDNLPILQPEKPIVLKVHLRDGITSGP 350 360 370 380 390 >>CCDS5676.1 CYP3A43 gene_id:64816|Hs108|chr7 (503 aa) initn: 213 init1: 96 opt: 303 Z-score: 369.1 bits: 77.8 E(32554): 3.1e-14 Smith-Waterman score: 392; 22.9% identity (56.1% similar) in 476 aa overlap (21-461:4-466) 10 20 30 40 50 pF1KB8 MVLEMLNPIHYNITSIVPEAMPAATMPVLLLTGLFLLVWNYEGTSS--------IPGPGY .: .: . .:.. :.. :: : :::: CCDS56 MDLIPNFAMETWVLVATSLVLLYIYGTHSHKLFKKLGIPGPTP 10 20 30 40 60 70 80 90 100 110 pF1KB8 CMGIGPLISHGRFLWMGIGSACNYYNRVYGEFMRVWISGEGTLIISKSSSMFHIMKHNHY .: .. . : :: .. :: . :::. .. . . :.: . . .. .. : CCDS56 LPFLGTILFYLRGLW-NFDRECN---EKYGEMWGLYEGQQPMLVIMDPDMIKTVLVKECY 50 60 70 80 90 120 130 140 150 160 170 pF1KB8 SSRFGSKLGLQCIGMHEKGIIFNNNPELWKTTRPFFMKALSGPGLVRMVTVCAESLKTHL : : ... : .:. .... : .. : :: : .. :... . .:: . .. . CCDS56 SV-FTNQMPLGPMGFLKSALSFAEDEE-WKRIRTLLSPAFTSVKFKEMVPIISQCGDMLV 100 110 120 130 140 150 180 190 200 210 220 pF1KB8 DRLEEVTNESGYVDVLTLLRRVMLDTSNTLFLRISLD-----ESAIVVKIQGYF--DAWQ :.. ...: ... .. .:. . .. ..:: .. .. ... . : . CCDS56 RSLRQEAENSKSINLKDFFGAYTMDVITGTLFGVNLDSLNNPQDPFLKNMKKLLKLDFLD 160 170 180 190 200 210 230 240 250 260 270 pF1KB8 ALLIKPDIFFKISWLYKK-----YEKSVKD-LKDAIEVLIAEKRRRISTEEKLEECMDFA .:. ..: .. ... . :.: ::..:: . :. :.. ..: . .:: CCDS56 PFLLLISLFPFLTPVFEALNIGLFPKDVTHFLKNSIERM---KESRLKDKQKHR--VDFF 220 230 240 250 260 270 280 290 300 310 320 330 pF1KB8 TELILAEKRGDLTR-------ENVNQCILEMLIAAPDTMSVSLFFMLFLIAKHPNVEEAI ..: ... . : : : :. ...:: :: :..: :... .: ::.:.. . CCDS56 QQMIDSQNSKETKSHKALSDLELVAQSII-IIFAAYDTTSTTLPFIMYELATHPDVQQKL 280 290 300 310 320 330 340 350 360 370 380 390 pF1KB8 IKEIQTVIGER-DIKIDDIQKLKVMENFIYESMRYQPVVDLVMRKALEDDVIDGYPVKKG .::..:. .. . : . ... .. . :..: :::. : : .: :.: . :: CCDS56 QEEIDAVLPNKAPVTYDALVQMEYLDMVVNETLRLFPVVSRVTRVCKKDIEINGVFIPKG 340 350 360 370 380 390 400 410 420 430 440 pF1KB8 TNIILNIGRMHRL-EFFPKPNEFTLENFAKNVP-----YRYFQPFGFGPRGCAGKYIAMV ... : .:. ... .:..: : :.:. :::. ::: :::.: : .:.. CCDS56 LAVMVPIYALHHDPKYWTEPEKFCPERFSKKNKDSIDLYRYI-PFGAGPRNCIGMRFALT 400 410 420 430 440 450 450 460 470 480 490 500 pF1KB8 MMKAILVTLLRRFHVKTLQGQCVESIQKIHDSSLHPDETKNMLEMIFTPRNSDRCLEH .: .. :. : : CCDS56 NIKLAVIRALQNFSFKPCKETQIPLKLDNLPILQPEKPIVLKVHLRDGITSGP 460 470 480 490 500 >>CCDS5675.1 CYP3A43 gene_id:64816|Hs108|chr7 (504 aa) initn: 213 init1: 96 opt: 293 Z-score: 356.9 bits: 75.6 E(32554): 1.5e-13 Smith-Waterman score: 382; 22.9% identity (56.2% similar) in 477 aa overlap (21-461:4-467) 10 20 30 40 50 pF1KB8 MVLEMLNPIHYNITSIVPEAMPAATMPVLLLTGLFLLVWNYEGTSS--------IPGPGY .: .: . .:.. :.. :: : :::: CCDS56 MDLIPNFAMETWVLVATSLVLLYIYGTHSHKLFKKLGIPGPTP 10 20 30 40 60 70 80 90 100 110 pF1KB8 CMGIGPLISHGRFLWMGIGSACNYYNRVYGEFMRVWISGEGTLIISKSSSMFHIMKHNHY .: .. . : :: .. :: . :::. .. . . :.: . . .. .. : CCDS56 LPFLGTILFYLRGLW-NFDRECN---EKYGEMWGLYEGQQPMLVIMDPDMIKTVLVKECY 50 60 70 80 90 120 130 140 150 160 170 pF1KB8 SSRFGSKLGLQCIGMHEKGIIFNNNPELWKTTRPFFMKALSGPGLVRMVTVCAESLKTHL : : ... : .:. .... : .. : :: : .. :... . .:: . .. . CCDS56 SV-FTNQMPLGPMGFLKSALSFAEDEE-WKRIRTLLSPAFTSVKFKEMVPIISQCGDMLV 100 110 120 130 140 150 180 190 200 210 220 pF1KB8 DRLEEVTNESGYVDVLTLLRRVMLDTSNTLFLRISLD-----ESAIVVKIQGYF--DAWQ :.. ...: ... .. .:. . .. ..:: .. .. ... . : . CCDS56 RSLRQEAENSKSINLKDFFGAYTMDVITGTLFGVNLDSLNNPQDPFLKNMKKLLKLDFLD 160 170 180 190 200 210 230 240 250 260 270 pF1KB8 ALLIKPDIFFKISWLYKK-----YEKSVKD-LKDAIEVLIAEKRRRISTEEKLEECMDFA .:. ..: .. ... . :.: ::..:: . :. :.. ..: . .:: CCDS56 PFLLLISLFPFLTPVFEALNIGLFPKDVTHFLKNSIERM---KESRLKDKQKHR--VDFF 220 230 240 250 260 270 280 290 300 310 320 330 pF1KB8 TELILAEKRGDLTR-------ENVNQCILEMLIAAPDTMSVSLFFMLFLIAKHPNVEEAI ..: ... . : : : :. ...:: :: :..: :... .: ::.:.. . CCDS56 QQMIDSQNSKETKSHKALSDLELVAQSII-IIFAAYDTTSTTLPFIMYELATHPDVQQKL 280 290 300 310 320 330 340 350 360 370 380 390 pF1KB8 IKEIQTVIGER-DIKIDDIQKLKVMENFIYESMRYQPVVDLVMRKALEDDVIDGYPVKKG .::..:. .. . : . ... .. . :..: :::. : : .: :.: . :: CCDS56 QEEIDAVLPNKAPVTYDALVQMEYLDMVVNETLRLFPVVSRVTRVCKKDIEINGVFIPKG 340 350 360 370 380 390 400 410 420 430 440 pF1KB8 TNIILNIGRMHRL-EFFPKPNEFTLEN-FAKNVP-----YRYFQPFGFGPRGCAGKYIAM ... : .:. ... .:..: :. :.:. :::. ::: :::.: : .:. CCDS56 LAVMVPIYALHHDPKYWTEPEKFCPESRFSKKNKDSIDLYRYI-PFGAGPRNCIGMRFAL 400 410 420 430 440 450 450 460 470 480 490 500 pF1KB8 VMMKAILVTLLRRFHVKTLQGQCVESIQKIHDSSLHPDETKNMLEMIFTPRNSDRCLEH . .: .. :. : : CCDS56 TNIKLAVIRALQNFSFKPCKETQIPLKLDNLPILQPEKPIVLKVHLRDGITSGP 460 470 480 490 500 >>CCDS55123.1 CYP51A1 gene_id:1595|Hs108|chr7 (404 aa) initn: 122 init1: 91 opt: 289 Z-score: 353.5 bits: 74.6 E(32554): 2.3e-13 Smith-Waterman score: 289; 23.5% identity (57.3% similar) in 358 aa overlap (130-465:42-378) 100 110 120 130 140 150 pF1KB8 SSSMFHIMKHNHYSSRFGSKLGLQCIGMHEKGIIFNNNPELWKTTRPFFMKALSGPGLVR ::. .. .. . .. ..:. . . CCDS55 SDAAALLFNSKNEDLNAEDVYSRLTTPVFGKGVAYDVPNPVFLEQKKMLKSGLNIAHFKQ 20 30 40 50 60 70 160 170 180 190 200 210 pF1KB8 MVTVCAESLKTHLDRLEEVTNESGYVDVLTLLRR-VMLDTSNTLF---LRISLDESA--I :.. . : .. : .::: .:. : . ..: .:. : .: .:.:.. . CCDS55 HVSIIEKETKEYF----ESWGESGEKNVFEALSELIILTASHCLHGKEIRSQLNEKVAQL 80 90 100 110 120 220 230 240 250 260 pF1KB8 VVKIQGYFD--AWQALLIKPDIFFKISWL----YKKYEKSVKDLKDAIEVLIAEKRRRIS . ..: :. :: :: : .:: ... ... ...:: . : .:::. CCDS55 YADLDGGFSHAAW--LL--P------GWLPLPSFRRRDRAHREIKDIFYKAI-QKRRQ-- 130 140 150 160 170 270 280 290 300 310 320 pF1KB8 TEEKLEECMDFATELILAEKRGDLTRENVNQCILEMLIAAPDTMSVSLFFMLFLIAKHPN ..::... .. . . : :: ..: .. .:.:. : :.. .: :..:. . CCDS55 SQEKIDDILQTLLDATYKDGR-PLTDDEVAGMLIGLLLAGQHTSSTTSAWMGFFLARDKT 180 190 200 210 220 230 330 340 350 360 370 380 pF1KB8 VEEAIIKEIQTVIGER--DIKIDDIQKLKVMENFIYESMRYQPVVDLVMRKALEDDVIDG ... : .:: :: . :... :.... : :..: .: . ..:: : ... : CCDS55 LQKKCYLEQKTVCGENLPPLTYDQLKDLNLLDRCIKETLRLRPPIMIMMRMARTPQTVAG 240 250 260 270 280 290 390 400 410 420 430 pF1KB8 YPVKKGTNII--------LNIGRMHRLEFFPKPNEFTLENFAKNVPYRYFQPFGFGPRGC : . : .. :. . ..::.: .:... .: :.. . : ::: : . : CCDS55 YTIPPGHQVCVSPTVNQRLKDSWVERLDF--NPDRYLQDNPASGEKFAYV-PFGAGRHRC 300 310 320 330 340 350 440 450 460 470 480 490 pF1KB8 AGKYIAMVMMKAILVTLLRRFHVKTLQGQCVESIQKIHDSSLHPDETKNMLEMIFTPRNS :. .:.:..:.: :.:: .. ..: CCDS55 IGENFAYVQIKTIWSTMLRLYEFDLIDGYFPTVNYTTMIHTPENPVIRYKRRSK 360 370 380 390 400 >>CCDS5673.1 CYP3A7 gene_id:1551|Hs108|chr7 (503 aa) initn: 192 init1: 113 opt: 286 Z-score: 348.3 bits: 74.0 E(32554): 4.4e-13 Smith-Waterman score: 326; 24.4% identity (53.6% similar) in 483 aa overlap (21-461:4-466) 10 20 30 40 50 pF1KB8 MVLEMLNPIHYNITSIVPEAMPAATMPVLLLTGLFLLVWNYEGTSS--------IPGPGY .: .. . :: .. :.. :: . :::: CCDS56 MDLIPNLAVETWLLLAVSLILLYLYGTRTHGLFKKLGIPGPTP 10 20 30 40 60 70 80 90 100 110 pF1KB8 CMGIGPLISHGRFLWMGIGSAC-NYYNRVYGEFMRVWISGEGTLIISKSSSMFHIMKHNH .: .: . : . : . : .:.: .. . : :. . . .. .. CCDS56 LPFLGNALSFRKGYWT-FDMECYKKYRKVWG----IYDCQQPMLAITDPDMIKTVLVKEC 50 60 70 80 90 120 130 140 150 160 pF1KB8 YSSRFGSKLGLQCIGMHEKGIIFNNNPELWKTTRPFFMKALSGPGLVRMVTVCAE----- :: : .. . .:. ...: . .. : :: : .. .... : .:: . :. CCDS56 YSV-FTNRRPFGPVGFMKNAISIAEDEE-WKRIRSLLSPTFTSGKLKEMVPIIAQYGDVL 100 110 120 130 140 150 170 180 190 200 pF1KB8 --SLKTHLDRLEEVTNESGY----VDVLTLLRR-VMLDTSNT----------LFLRIS-L .:. . . . :: . . .::.: : .:. :. .::.. : CCDS56 VRNLRREAETGKPVTLKHVFGAYSMDVITSTSFGVSIDSLNNPQDPFVENTKKLLRFNPL 160 170 180 190 200 210 210 220 230 240 250 260 pF1KB8 DESAIVVKIQGYFDA-WQALLIKPDIFFK--ISWLYKKYEKSVKDLKDAIEVLIAEKRRR : .. .:. .. .:: : .: . ::.: ::::..:.. : ...: CCDS56 DPFVLSIKVFPFLTPILEALNI--TVFPRKVISFL----TKSVKQIKEG--RLKETQKHR 220 230 240 250 260 270 280 290 300 310 320 pF1KB8 ISTEEKLEECMDFATELILAEKRGDLTRENVNQCILEMLIAAPDTMSVSLFFMLFLIAKH .. . . . .. . . . .:: : . : :. ...:. .: : : :... .: : CCDS56 VDFLQLMIDSQN-SKDSETHKALSDL--ELMAQSII-FIFAGYETTSSVLSFIIYELATH 270 280 290 300 310 320 330 340 350 360 370 380 pF1KB8 PNVEEAIIKEIQTVIGER-DIKIDDIQKLKVMENFIYESMRYQPVVDLVMRKALEDDVID :.:.. . :::.::. .. : . .:. .. . :..: ::. . : .: :. CCDS56 PDVQQKVQKEIDTVLPNKAPPTYDTVLQLEYLDMVVNETLRLFPVAMRLERVCKKDVEIN 330 340 350 360 370 380 390 400 410 420 430 pF1KB8 GYPVKKGTNIILNIGRMHRL-EFFPKPNEFTLENFAK----NV-PYRYFQPFGFGPRGCA :. . ::. ... .:. ... .:..: : :.: :. :: : ::: :::.: CCDS56 GMFIPKGVVVMIPSYVLHHDPKYWTEPEKFLPERFSKKNKDNIDPYIY-TPFGSGPRNCI 390 400 410 420 430 440 440 450 460 470 480 490 pF1KB8 GKYIAMVMMKAILVTLLRRFHVKTLQGQCVESIQKIHDSSLHPDETKNMLEMIFTPRNSD : .:.: :: :: .:. : : CCDS56 GMRFALVNMKLALVRVLQNFSFKPCKETQIPLKLRFGGLLLTEKPIVLKAESRDETVSGA 450 460 470 480 490 500 503 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 12:15:17 2016 done: Fri Nov 4 12:15:17 2016 Total Scan time: 2.970 Total Display time: 0.080 Function used was FASTA [36.3.4 Apr, 2011]