FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB4535, 446 aa 1>>>pF1KB4535 446 - 446 aa - 446 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.5064+/-0.000695; mu= 16.4065+/- 0.042 mean_var=65.2111+/-12.775, 0's: 0 Z-trim(109.8): 76 B-trim: 0 in 0/51 Lambda= 0.158823 statistics sampled from 11085 (11161) to 11085 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.707), E-opt: 0.2 (0.343), width: 16 Scan time: 3.330 The best scores are: opt bits E(32554) CCDS33657.1 CYP2D6 gene_id:1565|Hs108|chr22 ( 446) 2999 695.7 2.4e-200 CCDS46721.1 CYP2D6 gene_id:1565|Hs108|chr22 ( 497) 2201 512.9 3e-145 CCDS613.1 CYP2J2 gene_id:1573|Hs108|chr1 ( 502) 954 227.1 3.1e-59 CCDS34047.1 CYP2U1 gene_id:113612|Hs108|chr4 ( 544) 906 216.2 6.7e-56 CCDS55721.1 CYP2C8 gene_id:1558|Hs108|chr10 ( 388) 875 209.0 6.9e-54 CCDS7818.1 CYP2R1 gene_id:120227|Hs108|chr11 ( 501) 876 209.3 7.4e-54 CCDS73166.1 CYP2C8 gene_id:1558|Hs108|chr10 ( 420) 875 209.0 7.4e-54 CCDS7438.1 CYP2C8 gene_id:1558|Hs108|chr10 ( 490) 875 209.0 8.5e-54 CCDS12572.1 CYP2F1 gene_id:1572|Hs108|chr19 ( 491) 875 209.0 8.5e-54 CCDS12571.1 CYP2A13 gene_id:1553|Hs108|chr19 ( 494) 873 208.6 1.2e-53 CCDS7436.1 CYP2C19 gene_id:1557|Hs108|chr10 ( 490) 868 207.4 2.6e-53 CCDS7686.1 CYP2E1 gene_id:1571|Hs108|chr10 ( 493) 857 204.9 1.5e-52 CCDS7437.1 CYP2C9 gene_id:1559|Hs108|chr10 ( 490) 840 201.0 2.2e-51 CCDS7435.1 CYP2C18 gene_id:1562|Hs108|chr10 ( 490) 832 199.2 7.8e-51 CCDS5319.2 CYP2W1 gene_id:54905|Hs108|chr7 ( 490) 832 199.2 7.8e-51 CCDS12570.1 CYP2B6 gene_id:1555|Hs108|chr19 ( 491) 823 197.1 3.3e-50 CCDS12569.1 CYP2A7 gene_id:1549|Hs108|chr19 ( 494) 821 196.7 4.5e-50 CCDS12568.1 CYP2A6 gene_id:1548|Hs108|chr19 ( 494) 819 196.2 6.2e-50 CCDS12573.1 CYP2S1 gene_id:29785|Hs108|chr19 ( 504) 759 182.5 8.7e-46 CCDS44460.1 CYP2C18 gene_id:1562|Hs108|chr10 ( 431) 671 162.3 8.9e-40 CCDS10268.1 CYP1A1 gene_id:1543|Hs108|chr15 ( 512) 648 157.0 4e-38 CCDS1793.1 CYP1B1 gene_id:1545|Hs108|chr2 ( 543) 627 152.2 1.2e-36 CCDS32293.1 CYP1A2 gene_id:1544|Hs108|chr15 ( 516) 620 150.6 3.4e-36 CCDS47406.1 CYP21A2 gene_id:1589|Hs108|chr6 ( 465) 538 131.8 1.4e-30 CCDS4735.1 CYP21A2 gene_id:1589|Hs108|chr6 ( 495) 537 131.6 1.8e-30 CCDS7541.1 CYP17A1 gene_id:1586|Hs108|chr10 ( 508) 500 123.1 6.4e-28 CCDS81906.1 CYP1A1 gene_id:1543|Hs108|chr15 ( 483) 385 96.8 5.2e-20 CCDS34119.1 CYP4V2 gene_id:285440|Hs108|chr4 ( 525) 364 92.0 1.6e-18 CCDS5673.1 CYP3A7 gene_id:1551|Hs108|chr7 ( 503) 347 88.1 2.3e-17 CCDS75639.1 CYP3A51P gene_id:100861540|Hs108|chr7 ( 535) 347 88.1 2.4e-17 CCDS5674.1 CYP3A4 gene_id:1576|Hs108|chr7 ( 503) 345 87.6 3.1e-17 CCDS544.1 CYP4X1 gene_id:260293|Hs108|chr1 ( 509) 343 87.1 4.3e-17 CCDS5672.1 CYP3A5 gene_id:1577|Hs108|chr7 ( 502) 342 86.9 5e-17 CCDS33285.1 CYP27C1 gene_id:339761|Hs108|chr2 ( 372) 335 85.2 1.2e-16 CCDS64723.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 393) 334 85.0 1.4e-16 CCDS5676.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 503) 328 83.7 4.6e-16 CCDS42517.1 CYP4F12 gene_id:66002|Hs108|chr19 ( 524) 328 83.7 4.8e-16 CCDS8954.1 CYP27B1 gene_id:1594|Hs108|chr12 ( 508) 327 83.5 5.5e-16 CCDS2423.1 CYP27A1 gene_id:1593|Hs108|chr2 ( 531) 326 83.3 6.7e-16 CCDS5675.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 504) 316 81.0 3.1e-15 CCDS12336.1 CYP4F2 gene_id:8529|Hs108|chr19 ( 520) 313 80.3 5.2e-15 CCDS545.1 CYP4Z1 gene_id:199974|Hs108|chr1 ( 505) 307 78.9 1.3e-14 CCDS12337.1 CYP4F11 gene_id:57834|Hs108|chr19 ( 524) 305 78.4 1.9e-14 CCDS81318.1 CYP4B1 gene_id:1580|Hs108|chr1 ( 497) 299 77.1 4.6e-14 CCDS9954.1 CYP46A1 gene_id:10858|Hs108|chr14 ( 500) 299 77.1 4.6e-14 CCDS542.1 CYP4B1 gene_id:1580|Hs108|chr1 ( 511) 299 77.1 4.7e-14 CCDS41328.1 CYP4B1 gene_id:1580|Hs108|chr1 ( 512) 299 77.1 4.7e-14 CCDS33491.1 CYP24A1 gene_id:1591|Hs108|chr20 ( 514) 299 77.1 4.7e-14 CCDS59362.1 CYP4F3 gene_id:4051|Hs108|chr19 ( 520) 297 76.6 6.6e-14 CCDS12332.1 CYP4F3 gene_id:4051|Hs108|chr19 ( 520) 297 76.6 6.6e-14 >>CCDS33657.1 CYP2D6 gene_id:1565|Hs108|chr22 (446 aa) initn: 2999 init1: 2999 opt: 2999 Z-score: 3710.2 bits: 695.7 E(32554): 2.4e-200 Smith-Waterman score: 2999; 99.3% identity (99.8% similar) in 446 aa overlap (1-446:1-446) 10 20 30 40 50 60 pF1KB4 MGLEALVPLAMIVAIFLLLVDLMHRRQRWAARYPPGPLPLPGLGNLLHVDFQNTPYCFDQ ::::::::::.::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MGLEALVPLAVIVAIFLLLVDLMHRRQRWAARYPPGPLPLPGLGNLLHVDFQNTPYCFDQ 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB4 LRRRFGDVFSLQLAWTPVVVLNGLAAVREALVTHGEDTADRPPVPITQILGFGPRSQGRP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 LRRRFGDVFSLQLAWTPVVVLNGLAAVREALVTHGEDTADRPPVPITQILGFGPRSQGRP 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB4 FRPNGLLDKAVSNVIASLTCGRRFEYDDPRFLRLLDLAQEGLKEESGFLREVLNAVPVLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 FRPNGLLDKAVSNVIASLTCGRRFEYDDPRFLRLLDLAQEGLKEESGFLREVLNAVPVLL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB4 HIPALAGKVLRFQKAFLTQLDELLTEHRMTWDPAQPPRDLTEAFLAEMEKAKGNPESSFN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 HIPALAGKVLRFQKAFLTQLDELLTEHRMTWDPAQPPRDLTEAFLAEMEKAKGNPESSFN 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB4 DENLCIVVADLFSAGMVTTSTTLAWGLLLMILHPDVQRRVQQEIDDVIGQVRRPEMGDQA :::: ::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 DENLRIVVADLFSAGMVTTSTTLAWGLLLMILHPDVQRRVQQEIDDVIGQVRRPEMGDQA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB4 HMPYTTAVIHEVQRFGDIVPLGVTHMTSRDIEVQGFRIPKGTTLITNLSSVLKDEAVWEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 HMPYTTAVIHEVQRFGDIVPLGVTHMTSRDIEVQGFRIPKGTTLITNLSSVLKDEAVWEK 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB4 PFRFHPEHFLDAQGHFVKPEAFLPFSAGRRACLGEPLARMELFLFFTSLLQHFSFSVPTG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 PFRFHPEHFLDAQGHFVKPEAFLPFSAGRRACLGEPLARMELFLFFTSLLQHFSFSVPTG 370 380 390 400 410 420 430 440 pF1KB4 QPRPSHHGVFAFLVTPSPYELCAVPR ::::::::::::::.::::::::::: CCDS33 QPRPSHHGVFAFLVSPSPYELCAVPR 430 440 >>CCDS46721.1 CYP2D6 gene_id:1565|Hs108|chr22 (497 aa) initn: 2201 init1: 2201 opt: 2201 Z-score: 2721.3 bits: 512.9 E(32554): 3e-145 Smith-Waterman score: 2782; 88.9% identity (89.1% similar) in 478 aa overlap (20-446:20-497) 10 20 30 40 50 60 pF1KB4 MGLEALVPLAMIVAIFLLLVDLMHRRQRWAARYPPGPLPLPGLGNLLHVDFQNTPYCFDQ ::::::::::::::::::::::::::::::::::::::::: CCDS46 MGLEALVPLAVIVAIFLLLVDLMHRRQRWAARYPPGPLPLPGLGNLLHVDFQNTPYCFDQ 10 20 30 40 50 60 70 80 90 100 110 pF1KB4 LRRRFGDVFSLQLAWTPVVVLNGLAAVREALVTHGEDTADRPPVPITQILGFGPRSQG-- :::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 LRRRFGDVFSLQLAWTPVVVLNGLAAVREALVTHGEDTADRPPVPITQILGFGPRSQGVF 70 80 90 100 110 120 120 pF1KB4 -------------------------------------------------RPFRPNGLLDK ::::::::::: CCDS46 LARYGPAWREQRRFSVSTLRNLGLGKKSLEQWVTEEAACLCAAFANHSGRPFRPNGLLDK 130 140 150 160 170 180 130 140 150 160 170 180 pF1KB4 AVSNVIASLTCGRRFEYDDPRFLRLLDLAQEGLKEESGFLREVLNAVPVLLHIPALAGKV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 AVSNVIASLTCGRRFEYDDPRFLRLLDLAQEGLKEESGFLREVLNAVPVLLHIPALAGKV 190 200 210 220 230 240 190 200 210 220 230 240 pF1KB4 LRFQKAFLTQLDELLTEHRMTWDPAQPPRDLTEAFLAEMEKAKGNPESSFNDENLCIVVA ::::::::::::::::::::::::::::::::::::::::::::::::::::::: :::: CCDS46 LRFQKAFLTQLDELLTEHRMTWDPAQPPRDLTEAFLAEMEKAKGNPESSFNDENLRIVVA 250 260 270 280 290 300 250 260 270 280 290 300 pF1KB4 DLFSAGMVTTSTTLAWGLLLMILHPDVQRRVQQEIDDVIGQVRRPEMGDQAHMPYTTAVI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 DLFSAGMVTTSTTLAWGLLLMILHPDVQRRVQQEIDDVIGQVRRPEMGDQAHMPYTTAVI 310 320 330 340 350 360 310 320 330 340 350 360 pF1KB4 HEVQRFGDIVPLGVTHMTSRDIEVQGFRIPKGTTLITNLSSVLKDEAVWEKPFRFHPEHF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 HEVQRFGDIVPLGVTHMTSRDIEVQGFRIPKGTTLITNLSSVLKDEAVWEKPFRFHPEHF 370 380 390 400 410 420 370 380 390 400 410 420 pF1KB4 LDAQGHFVKPEAFLPFSAGRRACLGEPLARMELFLFFTSLLQHFSFSVPTGQPRPSHHGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 LDAQGHFVKPEAFLPFSAGRRACLGEPLARMELFLFFTSLLQHFSFSVPTGQPRPSHHGV 430 440 450 460 470 480 430 440 pF1KB4 FAFLVTPSPYELCAVPR :::::.::::::::::: CCDS46 FAFLVSPSPYELCAVPR 490 >>CCDS613.1 CYP2J2 gene_id:1573|Hs108|chr1 (502 aa) initn: 1023 init1: 628 opt: 954 Z-score: 1177.0 bits: 227.1 E(32554): 3.1e-59 Smith-Waterman score: 1075; 38.4% identity (64.9% similar) in 479 aa overlap (16-446:28-501) 10 20 30 40 pF1KB4 MGLEALVPLAMIVAIFLLLVDLMHRRQRWAARYPPGPLPLPGLGNLLH ::: .:...::. ::::: :: :::.. CCDS61 MLAAMGSLAAALWAVVHPRTLLLGTVAFLLAADFLKRRR--PKNYPPGPWRLPFLGNFFL 10 20 30 40 50 50 60 70 80 90 100 pF1KB4 VDFQNTPYCFDQLRRRFGDVFSLQLAWTPVVVLNGLAAVREALVTHGEDTADRPPVPITQ :::... . . ...:..:::.:. .:...:: ..:::. .. ..:: .:. . CCDS61 VDFEQSHLEVQLFVKKYGNLFSLELGDISAVLITGLPLIKEALIHMDQNFGNRPVTPMRE 60 70 80 90 100 110 110 120 pF1KB4 IL----------------------------GFGPRS-------------------QGRPF . :.: .: .:.:: CCDS61 HIFKKNGLIMSSGQAWKEQRRFTLTALRNFGLGKKSLEERIQEEAQHLTEAIKEENGQPF 120 130 140 150 160 170 130 140 150 160 170 180 pF1KB4 RPNGLLDKAVSNVIASLTCGRRFEYDDPRFLRLLDLAQEGLKEESGFLREVLNAVP-VLL :. ...::::.: :.: :.::::.: : .:: : .: :.. .. :. : .. CCDS61 DPHFKINNAVSNIICSITFGERFEYQDSWFQQLLKLLDEVTYLEASKTCQLYNVFPWIMK 180 190 200 210 220 230 190 200 210 220 230 240 pF1KB4 HIPALAGKVLRFQKAFLTQLDELLTEHRMTWDPAQPPRDLTEAFLAEMEKAKGNPESSFN .:. .. : . ..... .:: :.::. ::. .:.: :: : ::: :::. CCDS61 FLPGPHQTLFSNWKKLKLFVSHMIDKHRKDWNPAET-RDFIDAYLKEMSKHTGNPTSSFH 240 250 260 270 280 290 250 260 270 280 290 300 pF1KB4 DENLCIVVADLFSAGMVTTSTTLAWGLLLMILHPDVQRRVQQEIDDVIGQVRRPEMGDQA .::: . ::: :: :::::: :.:: : :.:..:..:: ::: :::: ..: . . CCDS61 EENLICSTLDLFFAGTETTSTTLRWALLYMALYPEIQEKVQAEIDRVIGQGQQPSTAARE 300 310 320 330 340 350 310 320 330 340 350 360 pF1KB4 HMPYTTAVIHEVQRFGDIVPLGVTHMTSRDIEVQGFRIPKGTTLITNLSSVLKDEAVWEK ::::.::::::::.:.:.::.: . .. : . :...:::: ..:::... .: . : CCDS61 SMPYTNAVIHEVQRMGNIIPLNVPREVTVDTTLAGYHLPKGTMILTNLTALHRDPTEWAT 360 370 380 390 400 410 370 380 390 400 410 420 pF1KB4 PFRFHPEHFLDAQGHFVKPEAFLPFSAGRRACLGEPLARMELFLFFTSLLQHFSFSVPTG : :.:.:::. .:.: : :::.::: :.:::::: ::: :::.:::::.:.:.: :.. CCDS61 PDTFNPDHFLE-NGQFKKREAFMPFSIGKRACLGEQLARTELFIFFTSLMQKFTFRPPNN 420 430 440 450 460 470 430 440 pF1KB4 QPRPSHHGVFAFLVTPSPYELCAVPR . . : . ... ..: ..:::::. CCDS61 E-KLSLKFRMGITISPVSHRLCAVPQV 480 490 500 >>CCDS34047.1 CYP2U1 gene_id:113612|Hs108|chr4 (544 aa) initn: 1030 init1: 693 opt: 906 Z-score: 1117.0 bits: 216.2 E(32554): 6.7e-56 Smith-Waterman score: 940; 38.2% identity (65.3% similar) in 432 aa overlap (60-441:109-539) 30 40 50 60 70 80 pF1KB4 AARYPPGPLPLPGLGNLLHVDFQNTPYCFDQLRRRFGDVFSLQLAWTPVVVLNGLAAVRE .: : .:..::. .. ::::. . .::: CCDS34 PFLRRRSWLSSRTRAAGIDPSVIGPQVLLAHLARVYGSIFSFFIGHYLVVVLSDFHSVRE 80 90 100 110 120 130 90 100 110 pF1KB4 ALVTHGEDTADRPPVPITQILG---------FGP--RSQ-------------GR------ ::: ..: .::: ::. .:. .:: :.: :. CCDS34 ALVQQAEVFSDRPRVPLISIVTKEKGVVFAHYGPVWRQQRKFSHSTLRHFGLGKLSLEPK 140 150 160 170 180 190 120 130 140 150 160 pF1KB4 ------------------PFRPNGLLDKAVSNVIASLTCGRRFEYDDPRFLRLLDLAQEG :: : .....::::.: :: :.::.: . .: ..: . ..: CCDS34 IIEEFKYVKAEMQKHGEDPFCPFSIISNAVSNIICSLCFGQRFDYTNSEFKKMLGFMSRG 200 210 220 230 240 250 170 180 190 200 210 220 pF1KB4 LKEESGFLREVLNAVPVLLHIPALAGKVLR-FQKAFLTQLDELLTEHRMTWDPAQPPRDL :. . ..: : : ..: : :: ..: . . : ... .:. . : . :.:. CCDS34 LEICLNSQVLLVNICPWLYYLPFGPFKELRQIEKDITSFLKKIIKDHQESLD-RENPQDF 260 270 280 290 300 310 230 240 250 260 270 pF1KB4 TEAFLAEMEKA-KGNPESSFNDENLCIVVADLFSAGMVTTSTTLAWGLLLMILHPDVQRR . .: .::. :.: .:::..: : ...::: :: ::...: : :: : :.::::.. CCDS34 IDMYLLHMEEERKNNSNSSFDEEYLFYIIGDLFIAGTDTTTNSLLWCLLYMSLNPDVQEK 320 330 340 350 360 370 280 290 300 310 320 330 pF1KB4 VQQEIDDVIGQVRRPEMGDQAHMPYTTAVIHEVQRFGDIVPLGVTHMTSRDIEVQGFRIP :..::. ::: : : . :.:.:::: :.: ::::. .:::.. ::::.. .::. :: CCDS34 VHEEIERVIGANRAPSLTDKAQMPYTEATIMEVQRLTVVVPLAIPHMTSENTVLQGYTIP 380 390 400 410 420 430 340 350 360 370 380 390 pF1KB4 KGTTLITNLSSVLKDEAVWEKPFRFHPEHFLDAQGHFVKPEAFLPFSAGRRACLGEPLAR ::: .. :: :: .: :.:::: :.:..::: ::...: :.:.::. :.:.:.:: ::. CCDS34 KGTLILPNLWSVHRDPAIWEKPEDFYPNRFLDDQGQLIKKETFIPFGIGKRVCMGEQLAK 440 450 460 470 480 490 400 410 420 430 440 pF1KB4 MELFLFFTSLLQHFSFSVPTGQPRPSHHGVFAFLVTPSPYELCAVPR :::::.:.::.: :.:..: . .: : :.. ..: :... CCDS34 MELFLMFVSLMQSFAFALPEDSKKPLLTGRFGLTLAPHPFNITISRR 500 510 520 530 540 >>CCDS55721.1 CYP2C8 gene_id:1558|Hs108|chr10 (388 aa) initn: 777 init1: 777 opt: 875 Z-score: 1080.9 bits: 209.0 E(32554): 6.9e-54 Smith-Waterman score: 875; 42.9% identity (68.2% similar) in 333 aa overlap (115-445:56-387) 90 100 110 120 130 140 pF1KB4 AAVREALVTHGEDTADRPPVPITQILGFGPRSQGRPFRPNGLLDKAVSNVIASLTCGRRF .... : :. .: : ::: :.. .:: CCDS55 LTTLRNFGMGKRSIEDRVQEEAHCLVEELRKTKASPCDPTFILGCAPCNVICSVVFQKRF 30 40 50 60 70 80 150 160 170 180 190 200 pF1KB4 EYDDPRFLRLLDLAQEGLKEESGFLREVLNAVPVLLH-IPALAGKVLRFQKAFLTQLDEL .: : :: :. .:... .. .: : :.:. .:. .:::. . . : CCDS55 DYKDQNFLTLMKRFNENFRILNSPWIQVCNNFPLLIDCFPGTHNKVLKNVALTRSYIREK 90 100 110 120 130 140 210 220 230 240 250 260 pF1KB4 LTEHRMTWDPAQPPRDLTEAFLAEMEKAKGNPESSFNDENLCIVVADLFSAGMVTTSTTL . ::. . : .. :::. . :: .::. : : .: :: ::: .::::: :: :::::: CCDS55 VKEHQASLD-VNNPRDFIDCFLIKMEQEKDNQKSEFNIENLVGTVADLFVAGTETTSTTL 150 160 170 180 190 200 270 280 290 300 310 320 pF1KB4 AWGLLLMILHPDVQRRVQQEIDDVIGQVRRPEMGDQAHMPYTTAVIHEVQRFGDIVPLGV .::::.. ::.: .::.::: :::. : : : :..::::: ::.::.::..:.:: :: CCDS55 RYGLLLLLKHPEVTAKVQEEIDHVIGRHRSPCMQDRSHMPYTDAVVHEIQRYSDLVPTGV 210 220 230 240 250 260 330 340 350 360 370 380 pF1KB4 THMTSRDIEVQGFRIPKGTTLITNLSSVLKDEAVWEKPFRFHPEHFLDAQGHFVKPEAFL : .. : . ... ::::::... :.:::.:. . .: : : :::: .:.: : . :. CCDS55 PHAVTTDTKFRNYLIPKGTTIMALLTSVLHDDKEFPNPNIFDPGHFLDKNGNFKKSDYFM 270 280 290 300 310 320 390 400 410 420 430 440 pF1KB4 PFSAGRRACLGEPLARMELFLFFTSLLQHFSFSVPTGQPRPSHHGVFAFLVT-PSPYELC :::::.: : :: :::::::::.:..::.:... . .: .:. : :..: CCDS55 PFSAGKRICAGEGLARMELFLFLTTILQNFNLKSVDDLKNLNTTAVTKGIVSLPPSYQIC 330 340 350 360 370 380 pF1KB4 AVPR .: CCDS55 FIPV >>CCDS7818.1 CYP2R1 gene_id:120227|Hs108|chr11 (501 aa) initn: 1098 init1: 843 opt: 876 Z-score: 1080.4 bits: 209.3 E(32554): 7.4e-54 Smith-Waterman score: 967; 37.7% identity (63.2% similar) in 475 aa overlap (26-446:32-501) 10 20 30 40 50 pF1KB4 MGLEALVPLAMIVAIFLLLVDLMHRRQRWAARYPPGPLPLPGLGNLLHVDFQNT- .:: .:::: :: .::. . .. CCDS78 WKLWRAEEGAAALGGALFLLLFALGVRQLLKQRRPMGFPPGPPGLPFIGNIYSLAASSEL 10 20 30 40 50 60 60 70 80 90 100 pF1KB4 PYCFDQLRRR---FGDVFSLQLAWTPVVVLNGLAAVREALVTHGEDTADRPPVPI----T :. . .:.. .:..:::.:. .::::: .:.: :: ..: :::: .:. : CCDS78 PHVY--MRKQSQVYGEIFSLDLGGISTVVLNGYDVVKECLVHQSEIFADRPCLPLFMKMT 70 80 90 100 110 110 120 pF1KB4 QI-------------------------LGFGPRS-------------------QGRPFRP .. .:.: .: .:::: CCDS78 KMGGLLNSRYGRGWVDHRRLAVNSFRYFGYGQKSFESKILEETKFFNDAIETYKGRPFDF 120 130 140 150 160 170 130 140 150 160 170 180 pF1KB4 NGLLDKAVSNVIASLTCGRRFEYDDPRFLRLLDLAQEGLKEESGFLREVLNAVPVLLHIP . :. .::::. . :.:: :.: : ....: .:... .. . :: : . .: CCDS78 KQLITNAVSNITNLIIFGERFTYEDTDFQHMIELFSENVELAASASVFLYNAFPWIGILP 180 190 200 210 220 230 190 200 210 220 230 240 pF1KB4 ALAGKVLRFQKAFLTQ--LDELLTEHRMTWDPAQPPRDLTEAFLAEMEKAKGNPESSFND . : :..: .. :..:. . .. : : :. ...:.: ::...:..: :.:. CCDS78 FGKHQQL-FRNAAVVYDFLSRLIEKASVNRKP-QLPQHFVDAYLDEMDQGKNDPSSTFSK 240 250 260 270 280 290 250 260 270 280 290 300 pF1KB4 ENLCIVVADLFSAGMVTTSTTLAWGLLLMILHPDVQRRVQQEIDDVIGQVRRPEMGDQAH ::: . :..:. :: ::...: :..:.: :.:..: .::.::: ..: .: :. . CCDS78 ENLIFSVGELIIAGTETTTNVLRWAILFMALYPNIQGQVQKEIDLIMGPNGKPSWDDKCK 300 310 320 330 340 350 310 320 330 340 350 360 pF1KB4 MPYTTAVIHEVQRFGDIVPLGVTHMTSRDIEVQGFRIPKGTTLITNLSSVLKDEAVWEKP :::: ::.::: :: .:::::. : ::.: :.:. ::::::.:::: :: :: :. : CCDS78 MPYTEAVLHEVLRFCNIVPLGIFHATSEDAVVRGYSIPKGTTVITNLYSVHFDEKYWRDP 360 370 380 390 400 410 370 380 390 400 410 420 pF1KB4 FRFHPEHFLDAQGHFVKPEAFLPFSAGRRACLGEPLARMELFLFFTSLLQHFSFSVPTGQ ::::.:::..:.:.: ::..::: ::: :::: :::::.:::::.:::.: . : . CCDS78 EVFHPERFLDSSGYFAKKEALVPFSLGRRHCLGEHLARMEMFLFFTALLQRFHLHFPH-E 420 430 440 450 460 470 430 440 pF1KB4 PRPSHHGVFAFLVTPSPYELCAVPR :. . ... . :.:: .:: : CCDS78 LVPDLKPRLGMTLQPQPYLICAERR 480 490 500 >>CCDS73166.1 CYP2C8 gene_id:1558|Hs108|chr10 (420 aa) initn: 853 init1: 777 opt: 875 Z-score: 1080.4 bits: 209.0 E(32554): 7.4e-54 Smith-Waterman score: 885; 38.8% identity (61.0% similar) in 418 aa overlap (77-445:3-419) 50 60 70 80 90 100 pF1KB4 LHVDFQNTPYCFDQLRRRFGDVFSLQLAWTPVVVLNGLAAVREALVTHGEDTADRPPVPI :.::..: ::.:::. .::. . : :: CCDS73 MNPIVVFHGYEAVKEALIDNGEEFSGRGNSPI 10 20 30 110 pF1KB4 TQIL----------------------------GFGPRS-------------------QGR .: . :.: :: .. CCDS73 SQRITKGLGIISSNGKRWKEIRRFSLTTLRNFGMGKRSIEDRVQEEAHCLVEELRKTKAS 40 50 60 70 80 90 120 130 140 150 160 170 pF1KB4 PFRPNGLLDKAVSNVIASLTCGRRFEYDDPRFLRLLDLAQEGLKEESGFLREVLNAVPVL : :. .: : ::: :.. .::.: : :: :. .:... .. .: : :.: CCDS73 PCDPTFILGCAPCNVICSVVFQKRFDYKDQNFLTLMKRFNENFRILNSPWIQVCNNFPLL 100 110 120 130 140 150 180 190 200 210 220 230 pF1KB4 LH-IPALAGKVLRFQKAFLTQLDELLTEHRMTWDPAQPPRDLTEAFLAEMEKAKGNPESS . .:. .:::. . . : . ::. . : .. :::. . :: .::. : : .: CCDS73 IDCFPGTHNKVLKNVALTRSYIREKVKEHQASLD-VNNPRDFIDCFLIKMEQEKDNQKSE 160 170 180 190 200 210 240 250 260 270 280 290 pF1KB4 FNDENLCIVVADLFSAGMVTTSTTLAWGLLLMILHPDVQRRVQQEIDDVIGQVRRPEMGD :: ::: .::::: :: :::::: .::::.. ::.: .::.::: :::. : : : : CCDS73 FNIENLVGTVADLFVAGTETTSTTLRYGLLLLLKHPEVTAKVQEEIDHVIGRHRSPCMQD 220 230 240 250 260 270 300 310 320 330 340 350 pF1KB4 QAHMPYTTAVIHEVQRFGDIVPLGVTHMTSRDIEVQGFRIPKGTTLITNLSSVLKDEAVW ..::::: ::.::.::..:.:: :: : .. : . ... ::::::... :.:::.:. . CCDS73 RSHMPYTDAVVHEIQRYSDLVPTGVPHAVTTDTKFRNYLIPKGTTIMALLTSVLHDDKEF 280 290 300 310 320 330 360 370 380 390 400 410 pF1KB4 EKPFRFHPEHFLDAQGHFVKPEAFLPFSAGRRACLGEPLARMELFLFFTSLLQHFSFSVP .: : : :::: .:.: : . :.:::::.: : :: :::::::::.:..::.:... CCDS73 PNPNIFDPGHFLDKNGNFKKSDYFMPFSAGKRICAGEGLARMELFLFLTTILQNFNLKSV 340 350 360 370 380 390 420 430 440 pF1KB4 TGQPRPSHHGVFAFLVT-PSPYELCAVPR . .: .:. : :..: .: CCDS73 DDLKNLNTTAVTKGIVSLPPSYQICFIPV 400 410 420 >>CCDS7438.1 CYP2C8 gene_id:1558|Hs108|chr10 (490 aa) initn: 993 init1: 777 opt: 875 Z-score: 1079.3 bits: 209.0 E(32554): 8.5e-54 Smith-Waterman score: 1023; 38.0% identity (61.6% similar) in 479 aa overlap (16-445:13-489) 10 20 30 40 50 60 pF1KB4 MGLEALVPLAMIVAIFLLLVDLMHRRQRWAARYPPGPLPLPGLGNLLHVDFQNTPYCFDQ :.:: .: .. : . :::: ::: .::.:..: .. : . CCDS74 MEPFVVLVLCLSFMLLFSLWRQSCR-RRKLPPGPTPLPIIGNMLQIDVKDICKSFTN 10 20 30 40 50 70 80 90 100 110 pF1KB4 LRRRFGDVFSLQLAWTPVVVLNGLAAVREALVTHGEDTADRPPVPITQIL---------- . . .: ::.. .. .:.::..: ::.:::. .::. . : ::.: . CCDS74 FSKVYGPVFTVYFGMNPIVVFHGYEAVKEALIDNGEEFSGRGNSPISQRITKGLGIISSN 60 70 80 90 100 110 120 130 pF1KB4 ------------------GFGPRS-------------------QGRPFRPNGLLDKAVSN :.: :: .. : :. .: : : CCDS74 GKRWKEIRRFSLTTLRNFGMGKRSIEDRVQEEAHCLVEELRKTKASPCDPTFILGCAPCN 120 130 140 150 160 170 140 150 160 170 180 190 pF1KB4 VIASLTCGRRFEYDDPRFLRLLDLAQEGLKEESGFLREVLNAVPVLLH-IPALAGKVLRF :: :.. .::.: : :: :. .:... .. .: : :.:. .:. .:::. CCDS74 VICSVVFQKRFDYKDQNFLTLMKRFNENFRILNSPWIQVCNNFPLLIDCFPGTHNKVLKN 180 190 200 210 220 230 200 210 220 230 240 250 pF1KB4 QKAFLTQLDELLTEHRMTWDPAQPPRDLTEAFLAEMEKAKGNPESSFNDENLCIVVADLF . . : . ::. . : .. :::. . :: .::. : : .: :: ::: .::::: CCDS74 VALTRSYIREKVKEHQASLD-VNNPRDFIDCFLIKMEQEKDNQKSEFNIENLVGTVADLF 240 250 260 270 280 290 260 270 280 290 300 310 pF1KB4 SAGMVTTSTTLAWGLLLMILHPDVQRRVQQEIDDVIGQVRRPEMGDQAHMPYTTAVIHEV :: :::::: .::::.. ::.: .::.::: :::. : : : :..::::: ::.::. CCDS74 VAGTETTSTTLRYGLLLLLKHPEVTAKVQEEIDHVIGRHRSPCMQDRSHMPYTDAVVHEI 300 310 320 330 340 350 320 330 340 350 360 370 pF1KB4 QRFGDIVPLGVTHMTSRDIEVQGFRIPKGTTLITNLSSVLKDEAVWEKPFRFHPEHFLDA ::..:.:: :: : .. : . ... ::::::... :.:::.:. . .: : : :::: CCDS74 QRYSDLVPTGVPHAVTTDTKFRNYLIPKGTTIMALLTSVLHDDKEFPNPNIFDPGHFLDK 360 370 380 390 400 410 380 390 400 410 420 430 pF1KB4 QGHFVKPEAFLPFSAGRRACLGEPLARMELFLFFTSLLQHFSFSVPTGQPRPSHHGVFAF .:.: : . :.:::::.: : :: :::::::::.:..::.:... . .: CCDS74 NGNFKKSDYFMPFSAGKRICAGEGLARMELFLFLTTILQNFNLKSVDDLKNLNTTAVTKG 420 430 440 450 460 470 440 pF1KB4 LVT-PSPYELCAVPR .:. : :..: .: CCDS74 IVSLPPSYQICFIPV 480 490 >>CCDS12572.1 CYP2F1 gene_id:1572|Hs108|chr19 (491 aa) initn: 979 init1: 768 opt: 875 Z-score: 1079.3 bits: 209.0 E(32554): 8.5e-54 Smith-Waterman score: 980; 37.8% identity (61.6% similar) in 487 aa overlap (13-446:13-491) 10 20 30 40 50 60 pF1KB4 MGLEALVPLAMIVAIFLLLVDLMHRRQRWAARYPPGPLPLPGLGNLLHVDFQNTPYCFDQ .:. ::. : : . .. :::: :: ::::: . :. . . CCDS12 MDSISTAILLLLLALVCLLLTLSSRDK---GKLPPGPRPLSILGNLLLLCSQDMLTSLTK 10 20 30 40 50 70 80 90 100 pF1KB4 LRRRFGDVFSLQLAWTPVVVLNGLAAVREALVTHGEDTADRPPVPI-------------- : ...:......:. ::::.: ::.:::: .::. . : : CCDS12 LSKEYGSMYTVHLGPRRVVVLSGYQAVKEALVDQGEEFSGRGDYPAFFNFTKGNGIAFSS 60 70 80 90 100 110 110 120 130 pF1KB4 -----------TQIL---GFGPRS-------------------QGRPFRPNGLLDKAVSN ::: :.: :: .:.:: :. .:...::: CCDS12 GDRWKVLRQFSIQILRNFGMGKRSIEERILEEGSFLLAELRKTEGEPFDPTFVLSRSVSN 120 130 140 150 160 170 140 150 160 170 180 190 pF1KB4 VIASLTCGRRFEYDDPRFLRLLDLAQEGLKEESGFLREVLNAVPVLLH-IPALAGKVLRF .: :. : ::.::: :.: .. : ..... :. :. . : :: .:. .... CCDS12 IICSVLFGSRFDYDDERLLTIIRLINDNFQIMSSPWGELYDIFPSLLDWVPGPHQRIFQN 180 190 200 210 220 230 200 210 220 230 240 250 pF1KB4 QKAFLTQLDELLTEHRMTWDPAQPPRDLTEAFLAEMEKAKGNPESSFNDENLCIVVADLF : . . . . .:. . :: . :::. . ::..: . : .: : :. ..: ... .:. CCDS12 FKCLRDLIAHSVHDHQASLDP-RSPRDFIQCFLTKMAEEKEDPLSHFHMDTLLMTTHNLL 240 250 260 270 280 290 260 270 280 290 300 310 pF1KB4 SAGMVTTSTTLAWGLLLMILHPDVQRRVQQEIDDVIGQVRRPEMGDQAHMPYTTAVIHEV .: :.:::: ..: .. .: :: :::.::: :.:..: : . :.: :::: :::::: CCDS12 FGGTKTVSTTLHHAFLALMKYPKVQARVQEEIDLVVGRARLPALKDRAAMPYTDAVIHEV 300 310 320 330 340 350 320 330 340 350 360 370 pF1KB4 QRFGDIVPLGVTHMTSRDIEVQGFRIPKGTTLITNLSSVLKDEAVWEKPFRFHPEHFLDA :::.::.:... : ..:: .:: ::::: .:: :..: : . . : .:.::::::: CCDS12 QRFADIIPMNLPHRVTRDTAFRGFLIPKGTDVITLLNTVHYDPSQFLTPQEFNPEHFLDA 360 370 380 390 400 410 380 390 400 410 420 pF1KB4 QGHFVKPEAFLPFSAGRRACLGEPLARMELFLFFTSLLQHFSFSVPTGQPR-----PSHH . : : ::.::::::: :::: ::::::::..:..:: ::.. : : :. : CCDS12 NQSFKKSPAFMPFSAGRRLCLGESLARMELFLYLTAILQSFSLQ-PLGAPEDIDLTPLSS 420 430 440 450 460 470 430 440 pF1KB4 GVFAFLVTPSPYELCAVPR :. . : :..:: :: CCDS12 GLGNL---PRPFQLCLRPR 480 490 >>CCDS12571.1 CYP2A13 gene_id:1553|Hs108|chr19 (494 aa) initn: 953 init1: 767 opt: 873 Z-score: 1076.8 bits: 208.6 E(32554): 1.2e-53 Smith-Waterman score: 957; 36.1% identity (63.5% similar) in 477 aa overlap (26-446:25-494) 10 20 30 40 50 pF1KB4 MGLEALVPLAMIVAIFLLLVDLMHRRQRWA-ARYPPGPLPLPGLGNLLHVDFQNTPYCFD ::: . .. :::: ::: .:: :... .. . CCDS12 MLASGLLLVTLLACLTVMVLMSVWRQRKSRGKLPPGPTPLPFIGNYLQLNTEQMYNSLM 10 20 30 40 50 60 70 80 90 100 pF1KB4 QLRRRFGDVFSLQLAWTPVVVLNGLAAVREALVTHGEDTADRPP---------------- .. .:.: ::...:. :::: : ::.:::: ..:. . : CCDS12 KISERYGPVFTIHLGPRRVVVLCGHDAVKEALVDQAEEFSGRGEQATFDWLFKGYGVAFS 60 70 80 90 100 110 110 120 130 pF1KB4 ----------VPITQILGFGPRSQGRPFR---------------------PNGLLDKAVS :. . ::: ..: : :. .:...:: CCDS12 NGERAKQLRRFSIATLRGFGVGKRGIEERIQEEAGFLIDALRGTHGANIDPTFFLSRTVS 120 130 140 150 160 170 140 150 160 170 180 pF1KB4 NVIASLTCGRRFEYDDPRFLRLLDLAQEGLK---EESGFLREVLNAVPVLLHIPALAGKV :::.:.. : ::.:.: .:: :: . ... .: : :....: . :.:. .. CCDS12 NVISSIVFGDRFDYEDKEFLSLLRMMLGSFQFTATSTGQLYEMFSSV--MKHLPGPQQQA 180 190 200 210 220 230 190 200 210 220 230 240 pF1KB4 LRFQKAFLTQLDELLTEHRMTWDPAQPPRDLTEAFLAEMEKAKGNPESSFNDENLCIVVA .. ... . . . ... : :: . :::. ..:: .:.. . ::.. : .:: ... CCDS12 FKELQGLEDFIAKKVEHNQRTLDP-NSPRDFIDSFLIRMQEEEKNPNTEFYLKNLVMTTL 240 250 260 270 280 290 250 260 270 280 290 300 pF1KB4 DLFSAGMVTTSTTLAWGLLLMILHPDVQRRVQQEIDDVIGQVRRPEMGDQAHMPYTTAVI .:: :: :.:::: .:.::.. ::.:. .:..::: :::. :.:.. :.:.:::: ::: CCDS12 NLFFAGTETVSTTLRYGFLLLMKHPEVEAKVHEEIDRVIGKNRQPKFEDRAKMPYTEAVI 300 310 320 330 340 350 310 320 330 340 350 360 pF1KB4 HEVQRFGDIVPLGVTHMTSRDIEVQGFRIPKGTTLITNLSSVLKDEAVWEKPFRFHPEHF ::.:::::..:.:..: ...: . . : .:::: .. :.:::.: . .: :.:.:: CCDS12 HEIQRFGDMLPMGLAHRVNKDTKFRDFFLPKGTEVFPMLGSVLRDPRFFSNPRDFNPQHF 360 370 380 390 400 410 370 380 390 400 410 420 pF1KB4 LDAQGHFVKPEAFLPFSAGRRACLGEPLARMELFLFFTSLLQHFSFSVPTGQPR-----P :: .:.: : .::.::: :.: :.:: :::::::::::...:.: :. : . :. : CCDS12 LDKKGQFKKSDAFVPFSIGKRYCFGEGLARMELFLFFTTIMQNFRFKSPQS-PKDIDVSP 420 430 440 450 460 470 430 440 pF1KB4 SHHGVFAFLVTPSPYELCAVPR .: : : . : : . .:: CCDS12 KHVG---FATIPRNYTMSFLPR 480 490 446 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 03:02:43 2016 done: Fri Nov 4 03:02:44 2016 Total Scan time: 3.330 Total Display time: 0.090 Function used was FASTA [36.3.4 Apr, 2011]