FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE0362, 530 aa 1>>>pF1KE0362 530 - 530 aa - 530 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.7196+/-0.0011; mu= 15.4937+/- 0.066 mean_var=61.9765+/-12.311, 0's: 0 Z-trim(102.6): 39 B-trim: 0 in 0/48 Lambda= 0.162915 statistics sampled from 6966 (7002) to 6966 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.57), E-opt: 0.2 (0.215), width: 16 Scan time: 3.080 The best scores are: opt bits E(32554) CCDS2506.1 UGT1A7 gene_id:54577|Hs108|chr2 ( 530) 3606 856.6 0 CCDS33402.1 UGT1A8 gene_id:54576|Hs108|chr2 ( 530) 3387 805.1 0 CCDS33403.1 UGT1A10 gene_id:54575|Hs108|chr2 ( 530) 3380 803.5 0 CCDS2505.1 UGT1A9 gene_id:54600|Hs108|chr2 ( 530) 3349 796.2 0 CCDS2507.1 UGT1A6 gene_id:54578|Hs108|chr2 ( 532) 2384 569.4 3.6e-162 CCDS2509.1 UGT1A3 gene_id:54659|Hs108|chr2 ( 534) 2368 565.6 4.9e-161 CCDS33404.1 UGT1A5 gene_id:54579|Hs108|chr2 ( 534) 2363 564.5 1.1e-160 CCDS2510.1 UGT1A1 gene_id:54658|Hs108|chr2 ( 533) 2357 563.1 2.9e-160 CCDS33405.1 UGT1A4 gene_id:54657|Hs108|chr2 ( 534) 2343 559.8 2.9e-159 CCDS2508.1 UGT1A6 gene_id:54578|Hs108|chr2 ( 265) 1736 417.0 1.3e-116 CCDS3523.1 UGT2B17 gene_id:7367|Hs108|chr4 ( 530) 1524 367.3 2.5e-101 CCDS3524.1 UGT2B15 gene_id:7366|Hs108|chr4 ( 530) 1511 364.2 2.1e-100 CCDS75136.1 UGT2B10 gene_id:7365|Hs108|chr4 ( 528) 1472 355.0 1.2e-97 CCDS3526.1 UGT2B7 gene_id:7364|Hs108|chr4 ( 529) 1465 353.4 3.8e-97 CCDS56331.1 UGT2A2 gene_id:574537|Hs108|chr4 ( 536) 1454 350.8 2.3e-96 CCDS43234.1 UGT2B4 gene_id:7363|Hs108|chr4 ( 528) 1448 349.4 6e-96 CCDS3525.1 UGT2A3 gene_id:79799|Hs108|chr4 ( 527) 1446 348.9 8.3e-96 CCDS3527.1 UGT2B11 gene_id:10720|Hs108|chr4 ( 529) 1440 347.5 2.2e-95 CCDS3528.1 UGT2B28 gene_id:54490|Hs108|chr4 ( 529) 1435 346.4 5e-95 CCDS3529.1 UGT2A1 gene_id:10941|Hs108|chr4 ( 527) 1421 343.1 4.9e-94 CCDS75135.1 UGT2B10 gene_id:7365|Hs108|chr4 ( 444) 1175 285.2 1.1e-76 CCDS3705.1 UGT8 gene_id:7368|Hs108|chr4 ( 541) 1131 274.9 1.6e-73 CCDS58901.1 UGT2A1 gene_id:10941|Hs108|chr4 ( 527) 1047 255.2 1.4e-67 CCDS77925.1 UGT2A1 gene_id:10941|Hs108|chr4 ( 483) 858 210.7 3.1e-54 CCDS77924.1 UGT2A2 gene_id:574537|Hs108|chr4 ( 492) 858 210.7 3.1e-54 CCDS58902.1 UGT2A1 gene_id:10941|Hs108|chr4 ( 693) 858 210.8 4.3e-54 CCDS3914.1 UGT3A2 gene_id:167127|Hs108|chr5 ( 523) 838 206.0 8.6e-53 CCDS3913.1 UGT3A1 gene_id:133688|Hs108|chr5 ( 523) 818 201.3 2.2e-51 CCDS54842.1 UGT3A2 gene_id:167127|Hs108|chr5 ( 489) 799 196.9 4.6e-50 CCDS82930.1 UGT2B7 gene_id:7364|Hs108|chr4 ( 369) 757 187.0 3.3e-47 CCDS75137.1 UGT2B4 gene_id:7363|Hs108|chr4 ( 369) 739 182.7 6.3e-46 CCDS56330.1 UGT2B28 gene_id:54490|Hs108|chr4 ( 335) 641 159.7 4.9e-39 CCDS54841.1 UGT3A1 gene_id:133688|Hs108|chr5 ( 252) 272 72.9 4.8e-13 >>CCDS2506.1 UGT1A7 gene_id:54577|Hs108|chr2 (530 aa) initn: 3606 init1: 3606 opt: 3606 Z-score: 4577.2 bits: 856.6 E(32554): 0 Smith-Waterman score: 3606; 100.0% identity (100.0% similar) in 530 aa overlap (1-530:1-530) 10 20 30 40 50 60 pF1KE0 MARAGWTGLLPLYVCLLLTCGFAKAGKLLVVPMDGSHWFTMQSVVEKLILRGHEVVVVMP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 MARAGWTGLLPLYVCLLLTCGFAKAGKLLVVPMDGSHWFTMQSVVEKLILRGHEVVVVMP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 EVSWQLGRSLNCTVKTYSTSYTLEDQDREFMVFADARWTAPLRSAFSLLTSSSNGIFDLF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 EVSWQLGRSLNCTVKTYSTSYTLEDQDREFMVFADARWTAPLRSAFSLLTSSSNGIFDLF 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 FSNCRSLFNDRKLVEYLKESCFDAVFLDPFDACGLIVAKYFSLPSVVFARGIFCHYLEEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 FSNCRSLFNDRKLVEYLKESCFDAVFLDPFDACGLIVAKYFSLPSVVFARGIFCHYLEEG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE0 AQCPAPLSYVPRLLLGFSDAMTFKERVWNHIMHLEEHLFCPYFFKNVLEIASEILQTPVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 AQCPAPLSYVPRLLLGFSDAMTFKERVWNHIMHLEEHLFCPYFFKNVLEIASEILQTPVT 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE0 AYDLYSHTSIWLLRTDFVLEYPKPVMPNMIFIGGINCHQGKPVPMEFEAYINASGEHGIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 AYDLYSHTSIWLLRTDFVLEYPKPVMPNMIFIGGINCHQGKPVPMEFEAYINASGEHGIV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE0 VFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWLPQNDLLGH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 VFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWLPQNDLLGH 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE0 PMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNVLEMTSEDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 PMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNVLEMTSEDL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE0 ENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLRPAAHDLTW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 ENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLRPAAHDLTW 430 440 450 460 470 480 490 500 510 520 530 pF1KE0 YQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH :::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 YQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH 490 500 510 520 530 >>CCDS33402.1 UGT1A8 gene_id:54576|Hs108|chr2 (530 aa) initn: 3387 init1: 3387 opt: 3387 Z-score: 4299.0 bits: 805.1 E(32554): 0 Smith-Waterman score: 3387; 94.5% identity (97.4% similar) in 530 aa overlap (1-530:1-530) 10 20 30 40 50 60 pF1KE0 MARAGWTGLLPLYVCLLLTCGFAKAGKLLVVPMDGSHWFTMQSVVEKLILRGHEVVVVMP :::.:::. .:: : ::::::::.:::::::::::::::::::::::::::::::::::: CCDS33 MARTGWTSPIPLCVSLLLTCGFAEAGKLLVVPMDGSHWFTMQSVVEKLILRGHEVVVVMP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 EVSWQLGRSLNCTVKTYSTSYTLEDQDREFMVFADARWTAPLRSAFSLLTSSSNGIFDLF :::::::.::::::::::::::::: ::::: ::::.: : .:: :::. :::::.:.:: CCDS33 EVSWQLGKSLNCTVKTYSTSYTLEDLDREFMDFADAQWKAQVRSLFSLFLSSSNGFFNLF 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 FSNCRSLFNDRKLVEYLKESCFDAVFLDPFDACGLIVAKYFSLPSVVFARGIFCHYLEEG ::.::::::::::::::::: ::::::::::::::::::::::::::::::: ::::::: CCDS33 FSHCRSLFNDRKLVEYLKESSFDAVFLDPFDACGLIVAKYFSLPSVVFARGIACHYLEEG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE0 AQCPAPLSYVPRLLLGFSDAMTFKERVWNHIMHLEEHLFCPYFFKNVLEIASEILQTPVT ::::::::::::.:::::::::::::: :::::::::::: :: ::.::::::::::::: CCDS33 AQCPAPLSYVPRILLGFSDAMTFKERVRNHIMHLEEHLFCQYFSKNALEIASEILQTPVT 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE0 AYDLYSHTSIWLLRTDFVLEYPKPVMPNMIFIGGINCHQGKPVPMEFEAYINASGEHGIV :::::::::::::::::::.::::::::::::::::::::::.::::::::::::::::: CCDS33 AYDLYSHTSIWLLRTDFVLDYPKPVMPNMIFIGGINCHQGKPLPMEFEAYINASGEHGIV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE0 VFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWLPQNDLLGH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 VFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWLPQNDLLGH 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE0 PMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNVLEMTSEDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 PMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNVLEMTSEDL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE0 ENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLRPAAHDLTW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 ENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLRPAAHDLTW 430 440 450 460 470 480 490 500 510 520 530 pF1KE0 YQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH :::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 YQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH 490 500 510 520 530 >>CCDS33403.1 UGT1A10 gene_id:54575|Hs108|chr2 (530 aa) initn: 3380 init1: 3380 opt: 3380 Z-score: 4290.1 bits: 803.5 E(32554): 0 Smith-Waterman score: 3380; 93.8% identity (97.5% similar) in 530 aa overlap (1-530:1-530) 10 20 30 40 50 60 pF1KE0 MARAGWTGLLPLYVCLLLTCGFAKAGKLLVVPMDGSHWFTMQSVVEKLILRGHEVVVVMP :::::::. .:: ::::::::::.:::::::::::::::::::::::::::::::::::: CCDS33 MARAGWTSPVPLCVCLLLTCGFAEAGKLLVVPMDGSHWFTMQSVVEKLILRGHEVVVVMP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 EVSWQLGRSLNCTVKTYSTSYTLEDQDREFMVFADARWTAPLRSAFSLLTSSSNGIFDLF :::::: :::::::::::::::::::.::::::: :.: : .: :::: :::.:..::: CCDS33 EVSWQLERSLNCTVKTYSTSYTLEDQNREFMVFAHAQWKAQAQSIFSLLMSSSSGFLDLF 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 FSNCRSLFNDRKLVEYLKESCFDAVFLDPFDACGLIVAKYFSLPSVVFARGIFCHYLEEG ::.::::::::::::::::: ::::::::::.::::::::::::::::.::::::.:::: CCDS33 FSHCRSLFNDRKLVEYLKESSFDAVFLDPFDTCGLIVAKYFSLPSVVFTRGIFCHHLEEG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE0 AQCPAPLSYVPRLLLGFSDAMTFKERVWNHIMHLEEHLFCPYFFKNVLEIASEILQTPVT ::::::::::: ::::::::::::::::::.:::.:::: :.:.:.::::::::::::: CCDS33 AQCPAPLSYVPNDLLGFSDAMTFKERVWNHIVHLEDHLFCQYLFRNALEIASEILQTPVT 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE0 AYDLYSHTSIWLLRTDFVLEYPKPVMPNMIFIGGINCHQGKPVPMEFEAYINASGEHGIV :::::::::::::::::::.::::::::::::::::::::::.::::::::::::::::: CCDS33 AYDLYSHTSIWLLRTDFVLDYPKPVMPNMIFIGGINCHQGKPLPMEFEAYINASGEHGIV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE0 VFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWLPQNDLLGH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 VFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWLPQNDLLGH 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE0 PMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNVLEMTSEDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 PMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNVLEMTSEDL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE0 ENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLRPAAHDLTW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 ENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLRPAAHDLTW 430 440 450 460 470 480 490 500 510 520 530 pF1KE0 YQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH :::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 YQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH 490 500 510 520 530 >>CCDS2505.1 UGT1A9 gene_id:54600|Hs108|chr2 (530 aa) initn: 3349 init1: 3349 opt: 3349 Z-score: 4250.8 bits: 796.2 E(32554): 0 Smith-Waterman score: 3349; 93.4% identity (96.6% similar) in 530 aa overlap (1-530:1-530) 10 20 30 40 50 60 pF1KE0 MARAGWTGLLPLYVCLLLTCGFAKAGKLLVVPMDGSHWFTMQSVVEKLILRGHEVVVVMP :: .:::. ::: ::::::::::.:::::::::::::::::.:::::::::::::::::: CCDS25 MACTGWTSPLPLCVCLLLTCGFAEAGKLLVVPMDGSHWFTMRSVVEKLILRGHEVVVVMP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 EVSWQLGRSLNCTVKTYSTSYTLEDQDREFMVFADARWTAPLRSAFSLLTSSSNGIFDLF ::::::::::::::::::::::::: :::: .:: :.: : .:: .::: .: : ::::: CCDS25 EVSWQLGRSLNCTVKTYSTSYTLEDLDREFKAFAHAQWKAQVRSIYSLLMGSYNDIFDLF 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 FSNCRSLFNDRKLVEYLKESCFDAVFLDPFDACGLIVAKYFSLPSVVFARGIFCHYLEEG ::::::::.:.::::::::: :::::::::: ::::::::::::::::::::.::::::: CCDS25 FSNCRSLFKDKKLVEYLKESSFDAVFLDPFDNCGLIVAKYFSLPSVVFARGILCHYLEEG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE0 AQCPAPLSYVPRLLLGFSDAMTFKERVWNHIMHLEEHLFCPYFFKNVLEIASEILQTPVT ::::::::::::.:::::::::::::: ::::::::::.: ::::.::::::::::::: CCDS25 AQCPAPLSYVPRILLGFSDAMTFKERVRNHIMHLEEHLLCHRFFKNALEIASEILQTPVT 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE0 AYDLYSHTSIWLLRTDFVLEYPKPVMPNMIFIGGINCHQGKPVPMEFEAYINASGEHGIV ::::::::::::::::::.::::::::::::::::::::::.::::::::::::::::: CCDS25 EYDLYSHTSIWLLRTDFVLDYPKPVMPNMIFIGGINCHQGKPLPMEFEAYINASGEHGIV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE0 VFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWLPQNDLLGH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 VFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWLPQNDLLGH 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE0 PMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNVLEMTSEDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 PMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNVLEMTSEDL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE0 ENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLRPAAHDLTW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 ENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLRPAAHDLTW 430 440 450 460 470 480 490 500 510 520 530 pF1KE0 YQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH :::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 YQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH 490 500 510 520 530 >>CCDS2507.1 UGT1A6 gene_id:54578|Hs108|chr2 (532 aa) initn: 2391 init1: 2194 opt: 2384 Z-score: 3025.0 bits: 569.4 E(32554): 3.6e-162 Smith-Waterman score: 2384; 70.2% identity (84.4% similar) in 520 aa overlap (14-530:15-532) 10 20 30 40 50 pF1KE0 MARAGWTGLLPLYVCLLLTCGFAKAGKLLVVPMDGSHWFTMQSVVEKLILRGHEVVVVM : .: :.. . ::::::.:::::..:...:: : ::::.:::. CCDS25 MACLLRSFQRISAGVFFLALWGMVVGDKLLVVPQDGSHWLSMKDIVEVLSDRGHEIVVVV 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE0 PEVSWQLGRSLNCTVKTYSTSYTLEDQDREFMVFADARWTA-PLRSAFSLLTSSSNGIFD :::. : .: : : : . : :. ... :.. ... . .: . .. .. CCDS25 PEVNLLLKESKYYTRKIYPVPYDQEELKNRYQSFGNNHFAERSFLTAPQTEYRNNMIVIG 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE0 LFFSNCRSLFNDRKLVEYLKESCFDAVFLDPFDACGLIVAKYFSLPSVVFARGIFCHYLE :.: ::.::..:: ....::: :::.: :: ::.:.:.:..:::: . ::. : . CCDS25 LYFINCQSLLQDRDTLNFFKESKFDALFTDPALPCGVILAEYLGLPSVYLFRGFPCSLEH 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE0 EGAQCPAPLSYVPRLLLGFSDAMTFKERVWNHIMHL-EEHLF-CPYFFKNVLEIASEILQ .. : :.::.:: ::: :::..:: : ...: : .:: : .:.. :.:: .:. CCDS25 TFSRSPDPVSYIPRCYTKFSDHMTFSQRVANFLVNLLEPYLFYC--LFSKYEELASAVLK 190 200 210 220 230 240 250 260 270 280 290 pF1KE0 TPVTAYDLYSHTSIWLLRTDFVLEYPKPVMPNMIFIGGINCHQGKPVPMEFEAYINASGE : ::...:.:::: :::::::.::::::.:::::::.. : . .::::::::::: CCDS25 RDVDIITLYQKVSVWLLRYDFVLEYPRPVMPNMVFIGGINCKKRKDLSQEFEAYINASGE 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE0 HGIVVFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWLPQND :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 HGIVVFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWLPQND 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE0 LLGHPMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNVLEMT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 LLGHPMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNVLEMT 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE0 SEDLENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLRPAAH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 SEDLENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLRPAAH 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE0 DLTWYQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH :::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 DLTWYQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH 480 490 500 510 520 530 >>CCDS2509.1 UGT1A3 gene_id:54659|Hs108|chr2 (534 aa) initn: 2374 init1: 2181 opt: 2368 Z-score: 3004.6 bits: 565.6 E(32554): 4.9e-161 Smith-Waterman score: 2368; 67.9% identity (83.0% similar) in 529 aa overlap (6-530:11-534) 10 20 30 40 50 pF1KE0 MARAGW--TGLLPLYVCLLLTCG-FAKAGKLLVVPMDGSHWFTMQSVVEKLILRG : :::: :::. .:..::.::::.:::::..:. :...: :: CCDS25 MATGLQVPLPWLATGLL-----LLLSVQPWAESGKVLVVPIDGSHWLSMREVLRELHARG 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 HEVVVVMPEVSWQLGRSLNCTVKTYSTSYTLEDQDREFMVFADARW-TAPLRSAFSLLTS :..::. :::. .. . :. ::. :.: .. ::. . .. . : . . : . CCDS25 HQAVVLTPEVNMHIKEENFFTLTTYAISWTQDEFDRHVLGHTQLYFETEHFLKKFFRSMA 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE0 SSNGIFDLFFSNCRSLFNDRKLVEYLKESCFDAVFLDPFDACGLIVAKYFSLPSVVFARG :.. .. .: :.... :...:. . ::.:. :: . :. ..:::.:.:.: : :. CCDS25 MLNNMSLVYHRSCVELLHNEALIRHLNATSFDVVLTDPVNLCAAVLAKYLSIPTVFFLRN 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE0 IFCHYLEEGAQCPAPLSYVPRLLLGFSDAMTFKERVWNHIMHLEEHLFCPYFFKNVLEIA : : .:.::: : ::.:::: :: ::: .:: : .. : .: : .: CCDS25 IPCDLDFKGTQCPNPSSYIPRLLTTNSDHMTFMQRVKNMLYPLALSYICHAFSAPYASLA 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE0 SEILQTPVTAYDLYSHTSIWLLRTDFVLEYPKPVMPNMIFIGGINCHQGKPVPMEFEAYI ::..: :.. :. ::.:.::.: :::..::.:.::::.::::::: . ::. .:::::: CCDS25 SELFQREVSVVDILSHASVWLFRGDFVMDYPRPIMPNMVFIGGINCANRKPLSQEFEAYI 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE0 NASGEHGIVVFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 NASGEHGIVVFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKW 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE0 LPQNDLLGHPMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 LPQNDLLGHPMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLN 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE0 VLEMTSEDLENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 VLEMTSEDLENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHL 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE0 RPAAHDLTWYQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 RPAAHDLTWYQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH 480 490 500 510 520 530 >>CCDS33404.1 UGT1A5 gene_id:54579|Hs108|chr2 (534 aa) initn: 2359 init1: 2188 opt: 2363 Z-score: 2998.3 bits: 564.5 E(32554): 1.1e-160 Smith-Waterman score: 2363; 68.6% identity (82.7% similar) in 525 aa overlap (7-530:14-534) 10 20 30 40 50 pF1KE0 MARAGWTGLLPLYVCLLLTCGFAKAGKLLVVPMDGSHWFTMQSVVEKLILRGH :::: :: . .:..::.:::: :::::..:. ... : ::: CCDS33 MATGLQVPLPQLATGLL----LLLSVQPWAESGKVLVVPTDGSHWLSMREALRDLHARGH 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 EVVVVMPEVSWQLGRSLNCTVKTYSTSYTLEDQDREFMVFADARW-TAPLRSAFSLLTSS .:::. ::. . . :. ::. :.: .. :: .. ... . : : :: . CCDS33 QVVVLTLEVNMYIKEENFFTLTTYAISWTQDEFDRLLLGHTQSFFETEHLLMKFSRRMAI 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE0 SNGIFDLFFSNCRSLFNDRKLVEYLKESCFDAVFLDPFDACGLIVAKYFSLPSVVFARGI :.. .. .: :.... :...:. . ::.:. ::: :. ..:::.:.:.: : :.: CCDS33 MNNMSLIIHRSCVELLHNEALIRHLHATSFDVVLTDPFHLCAAVLAKYLSIPAVFFLRNI 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE0 FCHYLEEGAQCPAPLSYVPRLLLGFSDAMTFKERVWNHIMHLEEHLFCPYFFKNVLEIAS : .:.::: : ::.:::: :: ::: .:: : .. : .: .:: CCDS33 PCDLDFKGTQCPNPSSYIPRLLTTNSDHMTFLQRVKNMLYPLALSYLCHAVSAPYASLAS 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE0 EILQTPVTAYDLYSHTSIWLLRTDFVLEYPKPVMPNMIFIGGINCHQGKPVPMEFEAYIN :..: :.. :: ::.:.::.: :::..::.:.::::.::::::: .:::. .::::::: CCDS33 ELFQREVSVVDLVSHASVWLFRGDFVMDYPRPIMPNMVFIGGINCANGKPLSQEFEAYIN 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE0 ASGEHGIVVFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 ASGEHGIVVFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWL 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE0 PQNDLLGHPMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 PQNDLLGHPMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNV 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE0 LEMTSEDLENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 LEMTSEDLENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLR 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE0 PAAHDLTWYQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 PAAHDLTWYQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH 480 490 500 510 520 530 >>CCDS2510.1 UGT1A1 gene_id:54658|Hs108|chr2 (533 aa) initn: 2360 init1: 2181 opt: 2357 Z-score: 2990.6 bits: 563.1 E(32554): 2.9e-160 Smith-Waterman score: 2357; 66.3% identity (83.1% similar) in 534 aa overlap (2-530:5-533) 10 20 30 40 50 pF1KE0 MARAGWTGLLPLYVCLLLTCGFAKAGKLLVVPMDGSHWFTMQSVVEKLILRGHEVVV ...: .: : .:.: ..:::.:..:.:::::..: .....: ::::.:: CCDS25 MAVESQGGRPLVLGLLLCVLGPV-VSHAGKILLIPVDGSHWLSMLGAIQQLQQRGHEIVV 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 VMPEVSWQLGRSLNCTVKTYSTSYTLEDQDREFM-----VFADARWTAPLRSAFSLLTSS . :..: . . :.::: . . :: . :. :: . . . .... . .. CCDS25 LAPDASLYIRDGAFYTLKTYPVPFQREDVKESFVSLGHNVFENDSFLQRVIKTYKKIKKD 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE0 SNGIFDLFFSNCRSLFNDRKLVEYLKESCFDAVFLDPFDACGLIVAKYFSLPSVVFARGI : ...:.: :.....:. : :: ::... ::: :. :::.:.:::.: : ... CCDS25 SA----MLLSGCSHLLHNKELMASLAESSFDVMLTDPFLPCSPIVAQYLSLPTVFFLHAL 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE0 FCHYLEEGAQCPAPLSYVPRLLLGFSDAMTFKERVWNHIMHLEEHLFCPYFFKNVLEIAS : :..::: :.::::: : . :: ::: .:: : .. . ....: .. .:: CCDS25 PCSLEFEATQCPNPFSYVPRPLSSHSDHMTFLQRVKNMLIAFSQNFLCDVVYSPYATLAS 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE0 EILQTPVTAYDLYSHTSIWLLRTDFVLEYPKPVMPNMIFIGGINCHQGKPVPMEFEAYIN :.:: ::. :: : .:.::.:.::: .::.:.::::.:.::::: . .:. .::::::: CCDS25 EFLQREVTVQDLLSSASVWLFRSDFVKDYPRPIMPNMVFVGGINCLHQNPLSQEFEAYIN 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE0 ASGEHGIVVFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 ASGEHGIVVFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWL 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE0 PQNDLLGHPMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 PQNDLLGHPMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNV 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE0 LEMTSEDLENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 LEMTSEDLENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLR 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE0 PAAHDLTWYQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 PAAHDLTWYQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH 480 490 500 510 520 530 >>CCDS33405.1 UGT1A4 gene_id:54657|Hs108|chr2 (534 aa) initn: 2342 init1: 2181 opt: 2343 Z-score: 2972.8 bits: 559.8 E(32554): 2.9e-159 Smith-Waterman score: 2343; 66.9% identity (82.4% similar) in 534 aa overlap (1-530:1-534) 10 20 30 40 50 pF1KE0 MARAGWTGLLPLYVCLLLTCG---FAKAGKLLVVPMDGSHWFTMQSVVEKLILRGHEVVV :::. . : : . ::: . .:..::.:::: ::: :..:. ....: :::..:: CCDS33 MARGLQVPLPRLATGLLLLLSVQPWAESGKVLVVPTDGSPWLSMREALRELHARGHQAVV 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE0 VMPEVSWQLGRSLNCTVKTYSTSYTLEDQDREFMVFADARW-TAPLRSAFSLLTSSSNGI . :::. .. . :. .:.. .: .. :: . .... . : : . .: . :.. CCDS33 LTPEVNMHIKEEKFFTLTAYAVPWTQKEFDRVTLGYTQGFFETEHLLKRYSRSMAIMNNV 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE0 FDLFFSNCRSLFNDRKLVEYLKESCFDAVFLDPFDACGLIVAKYFSLPSVVFARGIFCHY . : :.... :...:. . ::.:. :: . :: ..:::.:.:.: : : : : CCDS33 SLALHRCCVELLHNEALIRHLNATSFDVVLTDPVNLCGAVLAKYLSIPAVFFWRYIPCDL 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE0 LEEGAQCPAPLSYVPRLLLGFSDAMTFKERVWNHIMHLEEHLFCPYFFKNVLEIASEILQ .:.::: : ::.:.:: :: ::: .:: : .. : .: : .:::..: CCDS33 DFKGTQCPNPSSYIPKLLTTNSDHMTFLQRVKNMLYPLALSYICHTFSAPYASLASELFQ 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE0 TPVTAYDLYSHTSIWLLRTDFVLEYPKPVMPNMIFIGGINCHQGKPVPMEFEAYINASGE :.. :: :..:.::.: :::..::.:.::::.::::::: .:::. .::::::::::: CCDS33 REVSVVDLVSYASVWLFRGDFVMDYPRPIMPNMVFIGGINCANGKPLSQEFEAYINASGE 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE0 HGIVVFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWLPQND :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 HGIVVFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWLPQND 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE0 LLGHPMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNVLEMT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 LLGHPMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNVLEMT 370 380 390 400 410 420 420 430 440 450 460 470 pF1KE0 SEDLENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLRPAAH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SEDLENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLRPAAH 430 440 450 460 470 480 480 490 500 510 520 530 pF1KE0 DLTWYQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH :::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 DLTWYQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH 490 500 510 520 530 >>CCDS2508.1 UGT1A6 gene_id:54578|Hs108|chr2 (265 aa) initn: 1736 init1: 1736 opt: 1736 Z-score: 2206.9 bits: 417.0 E(32554): 1.3e-116 Smith-Waterman score: 1736; 97.0% identity (98.9% similar) in 265 aa overlap (266-530:1-265) 240 250 260 270 280 290 pF1KE0 QTPVTAYDLYSHTSIWLLRTDFVLEYPKPVMPNMIFIGGINCHQGKPVPMEFEAYINASG ::::.:::::::.. : . .:::::::::: CCDS25 MPNMVFIGGINCKKRKDLSQEFEAYINASG 10 20 30 300 310 320 330 340 350 pF1KE0 EHGIVVFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWLPQN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 EHGIVVFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWLPQN 40 50 60 70 80 90 360 370 380 390 400 410 pF1KE0 DLLGHPMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNVLEM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 DLLGHPMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNVLEM 100 110 120 130 140 150 420 430 440 450 460 470 pF1KE0 TSEDLENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLRPAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 TSEDLENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLRPAA 160 170 180 190 200 210 480 490 500 510 520 530 pF1KE0 HDLTWYQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH ::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 HDLTWYQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH 220 230 240 250 260 530 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 14:01:01 2016 done: Thu Nov 3 14:01:01 2016 Total Scan time: 3.080 Total Display time: 0.120 Function used was FASTA [36.3.4 Apr, 2011]