FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5640, 512 aa 1>>>pF1KB5640 512 - 512 aa - 512 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.1186+/-0.000911; mu= 13.6550+/- 0.054 mean_var=72.3676+/-14.905, 0's: 0 Z-trim(106.4): 43 B-trim: 342 in 1/51 Lambda= 0.150766 statistics sampled from 8919 (8962) to 8919 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.65), E-opt: 0.2 (0.275), width: 16 Scan time: 2.770 The best scores are: opt bits E(32554) CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 512) 3429 755.3 3.8e-218 CCDS10163.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 518) 2491 551.2 9.9e-157 CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 ( 501) 2438 539.7 2.8e-153 CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 497) 2435 539.1 4.4e-153 CCDS9155.1 ALDH2 gene_id:217|Hs108|chr12 ( 517) 2254 499.7 3.3e-141 CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 ( 517) 2193 486.4 3.2e-137 CCDS45266.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 422) 2170 481.4 8.6e-136 CCDS76794.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 405) 1902 423.1 2.9e-118 CCDS55885.1 ALDH2 gene_id:217|Hs108|chr12 ( 470) 1848 411.4 1.1e-114 CCDS31891.1 ALDH1L2 gene_id:160428|Hs108|chr12 ( 923) 1544 345.3 1.7e-94 CCDS58850.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 801) 1522 340.5 4.2e-93 CCDS3034.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 902) 1522 340.5 4.6e-93 CCDS58851.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 912) 1522 340.5 4.7e-93 CCDS10164.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 480) 1271 285.9 7.1e-77 CCDS1250.2 ALDH9A1 gene_id:223|Hs108|chr1 ( 518) 1127 254.6 2e-67 CCDS5171.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 487) 1122 253.5 4.1e-67 CCDS4555.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 535) 910 207.4 3.4e-53 CCDS9826.1 ALDH6A1 gene_id:4329|Hs108|chr14 ( 535) 768 176.5 6.7e-44 CCDS55057.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 437) 748 172.1 1.1e-42 CCDS4137.2 ALDH7A1 gene_id:501|Hs108|chr5 ( 539) 720 166.0 9.4e-41 CCDS61501.1 ALDH6A1 gene_id:4329|Hs108|chr14 ( 522) 655 151.9 1.6e-36 CCDS5172.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 433) 630 146.4 6e-35 CCDS4556.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 548) 622 144.7 2.5e-34 CCDS11212.1 ALDH3A1 gene_id:218|Hs108|chr17 ( 453) 588 137.3 3.5e-32 CCDS82090.1 ALDH3A1 gene_id:218|Hs108|chr17 ( 380) 553 129.7 5.8e-30 CCDS11210.1 ALDH3A2 gene_id:224|Hs108|chr17 ( 485) 536 126.0 9.5e-29 CCDS32589.1 ALDH3A2 gene_id:224|Hs108|chr17 ( 508) 536 126.0 9.9e-29 CCDS188.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 563) 490 116.0 1.1e-25 CCDS53272.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 503) 473 112.3 1.3e-24 CCDS12766.1 ALDH16A1 gene_id:126133|Hs108|chr19 ( 802) 470 111.7 3.2e-24 CCDS81273.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 512) 403 97.1 5.1e-20 CCDS31622.1 ALDH3B2 gene_id:222|Hs108|chr11 ( 385) 395 95.3 1.3e-19 CCDS73336.1 ALDH3B1 gene_id:221|Hs108|chr11 ( 431) 385 93.1 6.6e-19 CCDS73335.1 ALDH3B1 gene_id:221|Hs108|chr11 ( 468) 385 93.2 7.1e-19 >>CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 (512 aa) initn: 3429 init1: 3429 opt: 3429 Z-score: 4030.0 bits: 755.3 E(32554): 3.8e-218 Smith-Waterman score: 3429; 100.0% identity (100.0% similar) in 512 aa overlap (1-512:1-512) 10 20 30 40 50 60 pF1KB5 MATANGAVENGQPDRKPPALPRPIRNLEVKFTKIFINNEWHESKSGKKFATCNPSTREQI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MATANGAVENGQPDRKPPALPRPIRNLEVKFTKIFINNEWHESKSGKKFATCNPSTREQI 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 CEVEEGDKPDVDKAVEAAQVAFQRGSPWRRLDALSRGRLLHQLADLVERDRATLAALETM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 CEVEEGDKPDVDKAVEAAQVAFQRGSPWRRLDALSRGRLLHQLADLVERDRATLAALETM 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 DTGKPFLHAFFIDLEGCIRTLRYFAGWADKIQGKTIPTDDNVVCFTRHEPIGVCGAITPW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 DTGKPFLHAFFIDLEGCIRTLRYFAGWADKIQGKTIPTDDNVVCFTRHEPIGVCGAITPW 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 NFPLLMLVWKLAPALCCGNTMVLKPAEQTPLTALYLGSLIKEAGFPPGVVNIVPGFGPTV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 NFPLLMLVWKLAPALCCGNTMVLKPAEQTPLTALYLGSLIKEAGFPPGVVNIVPGFGPTV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 GAAISSHPQINKIAFTGSTEVGKLVKEAASRSNLKRVTLELGGKNPCIVCADADLDLAVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 GAAISSHPQINKIAFTGSTEVGKLVKEAASRSNLKRVTLELGGKNPCIVCADADLDLAVE 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 CAHQGVFFNQGQCCTAASRVFVEEQVYSEFVRRSVEYAKKRPVGDPFDVKTEQGPQIDQK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 CAHQGVFFNQGQCCTAASRVFVEEQVYSEFVRRSVEYAKKRPVGDPFDVKTEQGPQIDQK 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 QFDKILELIESGKKEGAKLECGGSAMEDKGLFIKPTVFSEVTDNMRIAKEEIFGPVQPIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 QFDKILELIESGKKEGAKLECGGSAMEDKGLFIKPTVFSEVTDNMRIAKEEIFGPVQPIL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB5 KFKSIEEVIKRANSTDYGLTAAVFTKNLDKALKLASALESGTVWINCYNALYAQAPFGGF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 KFKSIEEVIKRANSTDYGLTAAVFTKNLDKALKLASALESGTVWINCYNALYAQAPFGGF 430 440 450 460 470 480 490 500 510 pF1KB5 KMSGNGRELGEYALAEYTEVKTVTIKLGDKNP :::::::::::::::::::::::::::::::: CCDS10 KMSGNGRELGEYALAEYTEVKTVTIKLGDKNP 490 500 510 >>CCDS10163.1 ALDH1A2 gene_id:8854|Hs108|chr15 (518 aa) initn: 2491 init1: 2491 opt: 2491 Z-score: 2927.3 bits: 551.2 E(32554): 9.9e-157 Smith-Waterman score: 2491; 72.0% identity (91.5% similar) in 492 aa overlap (20-511:26-517) 10 20 30 40 50 pF1KB5 MATANGAVENGQPDRKPPALPRPIRNLEVKFTKIFINNEWHESKSGKKFATCNP :: : :::.:.:::::::::..:.::. : . :: CCDS10 MTSSKIEMPGEVKADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSESGRVFPVYNP 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB5 STREQICEVEEGDKPDVDKAVEAAQVAFQRGSPWRRLDALSRGRLLHQLADLVERDRATL .: ::.:::.:.:: :.::::.::..::. :: :::.:: ::::: .::::::::::.: CCDS10 ATGEQVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVL 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB5 AALETMDTGKPFLHAFFIDLEGCIRTLRYFAGWADKIQGKTIPTDDNVVCFTRHEPIGVC :..:... :::::.::..::.: :.:.::.:::::::.: :::.: . :::::::::: CCDS10 ATMESLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVC 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB5 GAITPWNFPLLMLVWKLAPALCCGNTMVLKPAEQTPLTALYLGSLIKEAGFPPGVVNIVP : : ::::::::..::.:::::::::.:.::::::::.:::.:.:::::::::::.::.: CCDS10 GQIIPWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINILP 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB5 GFGPTVGAAISSHPQINKIAFTGSTEVGKLVKEAASRSNLKRVTLELGGKNPCIVCADAD :.:::.::::.:: :.:::::::::::::..:::.::::::::::::::.: :. :::: CCDS10 GYGPTAGAAIASHIGIDKIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGKSPNIIFADAD 250 260 270 280 290 300 300 310 320 330 340 350 pF1KB5 LDLAVECAHQGVFFNQGQCCTAASRVFVEEQVYSEFVRRSVEYAKKRPVGDPFDVKTEQG :: ::: :::::::::::::::.::.::::..: :::::::: ::.: ::.::: :::: CCDS10 LDYAVEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQG 310 320 330 340 350 360 360 370 380 390 400 410 pF1KB5 PQIDQKQFDKILELIESGKKEGAKLECGGSAMEDKGLFIKPTVFSEVTDNMRIAKEEIFG ::::.::..::::::.:: :::::::::... ::.::.:::::.:::.:::::::::: CCDS10 PQIDKKQYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFG 370 380 390 400 410 420 420 430 440 450 460 470 pF1KB5 PVQPILKFKSIEEVIKRANSTDYGLTAAVFTKNLDKALKLASALESGTVWINCYNALYAQ ::: ::.::...:::.:::..:.::.:::::....::: ..::...::::::::::: :: CCDS10 PVQEILRFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQ 430 440 450 460 470 480 480 490 500 510 pF1KB5 APFGGFKMSGNGRELGEYALAEYTEVKTVTIKLGDKNP .:::::::::::::.::..: ::.::::::.:. .:: CCDS10 SPFGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS 490 500 510 >>CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 (501 aa) initn: 2438 init1: 2438 opt: 2438 Z-score: 2865.2 bits: 539.7 E(32554): 2.8e-153 Smith-Waterman score: 2438; 70.9% identity (89.7% similar) in 494 aa overlap (18-511:7-500) 10 20 30 40 50 60 pF1KB5 MATANGAVENGQPDRKPPALPRPIRNLEVKFTKIFINNEWHESKSGKKFATCNPSTREQI : :: . .:....::::::::::.: ::::: . ::.:.:.. CCDS66 MSSSGTPDLPVLLTDLKIQYTKIFINNEWHDSVSGKKFPVFNPATEEEL 10 20 30 40 70 80 90 100 110 120 pF1KB5 CEVEEGDKPDVDKAVEAAQVAFQRGSPWRRLDALSRGRLLHQLADLVERDRATLAALETM :.:::::: ::::::.::. ::: ::::: .:: :::::..::::.:::: ::..:.: CCDS66 CQVEEGDKEDVDKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRLLLATMESM 50 60 70 80 90 100 130 140 150 160 170 180 pF1KB5 DTGKPFLHAFFIDLEGCIRTLRYFAGWADKIQGKTIPTDDNVVCFTRHEPIGVCGAITPW . :: . .:.. :: :::.:::: :::::::::.::: : : .:::::::::: : :: CCDS66 NGGKLYSNAYLNDLAGCIKTLRYCAGWADKIQGRTIPIDGNFFTYTRHEPIGVCGQIIPW 110 120 130 140 150 160 190 200 210 220 230 240 pF1KB5 NFPLLMLVWKLAPALCCGNTMVLKPAEQTPLTALYLGSLIKEAGFPPGVVNIVPGFGPTV ::::.::.::..::: ::::.:.:::::::::::...::::::::::::::::::.:::. CCDS66 NFPLVMLIWKIGPALSCGNTVVVKPAEQTPLTALHVASLIKEAGFPPGVVNIVPGYGPTA 170 180 190 200 210 220 250 260 270 280 290 300 pF1KB5 GAAISSHPQINKIAFTGSTEVGKLVKEAASRSNLKRVTLELGGKNPCIVCADADLDLAVE ::::::: .:.:.:::::::::::.::::..:::::::::::::.:::: :::::: ::: CCDS66 GAAISSHMDIDKVAFTGSTEVGKLIKEAAGKSNLKRVTLELGGKSPCIVLADADLDNAVE 230 240 250 260 270 280 310 320 330 340 350 360 pF1KB5 CAHQGVFFNQGQCCTAASRVFVEEQVYSEFVRRSVEYAKKRPVGDPFDVKTEQGPQIDQK ::.:::..::::: ::::.::::..:.:::::::: ::: .:.:. . ::::::.. CCDS66 FAHHGVFYHQGQCCIAASRIFVEESIYDEFVRRSVERAKKYILGNPLTPGVTQGPQIDKE 290 300 310 320 330 340 370 380 390 400 410 420 pF1KB5 QFDKILELIESGKKEGAKLECGGSAMEDKGLFIKPTVFSEVTDNMRIAKEEIFGPVQPIL :.::::.::::::::::::::::. .:: :..:::::.:::.::::::::::::: :. CCDS66 QYDKILDLIESGKKEGAKLECGGGPWGNKGYFVQPTVFSNVTDEMRIAKEEIFGPVQQIM 350 360 370 380 390 400 430 440 450 460 470 480 pF1KB5 KFKSIEEVIKRANSTDYGLTAAVFTKNLDKALKLASALESGTVWINCYNALYAQAPFGGF ::::...::::::.: :::.:.::::..:::. ..:::..::::.:::... :: ::::: CCDS66 KFKSLDDVIKRANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNCYGVVSAQCPFGGF 410 420 430 440 450 460 490 500 510 pF1KB5 KMSGNGRELGEYALAEYTEVKTVTIKLGDKNP ::::::::::::.. :::::::::.:...:: CCDS66 KMSGNGRELGEYGFHEYTEVKTVTVKISQKNS 470 480 490 500 >>CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 (497 aa) initn: 2435 init1: 2435 opt: 2435 Z-score: 2861.7 bits: 539.1 E(32554): 4.4e-153 Smith-Waterman score: 2435; 71.6% identity (91.5% similar) in 483 aa overlap (29-511:14-496) 10 20 30 40 50 60 pF1KB5 MATANGAVENGQPDRKPPALPRPIRNLEVKFTKIFINNEWHESKSGKKFATCNPSTREQI .:. :::::::..:.::. : . ::.: ::. CCDS55 MKNQCETVWLKSPIKLKLIFINNEWQNSESGRVFPVYNPATGEQV 10 20 30 40 70 80 90 100 110 120 pF1KB5 CEVEEGDKPDVDKAVEAAQVAFQRGSPWRRLDALSRGRLLHQLADLVERDRATLAALETM :::.:.:: :.::::.::..::. :: :::.:: ::::: .::::::::::.::..:.. CCDS55 CEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVLATMESL 50 60 70 80 90 100 130 140 150 160 170 180 pF1KB5 DTGKPFLHAFFIDLEGCIRTLRYFAGWADKIQGKTIPTDDNVVCFTRHEPIGVCGAITPW . :::::.::..::.: :.:.::.:::::::.: :::.: . ::::::::::: : :: CCDS55 NGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVCGQIIPW 110 120 130 140 150 160 190 200 210 220 230 240 pF1KB5 NFPLLMLVWKLAPALCCGNTMVLKPAEQTPLTALYLGSLIKEAGFPPGVVNIVPGFGPTV ::::::..::.:::::::::.:.::::::::.:::.:.:::::::::::.::.::.:::. CCDS55 NFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINILPGYGPTA 170 180 190 200 210 220 250 260 270 280 290 300 pF1KB5 GAAISSHPQINKIAFTGSTEVGKLVKEAASRSNLKRVTLELGGKNPCIVCADADLDLAVE ::::.:: :.:::::::::::::..:::.::::::::::::::.: :. :::::: ::: CCDS55 GAAIASHIGIDKIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGKSPNIIFADADLDYAVE 230 240 250 260 270 280 310 320 330 340 350 360 pF1KB5 CAHQGVFFNQGQCCTAASRVFVEEQVYSEFVRRSVEYAKKRPVGDPFDVKTEQGPQIDQK :::::::::::::::.::.::::..: :::::::: ::.: ::.::: ::::::::.: CCDS55 QAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQGPQIDKK 290 300 310 320 330 340 370 380 390 400 410 420 pF1KB5 QFDKILELIESGKKEGAKLECGGSAMEDKGLFIKPTVFSEVTDNMRIAKEEIFGPVQPIL :..::::::.:: :::::::::... ::.::.:::::.:::.::::::::::::: :: CCDS55 QYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFGPVQEIL 350 360 370 380 390 400 430 440 450 460 470 480 pF1KB5 KFKSIEEVIKRANSTDYGLTAAVFTKNLDKALKLASALESGTVWINCYNALYAQAPFGGF .::...:::.:::..:.::.:::::....::: ..::...::::::::::: ::.::::: CCDS55 RFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQSPFGGF 410 420 430 440 450 460 490 500 510 pF1KB5 KMSGNGRELGEYALAEYTEVKTVTIKLGDKNP ::::::::.::..: ::.::::::.:. .:: CCDS55 KMSGNGREMGEFGLREYSEVKTVTVKIPQKNS 470 480 490 >>CCDS9155.1 ALDH2 gene_id:217|Hs108|chr12 (517 aa) initn: 2236 init1: 2236 opt: 2254 Z-score: 2648.7 bits: 499.7 E(32554): 3.3e-141 Smith-Waterman score: 2254; 66.1% identity (86.4% similar) in 493 aa overlap (19-511:24-516) 10 20 30 40 50 pF1KB5 MATANGAVENGQPDRKPPALPRPIRNLEVKFTKIFINNEWHESKSGKKFATCNPS :.: : .. :: ..::::::::.. : : : : ::: CCDS91 MLRAAARFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNPS 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB5 TREQICEVEEGDKPDVDKAVEAAQVAFQRGSPWRRLDALSRGRLLHQLADLVERDRATLA : : ::.: :::: ::::::.::..::: ::::::.:: :::::..::::.::::. :: CCDS91 TGEVICQVAEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIERDRTYLA 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB5 ALETMDTGKPFLHAFFIDLEGCIRTLRYFAGWADKIQGKTIPTDDNVVCFTRHEPIGVCG ::::.:.:::.. ....::. .. :::.:::::: .::::: : . .:::::.:::: CCDS91 ALETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVCG 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB5 AITPWNFPLLMLVWKLAPALCCGNTMVLKPAEQTPLTALYLGSLIKEAGFPPGVVNIVPG : :::::::: .:::.::: ::..:.: ::::::::::...::::::::::::::::: CCDS91 QIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVPG 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB5 FGPTVGAAISSHPQINKIAFTGSTEVGKLVKEAASRSNLKRVTLELGGKNPCIVCADADL ::::.::::.:: ...:.:::::::.:.... ::. :::::::::::::.: :. .:::. CCDS91 FGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDADM 250 260 270 280 290 300 300 310 320 330 340 350 pF1KB5 DLAVECAHQGVFFNQGQCCTAASRVFVEEQVYSEFVRRSVEYAKKRPVGDPFDVKTEQGP : ::: :: ..:::::::: :.::.::.:..:.:::.::: ::.: ::.::: :::::: CCDS91 DWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFDSKTEQGP 310 320 330 340 350 360 360 370 380 390 400 410 pF1KB5 QIDQKQFDKILELIESGKKEGAKLECGGSAMEDKGLFIKPTVFSEVTDNMRIAKEEIFGP :.:. :: ::: :..::.::::: :::. :.: ::.::::..: :.: ::::::::: CCDS91 QVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIAKEEIFGP 370 380 390 400 410 420 420 430 440 450 460 470 pF1KB5 VQPILKFKSIEEVIKRANSTDYGLTAAVFTKNLDKALKLASALESGTVWINCYNALYAQA :. :::::.::::. :::.. :::.::::::.:::: :..::..::::.:::... ::. CCDS91 VMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQS 430 440 450 460 470 480 480 490 500 510 pF1KB5 PFGGFKMSGNGRELGEYALAEYTEVKTVTIKLGDKNP ::::.::::.:::::::.: ::::::::.:. .:: CCDS91 PFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS 490 500 510 >>CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 (517 aa) initn: 2193 init1: 2193 opt: 2193 Z-score: 2577.0 bits: 486.4 E(32554): 3.2e-137 Smith-Waterman score: 2193; 64.3% identity (86.2% similar) in 493 aa overlap (19-511:24-516) 10 20 30 40 50 pF1KB5 MATANGAVENGQPDRKPPALPRPIRNLEVKFTKIFINNEWHESKSGKKFATCNPS ::: :: : .. ....::::::... : : : : ::. CCDS66 MLRFLAPRLLSLQGRTARYSSAAALPSPILNPDIPYNQLFINNEWQDAVSKKTFPTVNPT 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB5 TREQICEVEEGDKPDVDKAVEAAQVAFQRGSPWRRLDALSRGRLLHQLADLVERDRATLA : : : .: :::. :::.::.::. ::. ::::::.:: :::::..:::::::::. :: CCDS66 TGEVIGHVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNRLADLVERDRVYLA 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB5 ALETMDTGKPFLHAFFIDLEGCIRTLRYFAGWADKIQGKTIPTDDNVVCFTRHEPIGVCG .:::.:.:::: ... .::. :.. ::::::::: .::::: : . :::::::.:::: CCDS66 SLETLDNGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIPMDGQHFCFTRHEPVGVCG 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB5 AITPWNFPLLMLVWKLAPALCCGNTMVLKPAEQTPLTALYLGSLIKEAGFPPGVVNIVPG : ::::::.: ::::::: :::.:.: ::::::.::::.:::::::::::::::. : CCDS66 QIIPWNFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIKEAGFPPGVVNIITG 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB5 FGPTVGAAISSHPQINKIAFTGSTEVGKLVKEAASRSNLKRVTLELGGKNPCIVCADADL .:::.::::..: ...:.:::::::::.:...::. :::::::::::::.: :: ::::. CCDS66 YGPTAGAAIAQHVDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSIVLADADM 250 260 270 280 290 300 300 310 320 330 340 350 pF1KB5 DLAVECAHQGVFFNQGQCCTAASRVFVEEQVYSEFVRRSVEYAKKRPVGDPFDVKTEQGP . ::: :...:::.:::: :.::.::::..:.::..:.:: ::.: ::.::.. :.::: CCDS66 EHAVEQCHEALFFNMGQCCCAGSRTFVEESIYNEFLERTVEKAKQRKVGNPFELDTQQGP 310 320 330 340 350 360 360 370 380 390 400 410 pF1KB5 QIDQKQFDKILELIESGKKEGAKLECGGSAMEDKGLFIKPTVFSEVTDNMRIAKEEIFGP :.:..::...: :. :.:::::: ::: . ..:.:::::::. : :.::::::::::: CCDS66 QVDKEQFERVLGYIQLGQKEGAKLLCGGERFGERGFFIKPTVFGGVQDDMRIAKEEIFGP 370 380 390 400 410 420 420 430 440 450 460 470 pF1KB5 VQPILKFKSIEEVIKRANSTDYGLTAAVFTKNLDKALKLASALESGTVWINCYNALYAQA :::..:::.::::..:::.: :::.:::::..::::. ...::..::::.: :: . .. CCDS66 VQPLFKFKKIEEVVERANNTRYGLAAAVFTRDLDKAMYFTQALQAGTVWVNTYNIVTCHT 430 440 450 460 470 480 480 490 500 510 pF1KB5 PFGGFKMSGNGRELGEYALAEYTEVKTVTIKLGDKNP :::::: ::::::::: .: ::::::::::. .:: CCDS66 PFGGFKESGNGRELGEDGLKAYTEVKTVTIKVPQKNS 490 500 510 >>CCDS45266.1 ALDH1A2 gene_id:8854|Hs108|chr15 (422 aa) initn: 2170 init1: 2170 opt: 2170 Z-score: 2551.4 bits: 481.4 E(32554): 8.6e-136 Smith-Waterman score: 2170; 73.4% identity (92.4% similar) in 421 aa overlap (91-511:1-421) 70 80 90 100 110 120 pF1KB5 CEVEEGDKPDVDKAVEAAQVAFQRGSPWRRLDALSRGRLLHQLADLVERDRATLAALETM .:: ::::: .::::::::::.::..:.. CCDS45 MDASERGRLLDKLADLVERDRAVLATMESL 10 20 30 130 140 150 160 170 180 pF1KB5 DTGKPFLHAFFIDLEGCIRTLRYFAGWADKIQGKTIPTDDNVVCFTRHEPIGVCGAITPW . :::::.::..::.: :.:.::.:::::::.: :::.: . ::::::::::: : :: CCDS45 NGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVCGQIIPW 40 50 60 70 80 90 190 200 210 220 230 240 pF1KB5 NFPLLMLVWKLAPALCCGNTMVLKPAEQTPLTALYLGSLIKEAGFPPGVVNIVPGFGPTV ::::::..::.:::::::::.:.::::::::.:::.:.:::::::::::.::.::.:::. CCDS45 NFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINILPGYGPTA 100 110 120 130 140 150 250 260 270 280 290 300 pF1KB5 GAAISSHPQINKIAFTGSTEVGKLVKEAASRSNLKRVTLELGGKNPCIVCADADLDLAVE ::::.:: :.:::::::::::::..:::.::::::::::::::.: :. :::::: ::: CCDS45 GAAIASHIGIDKIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGKSPNIIFADADLDYAVE 160 170 180 190 200 210 310 320 330 340 350 360 pF1KB5 CAHQGVFFNQGQCCTAASRVFVEEQVYSEFVRRSVEYAKKRPVGDPFDVKTEQGPQIDQK :::::::::::::::.::.::::..: :::::::: ::.: ::.::: ::::::::.: CCDS45 QAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQGPQIDKK 220 230 240 250 260 270 370 380 390 400 410 420 pF1KB5 QFDKILELIESGKKEGAKLECGGSAMEDKGLFIKPTVFSEVTDNMRIAKEEIFGPVQPIL :..::::::.:: :::::::::... ::.::.:::::.:::.::::::::::::: :: CCDS45 QYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFGPVQEIL 280 290 300 310 320 330 430 440 450 460 470 480 pF1KB5 KFKSIEEVIKRANSTDYGLTAAVFTKNLDKALKLASALESGTVWINCYNALYAQAPFGGF .::...:::.:::..:.::.:::::....::: ..::...::::::::::: ::.::::: CCDS45 RFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQSPFGGF 340 350 360 370 380 390 490 500 510 pF1KB5 KMSGNGRELGEYALAEYTEVKTVTIKLGDKNP ::::::::.::..: ::.::::::.:. .:: CCDS45 KMSGNGREMGEFGLREYSEVKTVTVKIPQKNS 400 410 420 >>CCDS76794.1 ALDH1A3 gene_id:220|Hs108|chr15 (405 aa) initn: 1902 init1: 1902 opt: 1902 Z-score: 2236.7 bits: 423.1 E(32554): 2.9e-118 Smith-Waterman score: 2454; 79.1% identity (79.1% similar) in 512 aa overlap (1-512:1-405) 10 20 30 40 50 60 pF1KB5 MATANGAVENGQPDRKPPALPRPIRNLEVKFTKIFINNEWHESKSGKKFATCNPSTREQI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 MATANGAVENGQPDRKPPALPRPIRNLEVKFTKIFINNEWHESKSGKKFATCNPSTREQI 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 CEVEEGDKPDVDKAVEAAQVAFQRGSPWRRLDALSRGRLLHQLADLVERDRATLAALETM :::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 CEVEEGDKPDVDKAVEAAQVAFQRGSPWRRLDALSRGRLLHQLADLVERDRATLAA---- 70 80 90 100 110 130 140 150 160 170 180 pF1KB5 DTGKPFLHAFFIDLEGCIRTLRYFAGWADKIQGKTIPTDDNVVCFTRHEPIGVCGAITPW CCDS76 ------------------------------------------------------------ 190 200 210 220 230 240 pF1KB5 NFPLLMLVWKLAPALCCGNTMVLKPAEQTPLTALYLGSLIKEAGFPPGVVNIVPGFGPTV ::::::::::::::::: CCDS76 -------------------------------------------GFPPGVVNIVPGFGPTV 120 130 250 260 270 280 290 300 pF1KB5 GAAISSHPQINKIAFTGSTEVGKLVKEAASRSNLKRVTLELGGKNPCIVCADADLDLAVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 GAAISSHPQINKIAFTGSTEVGKLVKEAASRSNLKRVTLELGGKNPCIVCADADLDLAVE 140 150 160 170 180 190 310 320 330 340 350 360 pF1KB5 CAHQGVFFNQGQCCTAASRVFVEEQVYSEFVRRSVEYAKKRPVGDPFDVKTEQGPQIDQK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 CAHQGVFFNQGQCCTAASRVFVEEQVYSEFVRRSVEYAKKRPVGDPFDVKTEQGPQIDQK 200 210 220 230 240 250 370 380 390 400 410 420 pF1KB5 QFDKILELIESGKKEGAKLECGGSAMEDKGLFIKPTVFSEVTDNMRIAKEEIFGPVQPIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 QFDKILELIESGKKEGAKLECGGSAMEDKGLFIKPTVFSEVTDNMRIAKEEIFGPVQPIL 260 270 280 290 300 310 430 440 450 460 470 480 pF1KB5 KFKSIEEVIKRANSTDYGLTAAVFTKNLDKALKLASALESGTVWINCYNALYAQAPFGGF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 KFKSIEEVIKRANSTDYGLTAAVFTKNLDKALKLASALESGTVWINCYNALYAQAPFGGF 320 330 340 350 360 370 490 500 510 pF1KB5 KMSGNGRELGEYALAEYTEVKTVTIKLGDKNP :::::::::::::::::::::::::::::::: CCDS76 KMSGNGRELGEYALAEYTEVKTVTIKLGDKNP 380 390 400 >>CCDS55885.1 ALDH2 gene_id:217|Hs108|chr12 (470 aa) initn: 1996 init1: 1843 opt: 1848 Z-score: 2172.1 bits: 411.4 E(32554): 1.1e-114 Smith-Waterman score: 1924; 59.2% identity (77.9% similar) in 493 aa overlap (19-511:24-469) 10 20 30 40 50 pF1KB5 MATANGAVENGQPDRKPPALPRPIRNLEVKFTKIFINNEWHESKSGKKFATCNPS :.: : .. :: ..::::::::.. : : : : ::: CCDS55 MLRAAARFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNPS 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB5 TREQICEVEEGDKPDVDKAVEAAQVAFQRGSPWRRLDALSRGRLLHQLADLVERDRATLA : : ::.: :::: CCDS55 TGEVICQVAEGDK----------------------------------------------- 70 120 130 140 150 160 170 pF1KB5 ALETMDTGKPFLHAFFIDLEGCIRTLRYFAGWADKIQGKTIPTDDNVVCFTRHEPIGVCG ::::.:.:::.. ....::. .. :::.:::::: .::::: : . .:::::.:::: CCDS55 ALETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVCG 80 90 100 110 120 130 180 190 200 210 220 230 pF1KB5 AITPWNFPLLMLVWKLAPALCCGNTMVLKPAEQTPLTALYLGSLIKEAGFPPGVVNIVPG : :::::::: .:::.::: ::..:.: ::::::::::...::::::::::::::::: CCDS55 QIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVPG 140 150 160 170 180 190 240 250 260 270 280 290 pF1KB5 FGPTVGAAISSHPQINKIAFTGSTEVGKLVKEAASRSNLKRVTLELGGKNPCIVCADADL ::::.::::.:: ...:.:::::::.:.... ::. :::::::::::::.: :. .:::. CCDS55 FGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDADM 200 210 220 230 240 250 300 310 320 330 340 350 pF1KB5 DLAVECAHQGVFFNQGQCCTAASRVFVEEQVYSEFVRRSVEYAKKRPVGDPFDVKTEQGP : ::: :: ..:::::::: :.::.::.:..:.:::.::: ::.: ::.::: :::::: CCDS55 DWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFDSKTEQGP 260 270 280 290 300 310 360 370 380 390 400 410 pF1KB5 QIDQKQFDKILELIESGKKEGAKLECGGSAMEDKGLFIKPTVFSEVTDNMRIAKEEIFGP :.:. :: ::: :..::.::::: :::. :.: ::.::::..: :.: ::::::::: CCDS55 QVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIAKEEIFGP 320 330 340 350 360 370 420 430 440 450 460 470 pF1KB5 VQPILKFKSIEEVIKRANSTDYGLTAAVFTKNLDKALKLASALESGTVWINCYNALYAQA :. :::::.::::. :::.. :::.::::::.:::: :..::..::::.:::... ::. CCDS55 VMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQS 380 390 400 410 420 430 480 490 500 510 pF1KB5 PFGGFKMSGNGRELGEYALAEYTEVKTVTIKLGDKNP ::::.::::.:::::::.: ::::::::.:. .:: CCDS55 PFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS 440 450 460 470 >>CCDS31891.1 ALDH1L2 gene_id:160428|Hs108|chr12 (923 aa) initn: 1532 init1: 929 opt: 1544 Z-score: 1809.9 bits: 345.3 E(32554): 1.7e-94 Smith-Waterman score: 1544; 47.8% identity (74.5% similar) in 494 aa overlap (20-506:430-922) 10 20 30 40 pF1KB5 MATANGAVENGQPDRKPPALPRPIRNLEVKFT-KIFINNEWHESKSGKK . . . .. ::. . :::... .. .:: CCDS31 YMATKFEGFIQKVVRKLRGEDQEVELVVDYISKEVNEIMVKMPYQCFINGQFTDADDGKT 400 410 420 430 440 450 50 60 70 80 90 100 pF1KB5 FATCNPSTREQICEVEEGDKPDVDKAVEAAQVAFQRGSPWRRLDALSRGRLLHQLADLVE . : ::. ::.: .. :::::: ::. ::. : : :..: ::::...::::.: CCDS31 YDTINPTDGSTICKVSYASLADVDKAVAAAKDAFENGE-WGRMNARERGRLMYRLADLLE 460 470 480 490 500 510 110 120 130 140 150 160 pF1KB5 RDRATLAALETMDTGKPFLHAFFIDLEGCIRTLRYFAGWADKIQGKTIPTD----DNVVC ... ::..:..:.: . :. . ..:.:::::: :::::.::: . . . CCDS31 ENQEELATIEALDSGAVYTLALKTHIGMSVQTFRYFAGWCDKIQGSTIPINQARPNRNLT 520 530 540 550 560 570 170 180 190 200 210 220 pF1KB5 FTRHEPIGVCGAITPWNFPLLMLVWKLAPALCCGNTMVLKPAEQTPLTALYLGSLIKEAG ::..::.:::. : :::.::.::.:: : : :::.:::::. :::::: .. : .:: CCDS31 FTKKEPLGVCAIIIPWNYPLMMLAWKSAACLAAGNTLVLKPAQVTPLTALKFAELSVKAG 580 590 600 610 620 630 230 240 250 260 270 280 pF1KB5 FPPGVVNIVPGFGPTVGAAISSHPQINKIAFTGSTEVGKLVKEAASRSNLKRVTLELGGK :: ::.::.:: : .: .: ::.: :..::::: .:: . .. . ::::.:.:::::: CCDS31 FPKGVINIIPGSGGIAGQRLSEHPDIRKLGFTGSTPIGKQIMKSCAVSNLKKVSLELGGK 640 650 660 670 680 690 290 300 310 320 330 340 pF1KB5 NPCIVCADADLDLAVECAHQGVFFNQGQCCTAASRVFVEEQVYSEFVRRSVEYAKKRPVG .: :. : .:: ::. . .::::.:. : ::.:.::::....::: : :: :: .: CCDS31 SPLIIFNDCELDKAVRMGMGAVFFNKGENCIAAGRLFVEESIHDEFVTRVVEEIKKMKIG 700 710 720 730 740 750 350 360 370 380 390 400 pF1KB5 DPFDVKTEQGPQIDQKQFDKILELIESGKKEGAKLECGGSAMEDKGLFIKPTVFSEVTDN ::.: .:..::: . ...:.:. :.: :::: : :: .. :.:..::::..: : CCDS31 DPLDRSTDHGPQNHKAHLEKLLQYCETGVKEGATLVYGGRQVQRPGFFMEPTVFTDVEDY 760 770 780 790 800 810 410 420 430 440 450 460 pF1KB5 MRIAKEEIFGPVQPILKFKS--IEEVIKRANSTDYGLTAAVFTKNLDKALKLASALESGT : .:::: :::.. : ::.. :. :..:::::.:::...:::....::. .. ::.:: CCDS31 MYLAKEESFGPIMVISKFQNGDIDGVLQRANSTEYGLASGVFTRDINKAMYVSEKLEAGT 820 830 840 850 860 870 470 480 490 500 510 pF1KB5 VWINCYNALYAQAPFGGFKMSGNGRELGEYALAEYTEVKTVTIKLGDKNP :.:: :: . ::::: :.:: :..::: :: :: ..::::.. CCDS31 VFINTYNKTDVAAPFGGVKQSGFGKDLGEEALNEYLKTKTVTLEY 880 890 900 910 920 512 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 17:49:26 2016 done: Thu Nov 3 17:49:26 2016 Total Scan time: 2.770 Total Display time: 0.080 Function used was FASTA [36.3.4 Apr, 2011]