FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2363, 517 aa 1>>>pF1KE2363 517 - 517 aa - 517 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.7588+/-0.000987; mu= 15.2416+/- 0.059 mean_var=64.6465+/-12.870, 0's: 0 Z-trim(104.4): 40 B-trim: 53 in 1/48 Lambda= 0.159515 statistics sampled from 7832 (7872) to 7832 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.613), E-opt: 0.2 (0.242), width: 16 Scan time: 2.180 The best scores are: opt bits E(32554) CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 ( 517) 3451 803.3 0 CCDS9155.1 ALDH2 gene_id:217|Hs108|chr12 ( 517) 2560 598.3 7e-171 CCDS10163.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 518) 2349 549.7 2.9e-156 CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 497) 2307 540.0 2.3e-153 CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 ( 501) 2245 525.8 4.5e-149 CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 512) 2190 513.1 3e-145 CCDS45266.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 422) 2058 482.7 3.5e-136 CCDS55885.1 ALDH2 gene_id:217|Hs108|chr12 ( 470) 2048 480.4 1.9e-135 CCDS31891.1 ALDH1L2 gene_id:160428|Hs108|chr12 ( 923) 1543 364.3 3.4e-100 CCDS58850.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 801) 1533 362.0 1.5e-99 CCDS3034.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 902) 1533 362.0 1.6e-99 CCDS58851.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 912) 1533 362.0 1.7e-99 CCDS76794.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 405) 1307 309.9 3.6e-84 CCDS1250.2 ALDH9A1 gene_id:223|Hs108|chr1 ( 518) 1236 293.6 3.7e-79 CCDS10164.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 480) 1180 280.7 2.6e-75 CCDS5171.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 487) 1117 266.2 6.1e-71 CCDS4555.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 535) 910 218.5 1.5e-56 CCDS9826.1 ALDH6A1 gene_id:4329|Hs108|chr14 ( 535) 753 182.4 1.1e-45 CCDS4137.2 ALDH7A1 gene_id:501|Hs108|chr5 ( 539) 750 181.7 1.8e-45 CCDS55057.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 437) 726 176.2 6.8e-44 CCDS61501.1 ALDH6A1 gene_id:4329|Hs108|chr14 ( 522) 643 157.1 4.5e-38 CCDS5172.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 433) 611 149.7 6.2e-36 CCDS4556.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 548) 580 142.6 1.1e-33 CCDS12766.1 ALDH16A1 gene_id:126133|Hs108|chr19 ( 802) 511 126.8 9.3e-29 CCDS188.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 563) 489 121.7 2.2e-27 CCDS53272.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 503) 485 120.7 3.8e-27 CCDS11210.1 ALDH3A2 gene_id:224|Hs108|chr17 ( 485) 472 117.7 3e-26 CCDS32589.1 ALDH3A2 gene_id:224|Hs108|chr17 ( 508) 472 117.7 3.1e-26 CCDS11212.1 ALDH3A1 gene_id:218|Hs108|chr17 ( 453) 391 99.1 1.1e-20 CCDS82090.1 ALDH3A1 gene_id:218|Hs108|chr17 ( 380) 354 90.6 3.5e-18 CCDS81273.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 512) 343 88.1 2.7e-17 CCDS31622.1 ALDH3B2 gene_id:222|Hs108|chr11 ( 385) 331 85.3 1.4e-16 CCDS73335.1 ALDH3B1 gene_id:221|Hs108|chr11 ( 468) 327 84.4 3.2e-16 CCDS73336.1 ALDH3B1 gene_id:221|Hs108|chr11 ( 431) 303 78.8 1.4e-14 CCDS46141.1 ALDH16A1 gene_id:126133|Hs108|chr19 ( 751) 273 72.0 2.7e-12 >>CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 (517 aa) initn: 3451 init1: 3451 opt: 3451 Z-score: 4289.5 bits: 803.3 E(32554): 0 Smith-Waterman score: 3451; 99.6% identity (99.8% similar) in 517 aa overlap (1-517:1-517) 10 20 30 40 50 60 pF1KE2 MLRFLAPRLLSLQGRTARYSSAAALPSPILNPDIPYNQLFINNEWQDAVSKKTFPTVNPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 MLRFLAPRLLSLQGRTARYSSAAALPSPILNPDIPYNQLFINNEWQDAVSKKTFPTVNPT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 TGEVIGHVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNLLADLVERDRVYLA :::::::::::::::::::::::::::::::::::::::::::::: ::::::::::::: CCDS66 TGEVIGHVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNRLADLVERDRVYLA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 SLETLDNGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIPMDGQHFCFTRHEPVGVCG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 SLETLDNGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIPMDGQHFCFTRHEPVGVCG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 QIIPWNFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIKEAGFPPGVVNIITG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 QIIPWNFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIKEAGFPPGVVNIITG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 YGPTAGAAIAQHMDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSIVLADADM ::::::::::::.::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 YGPTAGAAIAQHVDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSIVLADADM 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 EHAVEQCHEALFFNMGQCCCAGSRTFVEESIYNEFLERTVEKAKQRKVGNPFELDTQQGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 EHAVEQCHEALFFNMGQCCCAGSRTFVEESIYNEFLERTVEKAKQRKVGNPFELDTQQGP 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 QVDKEQFERVLGYIQLGQKEGAKLLCGGERFGERGFFIKPTVFGGVQDDMRIAKEEIFGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 QVDKEQFERVLGYIQLGQKEGAKLLCGGERFGERGFFIKPTVFGGVQDDMRIAKEEIFGP 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 VQPLFKFKKIEEVVERANNTRYGLAAAVFTRDLDKAMYFTQALQAGTVWVNTYNIVTCHT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 VQPLFKFKKIEEVVERANNTRYGLAAAVFTRDLDKAMYFTQALQAGTVWVNTYNIVTCHT 430 440 450 460 470 480 490 500 510 pF1KE2 PFGGFKESGNGRELGEDGLKAYTEVKTVTIKVPQKNS ::::::::::::::::::::::::::::::::::::: CCDS66 PFGGFKESGNGRELGEDGLKAYTEVKTVTIKVPQKNS 490 500 510 >>CCDS9155.1 ALDH2 gene_id:217|Hs108|chr12 (517 aa) initn: 2556 init1: 2556 opt: 2560 Z-score: 3181.3 bits: 598.3 E(32554): 7e-171 Smith-Waterman score: 2560; 73.4% identity (89.0% similar) in 518 aa overlap (3-517:7-517) 10 20 30 40 50 pF1KE2 MLRFLAPRLLSLQGRTARYSSAAA---LPSPILNPDIPYNQLFINNEWQDAVSKKT :: .::: :: : :::: .:.: .:.. ::.::::::.::::.:: CCDS91 MLRAAARF-GPRL----GR--RLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKT 10 20 30 40 50 60 70 80 90 100 110 pF1KE2 FPTVNPTTGEVIGHVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNLLADLVE ::::::.::::: .:::::. :::.:::::: ::.:::::::::::.:::::: ::::.: CCDS91 FPTVNPSTGEVICQVAEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIE 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE2 RDRVYLASLETLDNGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIPMDGQHFCFTRH :::.:::.:::::::::. :: .::: :.: ::.::::::.::::::.::. : .::: CCDS91 RDRTYLAALETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRH 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 EPVGVCGQIIPWNFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIKEAGFPPG ::::::::::::::::.::.:::.:::::::.:::::::::::.:::.:.:::::::::: CCDS91 EPVGVCGQIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPG 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 VVNIITGYGPTAGAAIAQHMDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSI ::::. :.:::::::::.: ::::::::::::.:..:: :::.:::::::::::::::.: CCDS91 VVNIVPGFGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNI 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE2 VLADADMEHAVEQCHEALFFNMGQCCCAGSRTFVEESIYNEFLERTVEKAKQRKVGNPFE ...::::. :::: : :::::.::::::::::::.:.::.::.::.: .::.: :::::. CCDS91 IMSDADMDWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFD 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE2 LDTQQGPQVDKEQFERVLGYIQLGQKEGAKLLCGGERFGERGFFIKPTVFGGVQDDMRIA :.::::::. ::...::::. :..::::::::: ..::.::.::::: ::: : :: CCDS91 SKTEQGPQVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIA 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE2 KEEIFGPVQPLFKFKKIEEVVERANNTRYGLAAAVFTRDLDKAMYFTQALQAGTVWVNTY ::::::::. ..::: ::::: ::::. :::::::::.::::: :..::::::::::: : CCDS91 KEEIFGPVMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCY 420 430 440 450 460 470 480 490 500 510 pF1KE2 NIVTCHTPFGGFKESGNGRELGEDGLKAYTEVKTVTIKVPQKNS .. ..::::.: ::.:::::: ::.:::::::::.::::::: CCDS91 DVFGAQSPFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS 480 490 500 510 >>CCDS10163.1 ALDH1A2 gene_id:8854|Hs108|chr15 (518 aa) initn: 2347 init1: 2347 opt: 2349 Z-score: 2918.9 bits: 549.7 E(32554): 2.9e-156 Smith-Waterman score: 2349; 66.5% identity (88.4% similar) in 501 aa overlap (17-517:18-518) 10 20 30 40 50 pF1KE2 MLRFLAPRLLSLQGRTARYSSAAALPSPILNPDIPYNQLFINNEWQDAVSKKTFPTVNP : ..: :::: : .: :...:::::::.. : ..::. :: CCDS10 MTSSKIEMPGEVKADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSESGRVFPVYNP 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE2 TTGEVIGHVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNLLADLVERDRVYL .::: . .: :.:.::.:.::.::: :: ::: :::::::::::::. :::::::::. : CCDS10 ATGEQVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVL 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE2 ASLETLDNGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIPMDGQHFCFTRHEPVGVC :..:.:..:::: ... .::. :::..::.:::::: :: :::.::..: ::::::.::: CCDS10 ATMESLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVC 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE2 GQIIPWNFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIKEAGFPPGVVNIIT ::::::::::.: .::.:::: :::::.: ::::::::::...:::::::::::.::. CCDS10 GQIIPWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINILP 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE2 GYGPTAGAAIAQHMDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSIVLADAD :::::::::::.:. .::.:::::::::.:::.::: :::::::::::::::.:..:::: CCDS10 GYGPTAGAAIASHIGIDKIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGKSPNIIFADAD 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE2 MEHAVEQCHEALFFNMGQCCCAGSRTFVEESIYNEFLERTVEKAKQRKVGNPFELDTQQG ...:::: :...:::.:::: :::: :::::::.::..:.::.::.: ::.::. :.:: CCDS10 LDYAVEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQG 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE2 PQVDKEQFERVLGYIQLGQKEGAKLLCGGERFGERGFFIKPTVFGGVQDDMRIAKEEIFG ::.::.:....: :: : ::::: :::. .:..::::.::::..: :::::::::::: CCDS10 PQIDKKQYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFG 370 380 390 400 410 420 420 430 440 450 460 470 pF1KE2 PVQPLFKFKKIEEVVERANNTRYGLAAAVFTRDLDKAMYFTQALQAGTVWVNTYNIVTCH ::: ...:: ..::.:::::. .::.::::: :..::. ..:.::::::.: :: .. . CCDS10 PVQEILRFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQ 430 440 450 460 470 480 480 490 500 510 pF1KE2 TPFGGFKESGNGRELGEDGLKAYTEVKTVTIKVPQKNS .:::::: ::::::.:: ::. :.::::::.:.::::: CCDS10 SPFGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS 490 500 510 >>CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 (497 aa) initn: 2307 init1: 2307 opt: 2307 Z-score: 2866.9 bits: 540.0 E(32554): 2.3e-153 Smith-Waterman score: 2307; 66.8% identity (88.7% similar) in 488 aa overlap (30-517:10-497) 10 20 30 40 50 60 pF1KE2 MLRFLAPRLLSLQGRTARYSSAAALPSPILNPDIPYNQLFINNEWQDAVSKKTFPTVNPT :. : . .:::::::.. : ..::. ::. CCDS55 MKNQCETVWLKSPIKLKLIFINNEWQNSESGRVFPVYNPA 10 20 30 40 70 80 90 100 110 120 pF1KE2 TGEVIGHVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNLLADLVERDRVYLA ::: . .: :.:.::.:.::.::: :: ::: :::::::::::::. :::::::::. :: CCDS55 TGEQVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVLA 50 60 70 80 90 100 130 140 150 160 170 180 pF1KE2 SLETLDNGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIPMDGQHFCFTRHEPVGVCG ..:.:..:::: ... .::. :::..::.:::::: :: :::.::..: ::::::.:::: CCDS55 TMESLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVCG 110 120 130 140 150 160 190 200 210 220 230 240 pF1KE2 QIIPWNFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIKEAGFPPGVVNIITG :::::::::.: .::.:::: :::::.: ::::::::::...:::::::::::.::. : CCDS55 QIIPWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINILPG 170 180 190 200 210 220 250 260 270 280 290 300 pF1KE2 YGPTAGAAIAQHMDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSIVLADADM ::::::::::.:. .::.:::::::::.:::.::: :::::::::::::::.:..::::. CCDS55 YGPTAGAAIASHIGIDKIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGKSPNIIFADADL 230 240 250 260 270 280 310 320 330 340 350 360 pF1KE2 EHAVEQCHEALFFNMGQCCCAGSRTFVEESIYNEFLERTVEKAKQRKVGNPFELDTQQGP ..:::: :...:::.:::: :::: :::::::.::..:.::.::.: ::.::. :.::: CCDS55 DYAVEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQGP 290 300 310 320 330 340 370 380 390 400 410 420 pF1KE2 QVDKEQFERVLGYIQLGQKEGAKLLCGGERFGERGFFIKPTVFGGVQDDMRIAKEEIFGP :.::.:....: :: : ::::: :::. .:..::::.::::..: ::::::::::::: CCDS55 QIDKKQYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFGP 350 360 370 380 390 400 430 440 450 460 470 480 pF1KE2 VQPLFKFKKIEEVVERANNTRYGLAAAVFTRDLDKAMYFTQALQAGTVWVNTYNIVTCHT :: ...:: ..::.:::::. .::.::::: :..::. ..:.::::::.: :: .. .. CCDS55 VQEILRFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQS 410 420 430 440 450 460 490 500 510 pF1KE2 PFGGFKESGNGRELGEDGLKAYTEVKTVTIKVPQKNS :::::: ::::::.:: ::. :.::::::.:.::::: CCDS55 PFGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS 470 480 490 >>CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 (501 aa) initn: 2242 init1: 2242 opt: 2245 Z-score: 2789.8 bits: 525.8 E(32554): 4.5e-149 Smith-Waterman score: 2245; 65.0% identity (87.2% similar) in 500 aa overlap (21-517:2-501) 10 20 30 40 50 pF1KE2 MLRFLAPRLLSLQGRTARYSSAAALPS-PILNPD--IPYNQLFINNEWQDAVSKKTFPTV :... :. :.: : : :...::::::.:.:: : ::. CCDS66 MSSSGTPDLPVLLTDLKIQYTKIFINNEWHDSVSGKKFPVF 10 20 30 40 60 70 80 90 100 110 pF1KE2 NPTTGEVIGHVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNLLADLVERDRV ::.: : . .: :::. :::.::::::.::..::::: :::::::::: ::::.::::. CCDS66 NPATEEELCQVEEGDKEDVDKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRL 50 60 70 80 90 100 120 130 140 150 160 170 pF1KE2 YLASLETLDNGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIPMDGQHFCFTRHEPVG ::..:....:: ....: :: ::. :: :::::: .:.:::.::. : .:::::.: CCDS66 LLATMESMNGGKLYSNAYLNDLAGCIKTLRYCAGWADKIQGRTIPIDGNFFTYTRHEPIG 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE2 VCGQIIPWNFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIKEAGFPPGVVNI :::::::::::::: ::..:::. :::::.: ::::::.::..:::::::::::::::: CCDS66 VCGQIIPWNFPLVMLIWKIGPALSCGNTVVVKPAEQTPLTALHVASLIKEAGFPPGVVNI 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE2 ITGYGPTAGAAIAQHMDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSIVLAD . ::::::::::..:::.::::::::::::.::..::: ::::::::::::::: ::::: CCDS66 VPGYGPTAGAAISSHMDIDKVAFTGSTEVGKLIKEAAGKSNLKRVTLELGGKSPCIVLAD 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE2 ADMEHAVEQCHEALFFNMGQCCCAGSRTFVEESIYNEFLERTVEKAKQRKVGNPFELDTQ ::...::: :...:...:::: :.:: :::::::.::..:.::.::. .:::. . CCDS66 ADLDNAVEFAHHGVFYHQGQCCIAASRIFVEESIYDEFVRRSVERAKKYILGNPLTPGVT 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE2 QGPQVDKEQFERVLGYIQLGQKEGAKLLCGGERFGERGFFIKPTVFGGVQDDMRIAKEEI ::::.::::....: :. :.:::::: ::: .:..:.:..::::..: :.:::::::: CCDS66 QGPQIDKEQYDKILDLIESGKKEGAKLECGGGPWGNKGYFVQPTVFSNVTDEMRIAKEEI 350 360 370 380 390 400 420 430 440 450 460 470 pF1KE2 FGPVQPLFKFKKIEEVVERANNTRYGLAAAVFTRDLDKAMYFTQALQAGTVWVNTYNIVT ::::: ..:::....:..::::: :::.:.:::.:.:::. ...:::::::::: :..:. CCDS66 FGPVQQIMKFKSLDDVIKRANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNCYGVVS 410 420 430 440 450 460 480 490 500 510 pF1KE2 CHTPFGGFKESGNGRELGEDGLKAYTEVKTVTIKVPQKNS . :::::: ::::::::: :.. ::::::::.:. :::: CCDS66 AQCPFGGFKMSGNGRELGEYGFHEYTEVKTVTVKISQKNS 470 480 490 500 >>CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 (512 aa) initn: 2190 init1: 2190 opt: 2190 Z-score: 2721.2 bits: 513.1 E(32554): 3e-145 Smith-Waterman score: 2190; 64.3% identity (86.0% similar) in 493 aa overlap (24-516:19-511) 10 20 30 40 50 60 pF1KE2 MLRFLAPRLLSLQGRTARYSSAAALPSPILNPDIPYNQLFINNEWQDAVSKKTFPTVNPT ::: :: : .. ....::::::... : : : : ::. CCDS10 MATANGAVENGQPDRKPPALPRPIRNLEVKFTKIFINNEWHESKSGKKFATCNPS 10 20 30 40 50 70 80 90 100 110 120 pF1KE2 TGEVIGHVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNLLADLVERDRVYLA : : : .: :::. :::.::.::. ::. ::::::.:: :::::. :::::::::. :: CCDS10 TREQICEVEEGDKPDVDKAVEAAQVAFQRGSPWRRLDALSRGRLLHQLADLVERDRATLA 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE2 SLETLDNGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIPMDGQHFCFTRHEPVGVCG .:::.:.:::: ... .::. :.. ::::::::: .::::: : . :::::::.:::: CCDS10 ALETMDTGKPFLHAFFIDLEGCIRTLRYFAGWADKIQGKTIPTDDNVVCFTRHEPIGVCG 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE2 QIIPWNFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIKEAGFPPGVVNIITG : ::::::.: ::::::: :::.:.: ::::::.::::.:::::::::::::::. : CCDS10 AITPWNFPLLMLVWKLAPALCCGNTMVLKPAEQTPLTALYLGSLIKEAGFPPGVVNIVPG 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE2 YGPTAGAAIAQHMDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSIVLADADM .:::.::::..: ...:.:::::::::.:...::. :::::::::::::.: :: ::::. CCDS10 FGPTVGAAISSHPQINKIAFTGSTEVGKLVKEAASRSNLKRVTLELGGKNPCIVCADADL 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE2 EHAVEQCHEALFFNMGQCCCAGSRTFVEESIYNEFLERTVEKAKQRKVGNPFELDTQQGP . ::: :...:::.:::: :.::.::::..:.::..:.:: ::.: ::.::.. :.::: CCDS10 DLAVECAHQGVFFNQGQCCTAASRVFVEEQVYSEFVRRSVEYAKKRPVGDPFDVKTEQGP 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE2 QVDKEQFERVLGYIQLGQKEGAKLLCGGERFGERGFFIKPTVFGGVQDDMRIAKEEIFGP :.:..::...: :. :.:::::: ::: . ..:.:::::::. : :.::::::::::: CCDS10 QIDQKQFDKILELIESGKKEGAKLECGGSAMEDKGLFIKPTVFSEVTDNMRIAKEEIFGP 360 370 380 390 400 410 430 440 450 460 470 480 pF1KE2 VQPLFKFKKIEEVVERANNTRYGLAAAVFTRDLDKAMYFTQALQAGTVWVNTYNIVTCHT :::..:::.::::..:::.: :::.:::::..::::. ...::..::::.: :: . .. CCDS10 VQPILKFKSIEEVIKRANSTDYGLTAAVFTKNLDKALKLASALESGTVWINCYNALYAQA 420 430 440 450 460 470 490 500 510 pF1KE2 PFGGFKESGNGRELGEDGLKAYTEVKTVTIKVPQKNS :::::: ::::::::: .: ::::::::::. .:: CCDS10 PFGGFKMSGNGRELGEYALAEYTEVKTVTIKLGDKNP 480 490 500 510 >>CCDS45266.1 ALDH1A2 gene_id:8854|Hs108|chr15 (422 aa) initn: 2058 init1: 2058 opt: 2058 Z-score: 2558.4 bits: 482.7 E(32554): 3.5e-136 Smith-Waterman score: 2058; 68.7% identity (90.3% similar) in 422 aa overlap (96-517:1-422) 70 80 90 100 110 120 pF1KE2 GHVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNLLADLVERDRVYLASLETL ::::::::::. :::::::::. ::..:.: CCDS45 MDASERGRLLDKLADLVERDRAVLATMESL 10 20 30 130 140 150 160 170 180 pF1KE2 DNGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIPMDGQHFCFTRHEPVGVCGQIIPW ..:::: ... .::. :::..::.:::::: :: :::.::..: ::::::.::::::::: CCDS45 NGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVCGQIIPW 40 50 60 70 80 90 190 200 210 220 230 240 pF1KE2 NFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIKEAGFPPGVVNIITGYGPTA ::::.: .::.:::: :::::.: ::::::::::...:::::::::::.::. :::::: CCDS45 NFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINILPGYGPTA 100 110 120 130 140 150 250 260 270 280 290 300 pF1KE2 GAAIAQHMDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSIVLADADMEHAVE :::::.:. .::.:::::::::.:::.::: :::::::::::::::.:..::::...::: CCDS45 GAAIASHIGIDKIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGKSPNIIFADADLDYAVE 160 170 180 190 200 210 310 320 330 340 350 360 pF1KE2 QCHEALFFNMGQCCCAGSRTFVEESIYNEFLERTVEKAKQRKVGNPFELDTQQGPQVDKE : :...:::.:::: :::: :::::::.::..:.::.::.: ::.::. :.::::.::. CCDS45 QAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQGPQIDKK 220 230 240 250 260 270 370 380 390 400 410 420 pF1KE2 QFERVLGYIQLGQKEGAKLLCGGERFGERGFFIKPTVFGGVQDDMRIAKEEIFGPVQPLF :....: :: : ::::: :::. .:..::::.::::..: ::::::::::::::: .. CCDS45 QYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFGPVQEIL 280 290 300 310 320 330 430 440 450 460 470 480 pF1KE2 KFKKIEEVVERANNTRYGLAAAVFTRDLDKAMYFTQALQAGTVWVNTYNIVTCHTPFGGF .:: ..::.:::::. .::.::::: :..::. ..:.::::::.: :: .. ..::::: CCDS45 RFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQSPFGGF 340 350 360 370 380 390 490 500 510 pF1KE2 KESGNGRELGEDGLKAYTEVKTVTIKVPQKNS : ::::::.:: ::. :.::::::.:.::::: CCDS45 KMSGNGREMGEFGLREYSEVKTVTVKIPQKNS 400 410 420 >>CCDS55885.1 ALDH2 gene_id:217|Hs108|chr12 (470 aa) initn: 2048 init1: 2048 opt: 2048 Z-score: 2545.2 bits: 480.4 E(32554): 1.9e-135 Smith-Waterman score: 2200; 66.0% identity (80.5% similar) in 518 aa overlap (3-517:7-470) 10 20 30 40 50 pF1KE2 MLRFLAPRLLSLQGRTARYSSAAA---LPSPILNPDIPYNQLFINNEWQDAVSKKT :: .::: :: : :::: .:.: .:.. ::.::::::.::::.:: CCDS55 MLRAAARF-GPRL----GR--RLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKT 10 20 30 40 50 60 70 80 90 100 110 pF1KE2 FPTVNPTTGEVIGHVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNLLADLVE ::::::.::::: .:::::.: CCDS55 FPTVNPSTGEVICQVAEGDKA--------------------------------------- 60 70 120 130 140 150 160 170 pF1KE2 RDRVYLASLETLDNGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIPMDGQHFCFTRH :::::::::. :: .::: :.: ::.::::::.::::::.::. : .::: CCDS55 --------LETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRH 80 90 100 110 120 180 190 200 210 220 230 pF1KE2 EPVGVCGQIIPWNFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIKEAGFPPG ::::::::::::::::.::.:::.:::::::.:::::::::::.:::.:.:::::::::: CCDS55 EPVGVCGQIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPG 130 140 150 160 170 180 240 250 260 270 280 290 pF1KE2 VVNIITGYGPTAGAAIAQHMDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSI ::::. :.:::::::::.: ::::::::::::.:..:: :::.:::::::::::::::.: CCDS55 VVNIVPGFGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNI 190 200 210 220 230 240 300 310 320 330 340 350 pF1KE2 VLADADMEHAVEQCHEALFFNMGQCCCAGSRTFVEESIYNEFLERTVEKAKQRKVGNPFE ...::::. :::: : :::::.::::::::::::.:.::.::.::.: .::.: :::::. CCDS55 IMSDADMDWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFD 250 260 270 280 290 300 360 370 380 390 400 410 pF1KE2 LDTQQGPQVDKEQFERVLGYIQLGQKEGAKLLCGGERFGERGFFIKPTVFGGVQDDMRIA :.::::::. ::...::::. :..::::::::: ..::.::.::::: ::: : :: CCDS55 SKTEQGPQVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIA 310 320 330 340 350 360 420 430 440 450 460 470 pF1KE2 KEEIFGPVQPLFKFKKIEEVVERANNTRYGLAAAVFTRDLDKAMYFTQALQAGTVWVNTY ::::::::. ..::: ::::: ::::. :::::::::.::::: :..::::::::::: : CCDS55 KEEIFGPVMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCY 370 380 390 400 410 420 480 490 500 510 pF1KE2 NIVTCHTPFGGFKESGNGRELGEDGLKAYTEVKTVTIKVPQKNS .. ..::::.: ::.:::::: ::.:::::::::.::::::: CCDS55 DVFGAQSPFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS 430 440 450 460 470 >>CCDS31891.1 ALDH1L2 gene_id:160428|Hs108|chr12 (923 aa) initn: 1521 init1: 891 opt: 1543 Z-score: 1912.3 bits: 364.3 E(32554): 3.4e-100 Smith-Waterman score: 1543; 49.0% identity (77.5% similar) in 484 aa overlap (34-511:441-922) 10 20 30 40 50 60 pF1KE2 FLAPRLLSLQGRTARYSSAAALPSPILNPDIPYNQLFINNEWQDAVSKKTFPTVNPTTGE .:: : :::... :: . ::. :.::: : CCDS31 KVVRKLRGEDQEVELVVDYISKEVNEIMVKMPY-QCFINGQFTDADDGKTYDTINPTDGS 420 430 440 450 460 70 80 90 100 110 120 pF1KE2 VIGHVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNLLADLVERDRVYLASLE .: .:. .. ::::.:: ::..::. : : ::.: :::::. ::::.:... ::..: CCDS31 TICKVSYASLADVDKAVAAAKDAFENGE-WGRMNARERGRLMYRLADLLEENQEELATIE 470 480 490 500 510 520 130 140 150 160 170 pF1KE2 TLDNGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIPMD----GQHFCFTRHEPVGVC .::.: . . . ....:::::: :: .:.:::.. .... ::..::.::: CCDS31 ALDSGAVYTLALKTHIGMSVQTFRYFAGWCDKIQGSTIPINQARPNRNLTFTKKEPLGVC 530 540 550 560 570 580 180 190 200 210 220 230 pF1KE2 GQIIPWNFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIKEAGFPPGVVNIIT . :::::.::.: .:: : ::.:::.:.: :. :::.:: .: : .:::: ::.::: CCDS31 AIIIPWNYPLMMLAWKSAACLAAGNTLVLKPAQVTPLTALKFAELSVKAGFPKGVINIIP 590 600 610 620 630 640 240 250 260 270 280 290 pF1KE2 GYGPTAGAAIAQHMDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSIVLADAD : : :: ...: :. :..::::: .:. :.:. . ::::.:.:::::::: :.. : . CCDS31 GSGGIAGQRLSEHPDIRKLGFTGSTPIGKQIMKSCAVSNLKKVSLELGGKSPLIIFNDCE 650 660 670 680 690 700 300 310 320 330 340 350 pF1KE2 MEHAVEQCHEALFFNMGQCCCAGSRTFVEESIYNEFLERTVEKAKQRKVGNPFELDTQQG ...::.. :.::: :. : :..: ::::::..::. :.::. :. :.:.:.. .:..: CCDS31 LDKAVRMGMGAVFFNKGENCIAAGRLFVEESIHDEFVTRVVEEIKKMKIGDPLDRSTDHG 710 720 730 740 750 760 360 370 380 390 400 410 pF1KE2 PQVDKEQFERVLGYIQLGQKEGAKLLCGGERFGERGFFIKPTVFGGVQDDMRIAKEEIFG :: : ..:..: : . : :::: :. ::.. . :::..:::: :.: : .:::: :: CCDS31 PQNHKAHLEKLLQYCETGVKEGATLVYGGRQVQRPGFFMEPTVFTDVEDYMYLAKEESFG 770 780 790 800 810 820 420 430 440 450 460 470 pF1KE2 PVQPLFKFKK--IEEVVERANNTRYGLAAAVFTRDLDKAMYFTQALQAGTVWVNTYNIVT :.. . ::.. :. :..:::.:.::::..:::::..:::: .. :.::::..:::: . CCDS31 PIMVISKFQNGDIDGVLQRANSTEYGLASGVFTRDINKAMYVSEKLEAGTVFINTYNKTD 830 840 850 860 870 880 480 490 500 510 pF1KE2 CHTPFGGFKESGNGRELGEDGLKAYTEVKTVTIKVPQKNS .:::: :.:: :..:::..:. : ..::::.. CCDS31 VAAPFGGVKQSGFGKDLGEEALNEYLKTKTVTLEY 890 900 910 920 >>CCDS58850.1 ALDH1L1 gene_id:10840|Hs108|chr3 (801 aa) initn: 1525 init1: 911 opt: 1533 Z-score: 1900.9 bits: 362.0 E(32554): 1.5e-99 Smith-Waterman score: 1533; 49.6% identity (77.1% similar) in 484 aa overlap (34-511:319-800) 10 20 30 40 50 60 pF1KE2 FLAPRLLSLQGRTARYSSAAALPSPILNPDIPYNQLFINNEWQDAVSKKTFPTVNPTTGE .:. ::::..:. :: . :: :.::: : CCDS58 LLVRKLRGDDEEGECSIDYVEMAVNKRTVRMPH-QLFIGGEFVDAEGAKTSETINPTDGS 290 300 310 320 330 340 70 80 90 100 110 120 pF1KE2 VIGHVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNLLADLVERDRVYLASLE :: .:. .. .:::.:: ::..::. : : ...: .::::. ::::.:. . ::..: CCDS58 VICQVSLAQVTDVDKAVAAAKDAFENGR-WGKISARDRGRLMYRLADLMEQHQEELATIE 350 360 370 380 390 400 130 140 150 160 170 pF1KE2 TLDNGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIPMD----GQHFCFTRHEPVGVC .:: : . . . :...:::::: :: .:.:::.. .... .::.:::::: CCDS58 ALDAGAVYTLALKTHVGMSIQTFRYFAGWCDKIQGSTIPINQARPNRNLTLTRKEPVGVC 410 420 430 440 450 460 180 190 200 210 220 230 pF1KE2 GQIIPWNFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIKEAGFPPGVVNIIT : :::::.::.: .:: : ::.:::::.: :. :::.:: .: : .::.: ::::.. CCDS58 GIIIPWNYPLMMLSWKTAACLAAGNTVVIKPAQVTPLTALKFAELTLKAGIPKGVVNVLP 470 480 490 500 510 520 240 250 260 270 280 290 pF1KE2 GYGPTAGAAIAQHMDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSIVLADAD : : .: ...: :: :..::::::::. :.:. . ::.:.:.:::::::: :..:: : CCDS58 GSGSLVGQRLSDHPDVRKIGFTGSTEVGKHIMKSCAISNVKKVSLELGGKSPLIIFADCD 530 540 550 560 570 580 300 310 320 330 340 350 pF1KE2 MEHAVEQCHEALFFNMGQCCCAGSRTFVEESIYNEFLERTVEKAKQRKVGNPFELDTQQG ...::.. ..::: :. : :..: :::.::..::..:.::.... :::::.. ::..: CCDS58 LNKAVQMGMSSVFFNKGENCIAAGRLFVEDSIHDEFVRRVVEEVRKMKVGNPLDRDTDHG 590 600 610 620 630 640 360 370 380 390 400 410 pF1KE2 PQVDKEQFERVLGYIQLGQKEGAKLLCGGERFGERGFFIKPTVFGGVQDDMRIAKEEIFG :: . .. ... : : : :::: :.:::.. . :::..:::: :.: : ::::: :: CCDS58 PQNHHAHLVKLMEYCQHGVKEGATLVCGGNQVPRPGFFFEPTVFTDVEDHMFIAKEESFG 650 660 670 680 690 700 420 430 440 450 460 470 pF1KE2 PVQPLFKFKK--IEEVVERANNTRYGLAAAVFTRDLDKAMYFTQALQAGTVWVNTYNIVT ::. . .: .. :. ::: :..:::..:::::..::.: .. ::::::.::::: . CCDS58 PVMIISRFADGDLDAVLSRANATEFGLASGVFTRDINKALYVSDKLQAGTVFVNTYNKTD 710 720 730 740 750 760 480 490 500 510 pF1KE2 CHTPFGGFKESGNGRELGEDGLKAYTEVKTVTIKVPQKNS .::::::.:: :..::: .:. : .:::::.. CCDS58 VAAPFGGFKQSGFGKDLGEAALNEYLRVKTVTFEY 770 780 790 800 517 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 02:48:57 2016 done: Mon Nov 7 02:48:58 2016 Total Scan time: 2.180 Total Display time: 0.090 Function used was FASTA [36.3.4 Apr, 2011]