FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5485, 517 aa 1>>>pF1KB5485 517 - 517 aa - 517 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.7304+/-0.000956; mu= 15.1575+/- 0.057 mean_var=60.4308+/-12.006, 0's: 0 Z-trim(104.6): 38 B-trim: 154 in 1/48 Lambda= 0.164985 statistics sampled from 7955 (7993) to 7955 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.61), E-opt: 0.2 (0.246), width: 16 Scan time: 2.910 The best scores are: opt bits E(32554) CCDS9155.1 ALDH2 gene_id:217|Hs108|chr12 ( 517) 3456 831.4 0 CCDS55885.1 ALDH2 gene_id:217|Hs108|chr12 ( 470) 2652 640.0 1.7e-183 CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 ( 517) 2569 620.2 1.7e-177 CCDS10163.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 518) 2371 573.1 2.6e-163 CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 ( 501) 2352 568.6 5.8e-162 CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 497) 2345 566.9 1.8e-161 CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 512) 2254 545.3 6.2e-155 CCDS45266.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 422) 2083 504.5 9.3e-143 CCDS31891.1 ALDH1L2 gene_id:160428|Hs108|chr12 ( 923) 1525 371.8 1.9e-102 CCDS58850.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 801) 1521 370.8 3.2e-102 CCDS3034.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 902) 1521 370.8 3.5e-102 CCDS58851.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 912) 1521 370.8 3.6e-102 CCDS76794.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 405) 1347 329.4 4.9e-90 CCDS1250.2 ALDH9A1 gene_id:223|Hs108|chr1 ( 518) 1262 309.1 7.6e-84 CCDS10164.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 480) 1201 294.6 1.7e-79 CCDS5171.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 487) 1135 278.9 9e-75 CCDS4555.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 535) 906 224.4 2.5e-58 CCDS55057.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 437) 741 185.1 1.4e-46 CCDS9826.1 ALDH6A1 gene_id:4329|Hs108|chr14 ( 535) 716 179.2 1e-44 CCDS4137.2 ALDH7A1 gene_id:501|Hs108|chr5 ( 539) 706 176.8 5.4e-44 CCDS61501.1 ALDH6A1 gene_id:4329|Hs108|chr14 ( 522) 624 157.3 3.9e-38 CCDS4556.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 548) 602 152.1 1.6e-36 CCDS11212.1 ALDH3A1 gene_id:218|Hs108|chr17 ( 453) 555 140.8 3e-33 CCDS82090.1 ALDH3A1 gene_id:218|Hs108|chr17 ( 380) 504 128.7 1.2e-29 CCDS12766.1 ALDH16A1 gene_id:126133|Hs108|chr19 ( 802) 495 126.6 1e-28 CCDS53272.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 503) 432 111.6 2.2e-24 CCDS188.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 563) 432 111.6 2.4e-24 CCDS5172.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 433) 391 101.8 1.6e-21 CCDS31622.1 ALDH3B2 gene_id:222|Hs108|chr11 ( 385) 372 97.3 3.4e-20 CCDS73336.1 ALDH3B1 gene_id:221|Hs108|chr11 ( 431) 368 96.3 7.3e-20 CCDS73335.1 ALDH3B1 gene_id:221|Hs108|chr11 ( 468) 368 96.3 7.8e-20 CCDS11210.1 ALDH3A2 gene_id:224|Hs108|chr17 ( 485) 360 94.4 3e-19 CCDS32589.1 ALDH3A2 gene_id:224|Hs108|chr17 ( 508) 360 94.4 3.2e-19 CCDS81273.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 512) 331 87.5 3.8e-17 CCDS46141.1 ALDH16A1 gene_id:126133|Hs108|chr19 ( 751) 264 71.6 3.5e-12 >>CCDS9155.1 ALDH2 gene_id:217|Hs108|chr12 (517 aa) initn: 3456 init1: 3456 opt: 3456 Z-score: 4441.1 bits: 831.4 E(32554): 0 Smith-Waterman score: 3456; 100.0% identity (100.0% similar) in 517 aa overlap (1-517:1-517) 10 20 30 40 50 60 pF1KB5 MLRAAARFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS91 MLRAAARFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNPS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 TGEVICQVAEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIERDRTYLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS91 TGEVICQVAEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIERDRTYLA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 ALETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVCG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS91 ALETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVCG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 QIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS91 QIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVPG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 FGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDADM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS91 FGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDADM 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 DWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFDSKTEQGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS91 DWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFDSKTEQGP 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 QVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIAKEEIFGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS91 QVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIAKEEIFGP 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB5 VMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS91 VMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQS 430 440 450 460 470 480 490 500 510 pF1KB5 PFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS ::::::::::::::::::::::::::::::::::::: CCDS91 PFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS 490 500 510 >>CCDS55885.1 ALDH2 gene_id:217|Hs108|chr12 (470 aa) initn: 3134 init1: 2652 opt: 2652 Z-score: 3407.6 bits: 640.0 E(32554): 1.7e-183 Smith-Waterman score: 3044; 90.9% identity (90.9% similar) in 517 aa overlap (1-517:1-470) 10 20 30 40 50 60 pF1KB5 MLRAAARFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 MLRAAARFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNPS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 TGEVICQVAEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIERDRTYLA ::::::::::::: CCDS55 TGEVICQVAEGDK----------------------------------------------- 70 130 140 150 160 170 180 pF1KB5 ALETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVCG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 ALETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVCG 80 90 100 110 120 130 190 200 210 220 230 240 pF1KB5 QIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 QIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVPG 140 150 160 170 180 190 250 260 270 280 290 300 pF1KB5 FGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDADM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 FGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDADM 200 210 220 230 240 250 310 320 330 340 350 360 pF1KB5 DWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFDSKTEQGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 DWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFDSKTEQGP 260 270 280 290 300 310 370 380 390 400 410 420 pF1KB5 QVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIAKEEIFGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 QVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIAKEEIFGP 320 330 340 350 360 370 430 440 450 460 470 480 pF1KB5 VMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQS 380 390 400 410 420 430 490 500 510 pF1KB5 PFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS ::::::::::::::::::::::::::::::::::::: CCDS55 PFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS 440 450 460 470 >>CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 (517 aa) initn: 2565 init1: 2565 opt: 2569 Z-score: 3300.1 bits: 620.2 E(32554): 1.7e-177 Smith-Waterman score: 2569; 73.6% identity (89.2% similar) in 518 aa overlap (7-517:3-517) 10 20 30 40 50 pF1KB5 MLRAAARF-GPRL----GR--RLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKT :: .::: :: : :::: .:.: .:.. ::.::::::.::::.:: CCDS66 MLRFLAPRLLSLQGRTARYSSAAA---LPSPILNPDIPYNQLFINNEWQDAVSKKT 10 20 30 40 50 60 70 80 90 100 110 pF1KB5 FPTVNPSTGEVICQVAEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIE ::::::.::::: .:::::. :::.:::::: ::.:::::::::::.:::::::::::.: CCDS66 FPTVNPTTGEVIGHVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNRLADLVE 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB5 RDRTYLAALETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRH :::.:::.:::::::::. :: .::: :.: ::.::::::.::::::.::. : .::: CCDS66 RDRVYLASLETLDNGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIPMDGQHFCFTRH 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB5 EPVGVCGQIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPG ::::::::::::::::.::.:::.:::::::.:::::::::::.:::.:.:::::::::: CCDS66 EPVGVCGQIIPWNFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIKEAGFPPG 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB5 VVNIVPGFGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNI ::::. :.:::::::::.: ::::::::::::.:..:: :::.:::::::::::::::.: CCDS66 VVNIITGYGPTAGAAIAQHVDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSI 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB5 IMSDADMDWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFD ...::::. :::: : :::::.::::::::::::.:.::.::.::.: .::.: :::::. CCDS66 VLADADMEHAVEQCHEALFFNMGQCCCAGSRTFVEESIYNEFLERTVEKAKQRKVGNPFE 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB5 SKTEQGPQVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIA :.::::::. ::...::::. :..::::::::: ..::.::.::::: ::: : :: CCDS66 LDTQQGPQVDKEQFERVLGYIQLGQKEGAKLLCGGERFGERGFFIKPTVFGGVQDDMRIA 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB5 KEEIFGPVMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCY ::::::::. ..::: ::::: ::::. :::::::::.::::: :..::::::::::: : CCDS66 KEEIFGPVQPLFKFKKIEEVVERANNTRYGLAAAVFTRDLDKAMYFTQALQAGTVWVNTY 420 430 440 450 460 470 480 490 500 510 pF1KB5 DVFGAQSPFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS .. ..::::.: ::.:::::: ::.:::::::::.::::::: CCDS66 NIVTCHTPFGGFKESGNGRELGEDGLKAYTEVKTVTIKVPQKNS 480 490 500 510 >>CCDS10163.1 ALDH1A2 gene_id:8854|Hs108|chr15 (518 aa) initn: 2347 init1: 2347 opt: 2371 Z-score: 3045.4 bits: 573.1 E(32554): 2.6e-163 Smith-Waterman score: 2371; 67.3% identity (89.0% similar) in 498 aa overlap (20-517:21-518) 10 20 30 40 50 pF1KB5 MLRAAARFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNP :. . .:.:. . :. ..:::::::... : ..::. :: CCDS10 MTSSKIEMPGEVKADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSESGRVFPVYNP 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB5 STGEVICQVAEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIERDRTYL .::: .:.: :.:: :.::::.::: ::.::: :::::::.:::::..::::.::::. : CCDS10 ATGEQVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVL 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB5 AALETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVC :..:.:..:::.. .. :::. :.: .::::::::: :: :::.:::.:..:::::.::: CCDS10 ATMESLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVC 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB5 GQIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVP :::::::::::: :::..::: ::.::.: ::::::.:::.. :::::::::::.::.: CCDS10 GQIIPWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINILP 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB5 GFGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDAD :.::::::::::: .::.:::::::.:..:: ::: ::::::::::::::::::..::: CCDS10 GYGPTAGAAIASHIGIDKIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGKSPNIIFADAD 250 260 270 280 290 300 300 310 320 330 340 350 pF1KB5 MDWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFDSKTEQG .:.:::::: ..:::::::: :::: ::.:.::.:::.::: ::: ::::.::: :::: CCDS10 LDYAVEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQG 310 320 330 340 350 360 360 370 380 390 400 410 pF1KB5 PQVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIAKEEIFG ::.:. :..::: :..: ::::: ::: . .:.::.::::..: : : :::::::: CCDS10 PQIDKKQYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFG 370 380 390 400 410 420 420 430 440 450 460 470 pF1KB5 PVMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQ ::..::.:::..::. ::::: .::.:::::.:..:: .:.:.::::::.:::....:: CCDS10 PVQEILRFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQ 430 440 450 460 470 480 480 490 500 510 pF1KB5 SPFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS :::::.::::.:::.::.::. :.::::::::.::::: CCDS10 SPFGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS 490 500 510 >>CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 (501 aa) initn: 2344 init1: 2344 opt: 2352 Z-score: 3021.2 bits: 568.6 E(32554): 5.8e-162 Smith-Waterman score: 2352; 68.1% identity (86.8% similar) in 501 aa overlap (17-517:1-501) 10 20 30 40 50 60 pF1KB5 MLRAAARFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNPS .:...: .:. . .. ..:::::::::.:: : ::. ::. CCDS66 MSSSGTPDLPVLLTDLKIQYTKIFINNEWHDSVSGKKFPVFNPA 10 20 30 40 70 80 90 100 110 120 pF1KB5 TGEVICQVAEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIERDRTYLA : : .::: ::::::::::::::: :::.::::: ::::.::::: .::::::::: :: CCDS66 TEEELCQVEEGDKEDVDKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRLLLA 50 60 70 80 90 100 130 140 150 160 170 180 pF1KB5 ALETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVCG ..:....:: : .:: :: .: ::: :::::: .:.::::::.::.::::::.:::: CCDS66 TMESMNGGKLYSNAYLNDLAGCIKTLRYCAGWADKIQGRTIPIDGNFFTYTRHEPIGVCG 110 120 130 140 150 160 190 200 210 220 230 240 pF1KB5 QIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVPG :::::::::.: ::.::::. ::.::.: :::::::::.::.::::::::::::::::: CCDS66 QIIPWNFPLVMLIWKIGPALSCGNTVVVKPAEQTPLTALHVASLIKEAGFPPGVVNIVPG 170 180 190 200 210 220 250 260 270 280 290 300 pF1KB5 FGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDADM .::::::::.:: :.::::::::::.:..:. :::.::::::::::::::: :...:::. CCDS66 YGPTAGAAISSHMDIDKVAFTGSTEVGKLIKEAAGKSNLKRVTLELGGKSPCIVLADADL 230 240 250 260 270 280 310 320 330 340 350 360 pF1KB5 DWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFDSKTEQGP : ::: :: ..:..::::: :.:: ::.:.::::::.::: :::. ..:::. . ::: CCDS66 DNAVEFAHHGVFYHQGQCCIAASRIFVEESIYDEFVRRSVERAKKYILGNPLTPGVTQGP 290 300 310 320 330 340 370 380 390 400 410 420 pF1KB5 QVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIAKEEIFGP :.:. :. ::: :..::.::::: :::: ...:::.:::::..: : : ::::::::: CCDS66 QIDKEQYDKILDLIESGKKEGAKLECGGGPWGNKGYFVQPTVFSNVTDEMRIAKEEIFGP 350 360 370 380 390 400 430 440 450 460 470 480 pF1KB5 VMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQS :.::.:::....:. ::::. :::.:.:::::.::: .:.:::::::::::: : .:: CCDS66 VQQIMKFKSLDDVIKRANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNCYGVVSAQC 410 420 430 440 450 460 490 500 510 pF1KB5 PFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS ::::.::::.::::::::.. ::::::::::. :::: CCDS66 PFGGFKMSGNGRELGEYGFHEYTEVKTVTVKISQKNS 470 480 490 500 >>CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 (497 aa) initn: 2345 init1: 2345 opt: 2345 Z-score: 3012.3 bits: 566.9 E(32554): 1.8e-161 Smith-Waterman score: 2345; 69.1% identity (89.8% similar) in 479 aa overlap (39-517:19-497) 10 20 30 40 50 60 pF1KB5 GPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNPSTGEVICQV :::::::... : ..::. ::.::: .:.: CCDS55 MKNQCETVWLKSPIKLKLIFINNEWQNSESGRVFPVYNPATGEQVCEV 10 20 30 40 70 80 90 100 110 120 pF1KB5 AEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIERDRTYLAALETLDNG :.:: :.::::.::: ::.::: :::::::.:::::..::::.::::. ::..:.:..: CCDS55 QEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVLATMESLNGG 50 60 70 80 90 100 130 140 150 160 170 180 pF1KB5 KPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVCGQIIPWNFP ::.. .. :::. :.: .::::::::: :: :::.:::.:..:::::.:::::::::::: CCDS55 KPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVCGQIIPWNFP 110 120 130 140 150 160 190 200 210 220 230 240 pF1KB5 LLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVPGFGPTAGAA ::: :::..::: ::.::.: ::::::.:::.. :::::::::::.::.::.::::::: CCDS55 LLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINILPGYGPTAGAA 170 180 190 200 210 220 250 260 270 280 290 300 pF1KB5 IASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDADMDWAVEQAH :::: .::.:::::::.:..:: ::: ::::::::::::::::::..:::.:.:::::: CCDS55 IASHIGIDKIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGKSPNIIFADADLDYAVEQAH 230 240 250 260 270 280 310 320 330 340 350 360 pF1KB5 FALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFDSKTEQGPQVDETQFK ..:::::::: :::: ::.:.::.:::.::: ::: ::::.::: ::::::.:. :.. CCDS55 QGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQGPQIDKKQYN 290 300 310 320 330 340 370 380 390 400 410 420 pF1KB5 KILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIAKEEIFGPVMQILKFK ::: :..: ::::: ::: . .:.::.::::..: : : ::::::::::..::.:: CCDS55 KILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFGPVQEILRFK 350 360 370 380 390 400 430 440 450 460 470 480 pF1KB5 TIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQSPFGGYKMS :..::. ::::: .::.:::::.:..:: .:.:.::::::.:::....:::::::.::: CCDS55 TMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQSPFGGFKMS 410 420 430 440 450 460 490 500 510 pF1KB5 GSGRELGEYGLQAYTEVKTVTVKVPQKNS :.:::.::.::. :.::::::::.::::: CCDS55 GNGREMGEFGLREYSEVKTVTVKIPQKNS 470 480 490 >>CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 (512 aa) initn: 2236 init1: 2236 opt: 2254 Z-score: 2895.0 bits: 545.3 E(32554): 6.2e-155 Smith-Waterman score: 2254; 66.1% identity (86.4% similar) in 493 aa overlap (24-516:19-511) 10 20 30 40 50 60 pF1KB5 MLRAAARFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNPS :.: : .. :: ..::::::::.. : : : : ::: CCDS10 MATANGAVENGQPDRKPPALPRPIRNLEVKFTKIFINNEWHESKSGKKFATCNPS 10 20 30 40 50 70 80 90 100 110 120 pF1KB5 TGEVICQVAEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIERDRTYLA : : ::.: :::: ::::::.::..::: ::::::.:: :::::..::::.::::. :: CCDS10 TREQICEVEEGDKPDVDKAVEAAQVAFQRGSPWRRLDALSRGRLLHQLADLVERDRATLA 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB5 ALETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVCG ::::.:.:::.. ....::. .. :::.:::::: .::::: : . .:::::.:::: CCDS10 ALETMDTGKPFLHAFFIDLEGCIRTLRYFAGWADKIQGKTIPTDDNVVCFTRHEPIGVCG 120 130 140 150 160 170 190 200 210 220 230 240 pF1KB5 QIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVPG : :::::::: .:::.::: ::..:.: ::::::::::...::::::::::::::::: CCDS10 AITPWNFPLLMLVWKLAPALCCGNTMVLKPAEQTPLTALYLGSLIKEAGFPPGVVNIVPG 180 190 200 210 220 230 250 260 270 280 290 300 pF1KB5 FGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDADM ::::.::::.:: ...:.:::::::.:.... ::. :::::::::::::.: :. .:::. CCDS10 FGPTVGAAISSHPQINKIAFTGSTEVGKLVKEAASRSNLKRVTLELGGKNPCIVCADADL 240 250 260 270 280 290 310 320 330 340 350 360 pF1KB5 DWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFDSKTEQGP : ::: :: ..:::::::: :.::.::.:..:.:::.::: ::.: ::.::: :::::: CCDS10 DLAVECAHQGVFFNQGQCCTAASRVFVEEQVYSEFVRRSVEYAKKRPVGDPFDVKTEQGP 300 310 320 330 340 350 370 380 390 400 410 420 pF1KB5 QVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIAKEEIFGP :.:. :: ::: :..::.::::: :::. :.: ::.::::..: :.: ::::::::: CCDS10 QIDQKQFDKILELIESGKKEGAKLECGGSAMEDKGLFIKPTVFSEVTDNMRIAKEEIFGP 360 370 380 390 400 410 430 440 450 460 470 480 pF1KB5 VMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQS :. :::::.::::. :::.. :::.::::::.:::: :..::..::::.:::... ::. CCDS10 VQPILKFKSIEEVIKRANSTDYGLTAAVFTKNLDKALKLASALESGTVWINCYNALYAQA 420 430 440 450 460 470 490 500 510 pF1KB5 PFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS ::::.::::.:::::::.: ::::::::.:. .:: CCDS10 PFGGFKMSGNGRELGEYALAEYTEVKTVTIKLGDKNP 480 490 500 510 >>CCDS45266.1 ALDH1A2 gene_id:8854|Hs108|chr15 (422 aa) initn: 2083 init1: 2083 opt: 2083 Z-score: 2676.4 bits: 504.5 E(32554): 9.3e-143 Smith-Waterman score: 2083; 69.9% identity (90.3% similar) in 422 aa overlap (96-517:1-422) 70 80 90 100 110 120 pF1KB5 CQVAEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIERDRTYLAALETL ::::.:::::..::::.::::. ::..:.: CCDS45 MDASERGRLLDKLADLVERDRAVLATMESL 10 20 30 130 140 150 160 170 180 pF1KB5 DNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVCGQIIPW ..:::.. .. :::. :.: .::::::::: :: :::.:::.:..:::::.::::::::: CCDS45 NGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVCGQIIPW 40 50 60 70 80 90 190 200 210 220 230 240 pF1KB5 NFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVPGFGPTA :::::: :::..::: ::.::.: ::::::.:::.. :::::::::::.::.::.:::: CCDS45 NFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINILPGYGPTA 100 110 120 130 140 150 250 260 270 280 290 300 pF1KB5 GAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDADMDWAVE ::::::: .::.:::::::.:..:: ::: ::::::::::::::::::..:::.:.::: CCDS45 GAAIASHIGIDKIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGKSPNIIFADADLDYAVE 160 170 180 190 200 210 310 320 330 340 350 360 pF1KB5 QAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFDSKTEQGPQVDET ::: ..:::::::: :::: ::.:.::.:::.::: ::: ::::.::: ::::::.:. CCDS45 QAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQGPQIDKK 220 230 240 250 260 270 370 380 390 400 410 420 pF1KB5 QFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIAKEEIFGPVMQIL :..::: :..: ::::: ::: . .:.::.::::..: : : ::::::::::..:: CCDS45 QYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFGPVQEIL 280 290 300 310 320 330 430 440 450 460 470 480 pF1KB5 KFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQSPFGGY .:::..::. ::::: .::.:::::.:..:: .:.:.::::::.:::....:::::::. CCDS45 RFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQSPFGGF 340 350 360 370 380 390 490 500 510 pF1KB5 KMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS ::::.:::.::.::. :.::::::::.::::: CCDS45 KMSGNGREMGEFGLREYSEVKTVTVKIPQKNS 400 410 420 >>CCDS31891.1 ALDH1L2 gene_id:160428|Hs108|chr12 (923 aa) initn: 1521 init1: 894 opt: 1525 Z-score: 1952.9 bits: 371.8 E(32554): 1.9e-102 Smith-Waterman score: 1525; 48.8% identity (76.9% similar) in 480 aa overlap (38-511:444-922) 10 20 30 40 50 60 pF1KB5 FGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNPSTGEVICQ : :::... :: . ::. :.::. : .::. CCDS31 RKLRGEDQEVELVVDYISKEVNEIMVKMPYQCFINGQFTDADDGKTYDTINPTDGSTICK 420 430 440 450 460 470 70 80 90 100 110 120 pF1KB5 VAEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIERDRTYLAALETLDN :. .. :::::: ::. ::. : : ::.: .::::. :::::.:... ::..:.::. CCDS31 VSYASLADVDKAVAAAKDAFENGE-WGRMNARERGRLMYRLADLLEENQEELATIEALDS 480 490 500 510 520 530 130 140 150 160 170 180 pF1KB5 GKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPID----GDFFSYTRHEPVGVCGQII : :... . . : .. .::.::: :: .:.::::. . ...:..::.:::. :: CCDS31 GAVYTLALKTHIGMSVQTFRYFAGWCDKIQGSTIPINQARPNRNLTFTKKEPLGVCAIII 540 550 560 570 580 590 190 200 210 220 230 240 pF1KB5 PWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVPGFGP :::.::.: ::: . ::.::..:.: :. :::::: :.: .:::: ::.::.:: : CCDS31 PWNYPLMMLAWKSAACLAAGNTLVLKPAQVTPLTALKFAELSVKAGFPKGVINIIPGSGG 600 610 620 630 640 650 250 260 270 280 290 300 pF1KB5 TAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDADMDWA :: .. : :. :..::::: ::. :. . . ::::.:.:::::::: ::..: ..: : CCDS31 IAGQRLSEHPDIRKLGFTGSTPIGKQIMKSCAVSNLKKVSLELGGKSPLIIFNDCELDKA 660 670 680 690 700 710 310 320 330 340 350 360 pF1KB5 VEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFDSKTEQGPQVD :... :.:::.:. : :..: ::.:.:.:::: : : . :. .:.:.: .:..::: CCDS31 VRMGMGAVFFNKGENCIAAGRLFVEESIHDEFVTRVVEEIKKMKIGDPLDRSTDHGPQNH 720 730 740 750 760 770 370 380 390 400 410 420 pF1KB5 ETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIAKEEIFGPVMQ .....:.: : .:: .::: :. :: . :.:..:::: ::.: : .:::: :::.: CCDS31 KAHLEKLLQYCETGVKEGATLVYGGRQVQRPGFFMEPTVFTDVEDYMYLAKEESFGPIMV 780 790 800 810 820 830 430 440 450 460 470 480 pF1KB5 ILKFKT--IEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQSP : ::.. :. :. :::.. ::::..:::.:..:: :.:. :.::::..: :. . .: CCDS31 ISKFQNGDIDGVLQRANSTEYGLASGVFTRDINKAMYVSEKLEAGTVFINTYNKTDVAAP 840 850 860 870 880 890 490 500 510 pF1KB5 FGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS ::: :.:: :..::: .:. : ..::::.. CCDS31 FGGVKQSGFGKDLGEEALNEYLKTKTVTLEY 900 910 920 >>CCDS58850.1 ALDH1L1 gene_id:10840|Hs108|chr3 (801 aa) initn: 1521 init1: 899 opt: 1521 Z-score: 1948.8 bits: 370.8 E(32554): 3.2e-102 Smith-Waterman score: 1521; 48.5% identity (75.9% similar) in 489 aa overlap (27-509:311-798) 10 20 30 40 50 pF1KB5 MLRAAARFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPT : :.. . .:.::..:. :: . :: : CCDS58 STFGDFIQLLVRKLRGDDEEGECSIDYVEMAVNKRTVRMPHQLFIGGEFVDAEGAKTSET 290 300 310 320 330 340 60 70 80 90 100 110 pF1KB5 VNPSTGEVICQVAEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIERDR .::. : :::::. .. :::::: ::. ::. : : ...: ::::. :::::.:. . CCDS58 INPTDGSVICQVSLAQVTDVDKAVAAAKDAFENGR-WGKISARDRGRLMYRLADLMEQHQ 350 360 370 380 390 120 130 140 150 160 170 pF1KB5 TYLAALETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPID----GDFFSYTR ::..:.:: : :... . . : .. .::.::: :: .:.::::. . .. :: CCDS58 EELATIEALDAGAVYTLALKTHVGMSIQTFRYFAGWCDKIQGSTIPINQARPNRNLTLTR 400 410 420 430 440 450 180 190 200 210 220 230 pF1KB5 HEPVGVCGQIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPP .::::::: :::::.::.: .:: . ::.::.::.: :. :::::: :.: .::.: CCDS58 KEPVGVCGIIIPWNYPLMMLSWKTAACLAAGNTVVIKPAQVTPLTALKFAELTLKAGIPK 460 470 480 490 500 510 240 250 260 270 280 290 pF1KB5 GVVNIVPGFGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPN ::::..:: : .: ...: :: :..::::::.:. :. . . ::.:.:.:::::::: CCDS58 GVVNVLPGSGSLVGQRLSDHPDVRKIGFTGSTEVGKHIMKSCAISNVKKVSLELGGKSPL 520 530 540 550 560 570 300 310 320 330 340 350 pF1KB5 IIMSDADMDWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPF ::..: :.. ::... ..:::.:. : :..: ::...:.::::.: : .... ::::. CCDS58 IIFADCDLNKAVQMGMSSVFFNKGENCIAAGRLFVEDSIHDEFVRRVVEEVRKMKVGNPL 580 590 600 610 620 630 360 370 380 390 400 410 pF1KB5 DSKTEQGPQVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTI : :..::: .... :.. : . : .::: :.:::. . :.:..:::: ::.: : : CCDS58 DRDTDHGPQNHHAHLVKLMEYCQHGVKEGATLVCGGNQVPRPGFFFEPTVFTDVEDHMFI 640 650 660 670 680 690 420 430 440 450 460 470 pF1KB5 AKEEIFGPVMQILKFKT--IEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWV :::: ::::: : .: .. :..::: . .:::..:::.:..:: :.:. ::::::.: CCDS58 AKEESFGPVMIISRFADGDLDAVLSRANATEFGLASGVFTRDINKALYVSDKLQAGTVFV 700 710 720 730 740 750 480 490 500 510 pF1KB5 NCYDVFGAQSPFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS : :. . .::::.:.:: :..::: .:. : .::::: CCDS58 NTYNKTDVAAPFGGFKQSGFGKDLGEAALNEYLRVKTVTFEY 760 770 780 790 800 517 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 17:27:18 2016 done: Thu Nov 3 17:27:18 2016 Total Scan time: 2.910 Total Display time: 0.110 Function used was FASTA [36.3.4 Apr, 2011]