FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE0799, 501 aa 1>>>pF1KE0799 501 - 501 aa - 501 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.6558+/-0.000905; mu= 15.9668+/- 0.054 mean_var=66.6698+/-13.571, 0's: 0 Z-trim(105.7): 39 B-trim: 348 in 1/50 Lambda= 0.157076 statistics sampled from 8538 (8577) to 8538 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.638), E-opt: 0.2 (0.263), width: 16 Scan time: 3.150 The best scores are: opt bits E(32554) CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 ( 501) 3357 769.8 0 CCDS10163.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 518) 2528 582.0 5.4e-166 CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 497) 2489 573.1 2.4e-163 CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 512) 2438 561.6 7.3e-160 CCDS9155.1 ALDH2 gene_id:217|Hs108|chr12 ( 517) 2352 542.1 5.4e-154 CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 ( 517) 2245 517.9 1.1e-146 CCDS45266.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 422) 2216 511.3 8.6e-145 CCDS55885.1 ALDH2 gene_id:217|Hs108|chr12 ( 470) 1911 442.2 6.1e-124 CCDS58850.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 801) 1555 361.6 1.9e-99 CCDS3034.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 902) 1555 361.6 2.1e-99 CCDS58851.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 912) 1555 361.6 2.1e-99 CCDS31891.1 ALDH1L2 gene_id:160428|Hs108|chr12 ( 923) 1555 361.6 2.1e-99 CCDS76794.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 405) 1455 338.8 6.8e-93 CCDS10164.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 480) 1294 302.3 7.6e-82 CCDS1250.2 ALDH9A1 gene_id:223|Hs108|chr1 ( 518) 1181 276.7 4.2e-74 CCDS5171.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 487) 1150 269.7 5.1e-72 CCDS4555.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 535) 928 219.4 7.8e-57 CCDS9826.1 ALDH6A1 gene_id:4329|Hs108|chr14 ( 535) 775 184.7 2.1e-46 CCDS55057.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 437) 766 182.7 7.3e-46 CCDS4137.2 ALDH7A1 gene_id:501|Hs108|chr5 ( 539) 719 172.1 1.4e-42 CCDS61501.1 ALDH6A1 gene_id:4329|Hs108|chr14 ( 522) 666 160.0 5.7e-39 CCDS4556.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 548) 622 150.1 5.9e-36 CCDS5172.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 433) 613 148.0 2e-35 CCDS11212.1 ALDH3A1 gene_id:218|Hs108|chr17 ( 453) 573 138.9 1.1e-32 CCDS82090.1 ALDH3A1 gene_id:218|Hs108|chr17 ( 380) 526 128.3 1.5e-29 CCDS11210.1 ALDH3A2 gene_id:224|Hs108|chr17 ( 485) 521 127.2 4.1e-29 CCDS32589.1 ALDH3A2 gene_id:224|Hs108|chr17 ( 508) 521 127.2 4.3e-29 CCDS12766.1 ALDH16A1 gene_id:126133|Hs108|chr19 ( 802) 503 123.2 1.1e-27 CCDS188.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 563) 496 121.5 2.4e-27 CCDS53272.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 503) 481 118.1 2.3e-26 CCDS81273.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 512) 405 100.9 3.6e-21 CCDS31622.1 ALDH3B2 gene_id:222|Hs108|chr11 ( 385) 336 85.2 1.4e-16 CCDS73335.1 ALDH3B1 gene_id:221|Hs108|chr11 ( 468) 329 83.7 5e-16 CCDS73336.1 ALDH3B1 gene_id:221|Hs108|chr11 ( 431) 304 78.0 2.4e-14 CCDS46141.1 ALDH16A1 gene_id:126133|Hs108|chr19 ( 751) 280 72.6 1.7e-12 >>CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 (501 aa) initn: 3357 init1: 3357 opt: 3357 Z-score: 4109.2 bits: 769.8 E(32554): 0 Smith-Waterman score: 3357; 100.0% identity (100.0% similar) in 501 aa overlap (1-501:1-501) 10 20 30 40 50 60 pF1KE0 MSSSGTPDLPVLLTDLKIQYTKIFINNEWHDSVSGKKFPVFNPATEEELCQVEEGDKEDV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 MSSSGTPDLPVLLTDLKIQYTKIFINNEWHDSVSGKKFPVFNPATEEELCQVEEGDKEDV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 DKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRLLLATMESMNGGKLYSNAYL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 DKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRLLLATMESMNGGKLYSNAYL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 NDLAGCIKTLRYCAGWADKIQGRTIPIDGNFFTYTRHEPIGVCGQIIPWNFPLVMLIWKI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 NDLAGCIKTLRYCAGWADKIQGRTIPIDGNFFTYTRHEPIGVCGQIIPWNFPLVMLIWKI 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE0 GPALSCGNTVVVKPAEQTPLTALHVASLIKEAGFPPGVVNIVPGYGPTAGAAISSHMDID :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 GPALSCGNTVVVKPAEQTPLTALHVASLIKEAGFPPGVVNIVPGYGPTAGAAISSHMDID 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE0 KVAFTGSTEVGKLIKEAAGKSNLKRVTLELGGKSPCIVLADADLDNAVEFAHHGVFYHQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 KVAFTGSTEVGKLIKEAAGKSNLKRVTLELGGKSPCIVLADADLDNAVEFAHHGVFYHQG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE0 QCCIAASRIFVEESIYDEFVRRSVERAKKYILGNPLTPGVTQGPQIDKEQYDKILDLIES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 QCCIAASRIFVEESIYDEFVRRSVERAKKYILGNPLTPGVTQGPQIDKEQYDKILDLIES 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE0 GKKEGAKLECGGGPWGNKGYFVQPTVFSNVTDEMRIAKEEIFGPVQQIMKFKSLDDVIKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 GKKEGAKLECGGGPWGNKGYFVQPTVFSNVTDEMRIAKEEIFGPVQQIMKFKSLDDVIKR 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE0 ANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNCYGVVSAQCPFGGFKMSGNGRELGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 ANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNCYGVVSAQCPFGGFKMSGNGRELGE 430 440 450 460 470 480 490 500 pF1KE0 YGFHEYTEVKTVTVKISQKNS ::::::::::::::::::::: CCDS66 YGFHEYTEVKTVTVKISQKNS 490 500 >>CCDS10163.1 ALDH1A2 gene_id:8854|Hs108|chr15 (518 aa) initn: 2528 init1: 2528 opt: 2528 Z-score: 3093.6 bits: 582.0 E(32554): 5.4e-166 Smith-Waterman score: 2528; 73.2% identity (91.5% similar) in 493 aa overlap (9-501:26-518) 10 20 30 40 pF1KE0 MSSSGTPDLPVLLTDLKIQYTKIFINNEWHDSVSGKKFPVFNP :: .:.:.::::::::::..: ::. :::.:: CCDS10 MTSSKIEMPGEVKADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSESGRVFPVYNP 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE0 ATEEELCQVEEGDKEDVDKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRLLL :: :..:.:.:.:: :.::::.::: ::..:: :: :::::::::: :::::.:::: .: CCDS10 ATGEQVCEVQEADKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVL 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE0 ATMESMNGGKLYSNAYLNDLAGCIKTLRYCAGWADKIQGRTIPIDGNFFTYTRHEPIGVC :::::.:::: . .:. :: : :::.:: :::::::.: :::.::..::.::::::::: CCDS10 ATMESLNGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVC 130 140 150 160 170 180 170 180 190 200 210 220 pF1KE0 GQIIPWNFPLVMLIWKIGPALSCGNTVVVKPAEQTPLTALHVASLIKEAGFPPGVVNIVP ::::::::::.:. :::.::: ::::::.::::::::.::....:::::::::::.::.: CCDS10 GQIIPWNFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINILP 190 200 210 220 230 240 230 240 250 260 270 280 pF1KE0 GYGPTAGAAISSHMDIDKVAFTGSTEVGKLIKEAAGKSNLKRVTLELGGKSPCIVLADAD ::::::::::.::. :::.::::::::::::.::::.::::::::::::::: :..:::: CCDS10 GYGPTAGAAIASHIGIDKIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGKSPNIIFADAD 250 260 270 280 290 300 290 300 310 320 330 340 pF1KE0 LDNAVEFAHHGVFYHQGQCCIAASRIFVEESIYDEFVRRSVERAKKYILGNPLTPGVTQG :: ::: ::.:::..::::: :.::::::::::.:::::::::::. ..:.:. : . :: CCDS10 LDYAVEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQG 310 320 330 340 350 360 350 360 370 380 390 400 pF1KE0 PQIDKEQYDKILDLIESGKKEGAKLECGGGPWGNKGYFVQPTVFSNVTDEMRIAKEEIFG :::::.::.:::.::.:: ::::::::: : ::.:..:::::::::.:::::::::: CCDS10 PQIDKKQYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFG 370 380 390 400 410 420 410 420 430 440 450 460 pF1KE0 PVQQIMKFKSLDDVIKRANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNCYGVVSAQ :::.:..::..:.::.::::. .:: :.:::.::.::.:.:::.::::::.:::....:: CCDS10 PVQEILRFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQ 430 440 450 460 470 480 470 480 490 500 pF1KE0 CPFGGFKMSGNGRELGEYGFHEYTEVKTVTVKISQKNS :::::::::::::.::.:..::.::::::::: :::: CCDS10 SPFGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS 490 500 510 >>CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 (497 aa) initn: 2487 init1: 2487 opt: 2489 Z-score: 3046.2 bits: 573.1 E(32554): 2.4e-163 Smith-Waterman score: 2489; 73.3% identity (91.5% similar) in 484 aa overlap (18-501:14-497) 10 20 30 40 50 60 pF1KE0 MSSSGTPDLPVLLTDLKIQYTKIFINNEWHDSVSGKKFPVFNPATEEELCQVEEGDKEDV :. :::::::..: ::. :::.:::: :..:.:.:.:: :. CCDS55 MKNQCETVWLKSPIKLKLIFINNEWQNSESGRVFPVYNPATGEQVCEVQEADKADI 10 20 30 40 50 70 80 90 100 110 120 pF1KE0 DKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRLLLATMESMNGGKLYSNAYL ::::.::: ::..:: :: :::::::::: :::::.:::: .::::::.:::: . .:. CCDS55 DKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVLATMESLNGGKPFLQAFY 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE0 NDLAGCIKTLRYCAGWADKIQGRTIPIDGNFFTYTRHEPIGVCGQIIPWNFPLVMLIWKI :: : :::.:: :::::::.: :::.::..::.:::::::::::::::::::.:. ::: CCDS55 VDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVCGQIIPWNFPLLMFAWKI 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE0 GPALSCGNTVVVKPAEQTPLTALHVASLIKEAGFPPGVVNIVPGYGPTAGAAISSHMDID .::: ::::::.::::::::.::....:::::::::::.::.:::::::::::.::. :: CCDS55 APALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINILPGYGPTAGAAIASHIGID 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE0 KVAFTGSTEVGKLIKEAAGKSNLKRVTLELGGKSPCIVLADADLDNAVEFAHHGVFYHQG :.::::::::::::.::::.::::::::::::::: :..:::::: ::: ::.:::..:: CCDS55 KIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGKSPNIIFADADLDYAVEQAHQGVFFNQG 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE0 QCCIAASRIFVEESIYDEFVRRSVERAKKYILGNPLTPGVTQGPQIDKEQYDKILDLIES ::: :.::::::::::.:::::::::::. ..:.:. : . :::::::.::.:::.::.: CCDS55 QCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQGPQIDKKQYNKILELIQS 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE0 GKKEGAKLECGGGPWGNKGYFVQPTVFSNVTDEMRIAKEEIFGPVQQIMKFKSLDDVIKR : ::::::::: : ::.:..:::::::::.:::::::::::::.:..::..:.::.: CCDS55 GVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFGPVQEILRFKTMDEVIER 360 370 380 390 400 410 430 440 450 460 470 480 pF1KE0 ANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNCYGVVSAQCPFGGFKMSGNGRELGE :::. .:: :.:::.::.::.:.:::.::::::.:::....:: :::::::::::::.:: CCDS55 ANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQSPFGGFKMSGNGREMGE 420 430 440 450 460 470 490 500 pF1KE0 YGFHEYTEVKTVTVKISQKNS .:..::.::::::::: :::: CCDS55 FGLREYSEVKTVTVKIPQKNS 480 490 >>CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 (512 aa) initn: 2438 init1: 2438 opt: 2438 Z-score: 2983.5 bits: 561.6 E(32554): 7.3e-160 Smith-Waterman score: 2438; 70.9% identity (89.7% similar) in 494 aa overlap (7-500:18-511) 10 20 30 40 pF1KE0 MSSSGTPDLPVLLTDLKIQYTKIFINNEWHDSVSGKKFPVFNPATEEEL : :: . .:....::::::::::.: ::::: . ::.:.:.. CCDS10 MATANGAVENGQPDRKPPALPRPIRNLEVKFTKIFINNEWHESKSGKKFATCNPSTREQI 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE0 CQVEEGDKEDVDKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRLLLATMESM :.:::::: ::::::.::. ::: ::::: .:: :::::..::::.:::: ::..:.: CCDS10 CEVEEGDKPDVDKAVEAAQVAFQRGSPWRRLDALSRGRLLHQLADLVERDRATLAALETM 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE0 NGGKLYSNAYLNDLAGCIKTLRYCAGWADKIQGRTIPIDGNFFTYTRHEPIGVCGQIIPW . :: . .:.. :: :::.:::: :::::::::.::: : : .:::::::::: : :: CCDS10 DTGKPFLHAFFIDLEGCIRTLRYFAGWADKIQGKTIPTDDNVVCFTRHEPIGVCGAITPW 130 140 150 160 170 180 170 180 190 200 210 220 pF1KE0 NFPLVMLIWKIGPALSCGNTVVVKPAEQTPLTALHVASLIKEAGFPPGVVNIVPGYGPTA ::::.::.::..::: ::::.:.:::::::::::...::::::::::::::::::.:::. CCDS10 NFPLLMLVWKLAPALCCGNTMVLKPAEQTPLTALYLGSLIKEAGFPPGVVNIVPGFGPTV 190 200 210 220 230 240 230 240 250 260 270 280 pF1KE0 GAAISSHMDIDKVAFTGSTEVGKLIKEAAGKSNLKRVTLELGGKSPCIVLADADLDNAVE ::::::: .:.:.:::::::::::.::::..:::::::::::::.:::: :::::: ::: CCDS10 GAAISSHPQINKIAFTGSTEVGKLVKEAASRSNLKRVTLELGGKNPCIVCADADLDLAVE 250 260 270 280 290 300 290 300 310 320 330 340 pF1KE0 FAHHGVFYHQGQCCIAASRIFVEESIYDEFVRRSVERAKKYILGNPLTPGVTQGPQIDKE ::.:::..::::: ::::.::::..:.:::::::: ::: .:.:. . ::::::.. CCDS10 CAHQGVFFNQGQCCTAASRVFVEEQVYSEFVRRSVEYAKKRPVGDPFDVKTEQGPQIDQK 310 320 330 340 350 360 350 360 370 380 390 400 pF1KE0 QYDKILDLIESGKKEGAKLECGGGPWGNKGYFVQPTVFSNVTDEMRIAKEEIFGPVQQIM :.::::.::::::::::::::::. .:: :..:::::.:::.::::::::::::: :. CCDS10 QFDKILELIESGKKEGAKLECGGSAMEDKGLFIKPTVFSEVTDNMRIAKEEIFGPVQPIL 370 380 390 400 410 420 410 420 430 440 450 460 pF1KE0 KFKSLDDVIKRANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNCYGVVSAQCPFGGF ::::...::::::.: :::.:.::::..:::. ..:::..::::.:::... :: ::::: CCDS10 KFKSIEEVIKRANSTDYGLTAAVFTKNLDKALKLASALESGTVWINCYNALYAQAPFGGF 430 440 450 460 470 480 470 480 490 500 pF1KE0 KMSGNGRELGEYGFHEYTEVKTVTVKISQKNS ::::::::::::.. :::::::::.:...:: CCDS10 KMSGNGRELGEYALAEYTEVKTVTIKLGDKNP 490 500 510 >>CCDS9155.1 ALDH2 gene_id:217|Hs108|chr12 (517 aa) initn: 2344 init1: 2344 opt: 2352 Z-score: 2878.1 bits: 542.1 E(32554): 5.4e-154 Smith-Waterman score: 2352; 68.1% identity (86.8% similar) in 501 aa overlap (1-501:17-517) 10 20 30 40 pF1KE0 MSSSGTPDLPVLLTDLKIQYTKIFINNEWHDSVSGKKFPVFNPA .:...: .:. . .. ..:::::::::.:: : ::. ::. CCDS91 MLRAAARFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNPS 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE0 TEEELCQVEEGDKEDVDKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRLLLA : : .::: ::::::::::::::: :::.::::: ::::.::::: .::::::::: :: CCDS91 TGEVICQVAEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIERDRTYLA 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE0 TMESMNGGKLYSNAYLNDLAGCIKTLRYCAGWADKIQGRTIPIDGNFFTYTRHEPIGVCG ..:....:: : .:: :: .: ::: :::::: .:.::::::.::.::::::.:::: CCDS91 ALETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVCG 130 140 150 160 170 180 170 180 190 200 210 220 pF1KE0 QIIPWNFPLVMLIWKIGPALSCGNTVVVKPAEQTPLTALHVASLIKEAGFPPGVVNIVPG :::::::::.: ::.::::. ::.::.: :::::::::.::.::::::::::::::::: CCDS91 QIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVPG 190 200 210 220 230 240 230 240 250 260 270 280 pF1KE0 YGPTAGAAISSHMDIDKVAFTGSTEVGKLIKEAAGKSNLKRVTLELGGKSPCIVLADADL .::::::::.:: :.::::::::::.:..:. :::.::::::::::::::: :...:::. CCDS91 FGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDADM 250 260 270 280 290 300 290 300 310 320 330 340 pF1KE0 DNAVEFAHHGVFYHQGQCCIAASRIFVEESIYDEFVRRSVERAKKYILGNPLTPGVTQGP : ::: :: ..:..::::: :.:: ::.:.::::::.::: :::. ..:::. . ::: CCDS91 DWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFDSKTEQGP 310 320 330 340 350 360 350 360 370 380 390 400 pF1KE0 QIDKEQYDKILDLIESGKKEGAKLECGGGPWGNKGYFVQPTVFSNVTDEMRIAKEEIFGP :.:. :. ::: :..::.::::: :::: ...:::.:::::..: : : ::::::::: CCDS91 QVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIAKEEIFGP 370 380 390 400 410 420 410 420 430 440 450 460 pF1KE0 VQQIMKFKSLDDVIKRANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNCYGVVSAQC :.::.:::....:. ::::. :::.:.:::::.::: .:.:::::::::::: : .:: CCDS91 VMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQS 430 440 450 460 470 480 470 480 490 500 pF1KE0 PFGGFKMSGNGRELGEYGFHEYTEVKTVTVKISQKNS ::::.::::.::::::::.. ::::::::::. :::: CCDS91 PFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS 490 500 510 >>CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 (517 aa) initn: 2242 init1: 2242 opt: 2245 Z-score: 2747.1 bits: 517.9 E(32554): 1.1e-146 Smith-Waterman score: 2245; 64.8% identity (87.4% similar) in 500 aa overlap (2-501:21-517) 10 20 30 40 pF1KE0 MSSSGTPDLPVLLTDLKIQYTKIFINNEWHDSVSGKKFPVF :... :. :.: : : :...::::::.:.:: : ::. CCDS66 MLRFLAPRLLSLQGRTARYSSAAALPS-PILNPD--IPYNQLFINNEWQDAVSKKTFPTV 10 20 30 40 50 50 60 70 80 90 100 pF1KE0 NPATEEELCQVEEGDKEDVDKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRL ::.: : . .: :::. :::.::::::.::..::::: :::::::::: .::::.::::. CCDS66 NPTTGEVIGHVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNRLADLVERDRV 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE0 LLATMESMNGGKLYSNAYLNDLAGCIKTLRYCAGWADKIQGRTIPIDGNFFTYTRHEPIG ::..:....:: ....: :: ::. :: :::::: .:.:::.::. : .:::::.: CCDS66 YLASLETLDNGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIPMDGQHFCFTRHEPVG 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE0 VCGQIIPWNFPLVMLIWKIGPALSCGNTVVVKPAEQTPLTALHVASLIKEAGFPPGVVNI :::::::::::::: ::..:::. :::::.: ::::::.::..:::::::::::::::: CCDS66 VCGQIIPWNFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIKEAGFPPGVVNI 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE0 VPGYGPTAGAAISSHMDIDKVAFTGSTEVGKLIKEAAGKSNLKRVTLELGGKSPCIVLAD . ::::::::::..:.:.::::::::::::.::..::: ::::::::::::::: ::::: CCDS66 ITGYGPTAGAAIAQHVDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSIVLAD 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE0 ADLDNAVEFAHHGVFYHQGQCCIAASRIFVEESIYDEFVRRSVERAKKYILGNPLTPGVT ::...::: :...:...:::: :.:: :::::::.::..:.::.::. .:::. . CCDS66 ADMEHAVEQCHEALFFNMGQCCCAGSRTFVEESIYNEFLERTVEKAKQRKVGNPFELDTQ 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE0 QGPQIDKEQYDKILDLIESGKKEGAKLECGGGPWGNKGYFVQPTVFSNVTDEMRIAKEEI ::::.::::....: :. :.:::::: ::: .:..:.:..::::..: :.:::::::: CCDS66 QGPQVDKEQFERVLGYIQLGQKEGAKLLCGGERFGERGFFIKPTVFGGVQDDMRIAKEEI 360 370 380 390 400 410 410 420 430 440 450 460 pF1KE0 FGPVQQIMKFKSLDDVIKRANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNCYGVVS ::::: ..:::....:..::::: :::.:.:::.:.:::. ...:::::::::: :..:. CCDS66 FGPVQPLFKFKKIEEVVERANNTRYGLAAAVFTRDLDKAMYFTQALQAGTVWVNTYNIVT 420 430 440 450 460 470 470 480 490 500 pF1KE0 AQCPFGGFKMSGNGRELGEYGFHEYTEVKTVTVKISQKNS . :::::: ::::::::: :.. ::::::::.:. :::: CCDS66 CHTPFGGFKESGNGRELGEDGLKAYTEVKTVTIKVPQKNS 480 490 500 510 >>CCDS45266.1 ALDH1A2 gene_id:8854|Hs108|chr15 (422 aa) initn: 2216 init1: 2216 opt: 2216 Z-score: 2712.9 bits: 511.3 E(32554): 8.6e-145 Smith-Waterman score: 2216; 75.1% identity (92.7% similar) in 422 aa overlap (80-501:1-422) 50 60 70 80 90 100 pF1KE0 CQVEEGDKEDVDKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRLLLATMESM :::::::::: :::::.:::: .::::::. CCDS45 MDASERGRLLDKLADLVERDRAVLATMESL 10 20 30 110 120 130 140 150 160 pF1KE0 NGGKLYSNAYLNDLAGCIKTLRYCAGWADKIQGRTIPIDGNFFTYTRHEPIGVCGQIIPW :::: . .:. :: : :::.:: :::::::.: :::.::..::.::::::::::::::: CCDS45 NGGKPFLQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVDGDYFTFTRHEPIGVCGQIIPW 40 50 60 70 80 90 170 180 190 200 210 220 pF1KE0 NFPLVMLIWKIGPALSCGNTVVVKPAEQTPLTALHVASLIKEAGFPPGVVNIVPGYGPTA ::::.:. :::.::: ::::::.::::::::.::....:::::::::::.::.::::::: CCDS45 NFPLLMFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINILPGYGPTA 100 110 120 130 140 150 230 240 250 260 270 280 pF1KE0 GAAISSHMDIDKVAFTGSTEVGKLIKEAAGKSNLKRVTLELGGKSPCIVLADADLDNAVE ::::.::. :::.::::::::::::.::::.::::::::::::::: :..:::::: ::: CCDS45 GAAIASHIGIDKIAFTGSTEVGKLIQEAAGRSNLKRVTLELGGKSPNIIFADADLDYAVE 160 170 180 190 200 210 290 300 310 320 330 340 pF1KE0 FAHHGVFYHQGQCCIAASRIFVEESIYDEFVRRSVERAKKYILGNPLTPGVTQGPQIDKE ::.:::..::::: :.::::::::::.:::::::::::. ..:.:. : . :::::::. CCDS45 QAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPFDPTTEQGPQIDKK 220 230 240 250 260 270 350 360 370 380 390 400 pF1KE0 QYDKILDLIESGKKEGAKLECGGGPWGNKGYFVQPTVFSNVTDEMRIAKEEIFGPVQQIM ::.:::.::.:: ::::::::: : ::.:..:::::::::.:::::::::::::.:. CCDS45 QYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFGPVQEIL 280 290 300 310 320 330 410 420 430 440 450 460 pF1KE0 KFKSLDDVIKRANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNCYGVVSAQCPFGGF .::..:.::.::::. .:: :.:::.::.::.:.:::.::::::.:::....:: ::::: CCDS45 RFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQAGTVWINCYNALNAQSPFGGF 340 350 360 370 380 390 470 480 490 500 pF1KE0 KMSGNGRELGEYGFHEYTEVKTVTVKISQKNS ::::::::.::.:..::.::::::::: :::: CCDS45 KMSGNGREMGEFGLREYSEVKTVTVKIPQKNS 400 410 420 >>CCDS55885.1 ALDH2 gene_id:217|Hs108|chr12 (470 aa) initn: 2077 init1: 1911 opt: 1911 Z-score: 2338.7 bits: 442.2 E(32554): 6.1e-124 Smith-Waterman score: 1995; 60.3% identity (78.4% similar) in 501 aa overlap (1-501:17-470) 10 20 30 40 pF1KE0 MSSSGTPDLPVLLTDLKIQYTKIFINNEWHDSVSGKKFPVFNPA .:...: .:. . .. ..:::::::::.:: : ::. ::. CCDS55 MLRAAARFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNPS 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE0 TEEELCQVEEGDKEDVDKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRLLLA : : .::: :::: CCDS55 TGEVICQVAEGDK----------------------------------------------- 70 110 120 130 140 150 160 pF1KE0 TMESMNGGKLYSNAYLNDLAGCIKTLRYCAGWADKIQGRTIPIDGNFFTYTRHEPIGVCG ..:....:: : .:: :: .: ::: :::::: .:.::::::.::.::::::.:::: CCDS55 ALETLDNGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVCG 80 90 100 110 120 130 170 180 190 200 210 220 pF1KE0 QIIPWNFPLVMLIWKIGPALSCGNTVVVKPAEQTPLTALHVASLIKEAGFPPGVVNIVPG :::::::::.: ::.::::. ::.::.: :::::::::.::.::::::::::::::::: CCDS55 QIIPWNFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVPG 140 150 160 170 180 190 230 240 250 260 270 280 pF1KE0 YGPTAGAAISSHMDIDKVAFTGSTEVGKLIKEAAGKSNLKRVTLELGGKSPCIVLADADL .::::::::.:: :.::::::::::.:..:. :::.::::::::::::::: :...:::. CCDS55 FGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDADM 200 210 220 230 240 250 290 300 310 320 330 340 pF1KE0 DNAVEFAHHGVFYHQGQCCIAASRIFVEESIYDEFVRRSVERAKKYILGNPLTPGVTQGP : ::: :: ..:..::::: :.:: ::.:.::::::.::: :::. ..:::. . ::: CCDS55 DWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFDSKTEQGP 260 270 280 290 300 310 350 360 370 380 390 400 pF1KE0 QIDKEQYDKILDLIESGKKEGAKLECGGGPWGNKGYFVQPTVFSNVTDEMRIAKEEIFGP :.:. :. ::: :..::.::::: :::: ...:::.:::::..: : : ::::::::: CCDS55 QVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIAKEEIFGP 320 330 340 350 360 370 410 420 430 440 450 460 pF1KE0 VQQIMKFKSLDDVIKRANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNCYGVVSAQC :.::.:::....:. ::::. :::.:.:::::.::: .:.:::::::::::: : .:: CCDS55 VMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQS 380 390 400 410 420 430 470 480 490 500 pF1KE0 PFGGFKMSGNGRELGEYGFHEYTEVKTVTVKISQKNS ::::.::::.::::::::.. ::::::::::. :::: CCDS55 PFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS 440 450 460 470 >>CCDS58850.1 ALDH1L1 gene_id:10840|Hs108|chr3 (801 aa) initn: 1306 init1: 948 opt: 1555 Z-score: 1899.0 bits: 361.6 E(32554): 1.9e-99 Smith-Waterman score: 1555; 50.6% identity (76.8% similar) in 478 aa overlap (22-493:322-798) 10 20 30 40 50 pF1KE0 MSSSGTPDLPVLLTDLKIQYTKIFINNEWHDSVSGKKFPVFNPATEEELCQ ..::..:. :. ..: ..::. .:: CCDS58 RKLRGDDEEGECSIDYVEMAVNKRTVRMPHQLFIGGEFVDAEGAKTSETINPTDGSVICQ 300 310 320 330 340 350 60 70 80 90 100 110 pF1KE0 VEEGDKEDVDKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRLLLATMESMNG : .. :::::: ::..::. : : ..: .::::.:.::::.:. . :::.:.... CCDS58 VSLAQVTDVDKAVAAAKDAFENGR-WGKISARDRGRLMYRLADLMEQHQEELATIEALDA 360 370 380 390 400 410 120 130 140 150 160 pF1KE0 GKLYSNAYLNDLAGCIKTLRYCAGWADKIQGRTIPID----GNFFTYTRHEPIGVCGQII : .:. : . .. :.:.:: ::: ::::: ::::. . .: ::.::.:::: :: CCDS58 GAVYTLALKTHVGMSIQTFRYFAGWCDKIQGSTIPINQARPNRNLTLTRKEPVGVCGIII 420 430 440 450 460 470 170 180 190 200 210 220 pF1KE0 PWNFPLVMLIWKIGPALSCGNTVVVKPAEQTPLTALHVASLIKEAGFPPGVVNIVPGYGP :::.::.:: :: . :. :::::.:::. ::::::. : : .::.: ::::..:: : CCDS58 PWNYPLMMLSWKTAACLAAGNTVVIKPAQVTPLTALKFAELTLKAGIPKGVVNVLPGSGS 480 490 500 510 520 530 230 240 250 260 270 280 pF1KE0 TAGAAISSHMDIDKVAFTGSTEVGKLIKEAAGKSNLKRVTLELGGKSPCIVLADADLDNA .: .:.: :. :..::::::::: : .. . ::.:.:.:::::::: :..:: ::..: CCDS58 LVGQRLSDHPDVRKIGFTGSTEVGKHIMKSCAISNVKKVSLELGGKSPLIIFADCDLNKA 540 550 560 570 580 590 290 300 310 320 330 340 pF1KE0 VEFAHHGVFYHQGQCCIAASRIFVEESIYDEFVRRSVERAKKYILGNPLTPGVTQGPQID :... .::...:. ::::.:.:::.::.:::::: ::...:. .:::: . .::: CCDS58 VQMGMSSVFFNKGENCIAAGRLFVEDSIHDEFVRRVVEEVRKMKVGNPLDRDTDHGPQNH 600 610 620 630 640 650 350 360 370 380 390 400 pF1KE0 KEQYDKILDLIESGKKEGAKLECGGGPWGNKGYFVQPTVFSNVTDEMRIAKEEIFGPVQQ . . :... . : :::: : :::. :.: .::::..: :.: ::::: ::::. CCDS58 HAHLVKLMEYCQHGVKEGATLVCGGNQVPRPGFFFEPTVFTDVEDHMFIAKEESFGPVMI 660 670 680 690 700 710 410 420 430 440 450 460 pF1KE0 IMKFKS--LDDVIKRANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNCYGVVSAQCP : .: . :: :..::: : .::..::::.::.::. .:. ::::::.:: :. ... : CCDS58 ISRFADGDLDAVLSRANATEFGLASGVFTRDINKALYVSDKLQAGTVFVNTYNKTDVAAP 720 730 740 750 760 770 470 480 490 500 pF1KE0 FGGFKMSGNGRELGEYGFHEYTEVKTVTVKISQKNS :::::.:: :..::: ...:: .::::: CCDS58 FGGFKQSGFGKDLGEAALNEYLRVKTVTFEY 780 790 800 >>CCDS3034.1 ALDH1L1 gene_id:10840|Hs108|chr3 (902 aa) initn: 1306 init1: 948 opt: 1555 Z-score: 1898.1 bits: 361.6 E(32554): 2.1e-99 Smith-Waterman score: 1555; 50.6% identity (76.8% similar) in 478 aa overlap (22-493:423-899) 10 20 30 40 50 pF1KE0 MSSSGTPDLPVLLTDLKIQYTKIFINNEWHDSVSGKKFPVFNPATEEELCQ ..::..:. :. ..: ..::. .:: CCDS30 RKLRGDDEEGECSIDYVEMAVNKRTVRMPHQLFIGGEFVDAEGAKTSETINPTDGSVICQ 400 410 420 430 440 450 60 70 80 90 100 110 pF1KE0 VEEGDKEDVDKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRLLLATMESMNG : .. :::::: ::..::. : : ..: .::::.:.::::.:. . :::.:.... CCDS30 VSLAQVTDVDKAVAAAKDAFENGR-WGKISARDRGRLMYRLADLMEQHQEELATIEALDA 460 470 480 490 500 510 120 130 140 150 160 pF1KE0 GKLYSNAYLNDLAGCIKTLRYCAGWADKIQGRTIPID----GNFFTYTRHEPIGVCGQII : .:. : . .. :.:.:: ::: ::::: ::::. . .: ::.::.:::: :: CCDS30 GAVYTLALKTHVGMSIQTFRYFAGWCDKIQGSTIPINQARPNRNLTLTRKEPVGVCGIII 520 530 540 550 560 570 170 180 190 200 210 220 pF1KE0 PWNFPLVMLIWKIGPALSCGNTVVVKPAEQTPLTALHVASLIKEAGFPPGVVNIVPGYGP :::.::.:: :: . :. :::::.:::. ::::::. : : .::.: ::::..:: : CCDS30 PWNYPLMMLSWKTAACLAAGNTVVIKPAQVTPLTALKFAELTLKAGIPKGVVNVLPGSGS 580 590 600 610 620 630 230 240 250 260 270 280 pF1KE0 TAGAAISSHMDIDKVAFTGSTEVGKLIKEAAGKSNLKRVTLELGGKSPCIVLADADLDNA .: .:.: :. :..::::::::: : .. . ::.:.:.:::::::: :..:: ::..: CCDS30 LVGQRLSDHPDVRKIGFTGSTEVGKHIMKSCAISNVKKVSLELGGKSPLIIFADCDLNKA 640 650 660 670 680 690 290 300 310 320 330 340 pF1KE0 VEFAHHGVFYHQGQCCIAASRIFVEESIYDEFVRRSVERAKKYILGNPLTPGVTQGPQID :... .::...:. ::::.:.:::.::.:::::: ::...:. .:::: . .::: CCDS30 VQMGMSSVFFNKGENCIAAGRLFVEDSIHDEFVRRVVEEVRKMKVGNPLDRDTDHGPQNH 700 710 720 730 740 750 350 360 370 380 390 400 pF1KE0 KEQYDKILDLIESGKKEGAKLECGGGPWGNKGYFVQPTVFSNVTDEMRIAKEEIFGPVQQ . . :... . : :::: : :::. :.: .::::..: :.: ::::: ::::. CCDS30 HAHLVKLMEYCQHGVKEGATLVCGGNQVPRPGFFFEPTVFTDVEDHMFIAKEESFGPVMI 760 770 780 790 800 810 410 420 430 440 450 460 pF1KE0 IMKFKS--LDDVIKRANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNCYGVVSAQCP : .: . :: :..::: : .::..::::.::.::. .:. ::::::.:: :. ... : CCDS30 ISRFADGDLDAVLSRANATEFGLASGVFTRDINKALYVSDKLQAGTVFVNTYNKTDVAAP 820 830 840 850 860 870 470 480 490 500 pF1KE0 FGGFKMSGNGRELGEYGFHEYTEVKTVTVKISQKNS :::::.:: :..::: ...:: .::::: CCDS30 FGGFKQSGFGKDLGEAALNEYLRVKTVTFEY 880 890 900 501 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 23:29:03 2016 done: Sun Nov 6 23:29:04 2016 Total Scan time: 3.150 Total Display time: 0.110 Function used was FASTA [36.3.4 Apr, 2011]