FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB3033, 563 aa 1>>>pF1KB3033 563 - 563 aa - 563 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.7850+/-0.000879; mu= 15.9158+/- 0.053 mean_var=71.1598+/-14.091, 0's: 0 Z-trim(105.9): 36 B-trim: 0 in 0/52 Lambda= 0.152040 statistics sampled from 8631 (8666) to 8631 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.639), E-opt: 0.2 (0.266), width: 16 Scan time: 3.190 The best scores are: opt bits E(32554) CCDS188.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 563) 3786 839.9 0 CCDS53272.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 503) 3388 752.6 2.5e-217 CCDS81273.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 512) 2647 590.1 2.2e-168 CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 ( 501) 496 118.3 2.3e-26 CCDS31891.1 ALDH1L2 gene_id:160428|Hs108|chr12 ( 923) 498 118.8 2.9e-26 CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 ( 517) 494 117.8 3.2e-26 CCDS1250.2 ALDH9A1 gene_id:223|Hs108|chr1 ( 518) 491 117.2 5.1e-26 CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 512) 490 117.0 5.8e-26 CCDS5171.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 487) 489 116.7 6.5e-26 CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 497) 476 113.9 4.8e-25 CCDS10163.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 518) 476 113.9 5e-25 CCDS58850.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 801) 438 105.6 2.3e-22 CCDS3034.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 902) 438 105.6 2.6e-22 CCDS58851.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 912) 438 105.6 2.6e-22 CCDS4137.2 ALDH7A1 gene_id:501|Hs108|chr5 ( 539) 434 104.7 3e-22 CCDS45266.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 422) 431 104.0 3.9e-22 CCDS9155.1 ALDH2 gene_id:217|Hs108|chr12 ( 517) 432 104.2 4e-22 CCDS4555.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 535) 393 95.7 1.5e-19 CCDS76794.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 405) 374 91.5 2.2e-18 CCDS55885.1 ALDH2 gene_id:217|Hs108|chr12 ( 470) 374 91.5 2.5e-18 CCDS55057.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 437) 353 86.9 5.6e-17 CCDS9826.1 ALDH6A1 gene_id:4329|Hs108|chr14 ( 535) 342 84.5 3.6e-16 CCDS61501.1 ALDH6A1 gene_id:4329|Hs108|chr14 ( 522) 318 79.2 1.4e-14 CCDS4556.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 548) 299 75.1 2.5e-13 CCDS5172.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 433) 286 72.2 1.5e-12 CCDS10164.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 480) 265 67.6 4e-11 >>CCDS188.1 ALDH4A1 gene_id:8659|Hs108|chr1 (563 aa) initn: 3786 init1: 3786 opt: 3786 Z-score: 4486.1 bits: 839.9 E(32554): 0 Smith-Waterman score: 3786; 100.0% identity (100.0% similar) in 563 aa overlap (1-563:1-563) 10 20 30 40 50 60 pF1KB3 MLLPAPALRRALLSRPWTGAGLRWKHTSSLKVANEPVLAFTQGSPERDALQKALKDLKGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 MLLPAPALRRALLSRPWTGAGLRWKHTSSLKVANEPVLAFTQGSPERDALQKALKDLKGR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB3 MEAIPCVVGDEEVWTSDVQYQVSPFNHGHKVAKFCYADKSLLNKAIEAALAARKEWDLKP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 MEAIPCVVGDEEVWTSDVQYQVSPFNHGHKVAKFCYADKSLLNKAIEAALAARKEWDLKP 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB3 IADRAQIFLKAADMLSGPRRAEILAKTMVGQGKTVIQAEIDAAAELIDFFRFNAKYAVEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 IADRAQIFLKAADMLSGPRRAEILAKTMVGQGKTVIQAEIDAAAELIDFFRFNAKYAVEL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB3 EGQQPISVPPSTNSTVYRGLEGFVAAISPFNFTAIGGNLAGAPALMGNVVLWKPSDTAML :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 EGQQPISVPPSTNSTVYRGLEGFVAAISPFNFTAIGGNLAGAPALMGNVVLWKPSDTAML 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB3 ASYAVYRILREAGLPPNIIQFVPADGPLFGDTVTSSEHLCGINFTGSVPTFKHLWKQVAQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 ASYAVYRILREAGLPPNIIQFVPADGPLFGDTVTSSEHLCGINFTGSVPTFKHLWKQVAQ 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB3 NLDRFHTFPRLAGECGGKNFHFVHRSADVESVVSGTLRSAFEYGGQKCSACSRLYVPHSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 NLDRFHTFPRLAGECGGKNFHFVHRSADVESVVSGTLRSAFEYGGQKCSACSRLYVPHSL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB3 WPQIKGRLLEEHSRIKVGDPAEDFGTFFSAVIDAKSFARIKKWLEHARSSPSLTILAGGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 WPQIKGRLLEEHSRIKVGDPAEDFGTFFSAVIDAKSFARIKKWLEHARSSPSLTILAGGK 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB3 CDDSVGYFVEPCIVESKDPQEPIMKEEIFGPVLSVYVYPDDKYKETLQLVDSTTSYGLTG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 CDDSVGYFVEPCIVESKDPQEPIMKEEIFGPVLSVYVYPDDKYKETLQLVDSTTSYGLTG 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB3 AVFSQDKDVVQEATKVLRNAAGNFYINDKSTGSIVGQQPFGGARASGTNDKPGGPHYILR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 AVFSQDKDVVQEATKVLRNAAGNFYINDKSTGSIVGQQPFGGARASGTNDKPGGPHYILR 490 500 510 520 530 540 550 560 pF1KB3 WTSPQVIKETHKPLGDWSYAYMQ ::::::::::::::::::::::: CCDS18 WTSPQVIKETHKPLGDWSYAYMQ 550 560 >>CCDS53272.1 ALDH4A1 gene_id:8659|Hs108|chr1 (503 aa) initn: 3388 init1: 3388 opt: 3388 Z-score: 4015.1 bits: 752.6 E(32554): 2.5e-217 Smith-Waterman score: 3388; 100.0% identity (100.0% similar) in 503 aa overlap (61-563:1-503) 40 50 60 70 80 90 pF1KB3 KVANEPVLAFTQGSPERDALQKALKDLKGRMEAIPCVVGDEEVWTSDVQYQVSPFNHGHK :::::::::::::::::::::::::::::: CCDS53 MEAIPCVVGDEEVWTSDVQYQVSPFNHGHK 10 20 30 100 110 120 130 140 150 pF1KB3 VAKFCYADKSLLNKAIEAALAARKEWDLKPIADRAQIFLKAADMLSGPRRAEILAKTMVG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 VAKFCYADKSLLNKAIEAALAARKEWDLKPIADRAQIFLKAADMLSGPRRAEILAKTMVG 40 50 60 70 80 90 160 170 180 190 200 210 pF1KB3 QGKTVIQAEIDAAAELIDFFRFNAKYAVELEGQQPISVPPSTNSTVYRGLEGFVAAISPF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 QGKTVIQAEIDAAAELIDFFRFNAKYAVELEGQQPISVPPSTNSTVYRGLEGFVAAISPF 100 110 120 130 140 150 220 230 240 250 260 270 pF1KB3 NFTAIGGNLAGAPALMGNVVLWKPSDTAMLASYAVYRILREAGLPPNIIQFVPADGPLFG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 NFTAIGGNLAGAPALMGNVVLWKPSDTAMLASYAVYRILREAGLPPNIIQFVPADGPLFG 160 170 180 190 200 210 280 290 300 310 320 330 pF1KB3 DTVTSSEHLCGINFTGSVPTFKHLWKQVAQNLDRFHTFPRLAGECGGKNFHFVHRSADVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 DTVTSSEHLCGINFTGSVPTFKHLWKQVAQNLDRFHTFPRLAGECGGKNFHFVHRSADVE 220 230 240 250 260 270 340 350 360 370 380 390 pF1KB3 SVVSGTLRSAFEYGGQKCSACSRLYVPHSLWPQIKGRLLEEHSRIKVGDPAEDFGTFFSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 SVVSGTLRSAFEYGGQKCSACSRLYVPHSLWPQIKGRLLEEHSRIKVGDPAEDFGTFFSA 280 290 300 310 320 330 400 410 420 430 440 450 pF1KB3 VIDAKSFARIKKWLEHARSSPSLTILAGGKCDDSVGYFVEPCIVESKDPQEPIMKEEIFG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 VIDAKSFARIKKWLEHARSSPSLTILAGGKCDDSVGYFVEPCIVESKDPQEPIMKEEIFG 340 350 360 370 380 390 460 470 480 490 500 510 pF1KB3 PVLSVYVYPDDKYKETLQLVDSTTSYGLTGAVFSQDKDVVQEATKVLRNAAGNFYINDKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 PVLSVYVYPDDKYKETLQLVDSTTSYGLTGAVFSQDKDVVQEATKVLRNAAGNFYINDKS 400 410 420 430 440 450 520 530 540 550 560 pF1KB3 TGSIVGQQPFGGARASGTNDKPGGPHYILRWTSPQVIKETHKPLGDWSYAYMQ ::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 TGSIVGQQPFGGARASGTNDKPGGPHYILRWTSPQVIKETHKPLGDWSYAYMQ 460 470 480 490 500 >>CCDS81273.1 ALDH4A1 gene_id:8659|Hs108|chr1 (512 aa) initn: 2647 init1: 2647 opt: 2647 Z-score: 3136.6 bits: 590.1 E(32554): 2.2e-168 Smith-Waterman score: 3323; 90.9% identity (90.9% similar) in 563 aa overlap (1-563:1-512) 10 20 30 40 50 60 pF1KB3 MLLPAPALRRALLSRPWTGAGLRWKHTSSLKVANEPVLAFTQGSPERDALQKALKDLKGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 MLLPAPALRRALLSRPWTGAGLRWKHTSSLKVANEPVLAFTQGSPERDALQKALKDLKGR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB3 MEAIPCVVGDEEVWTSDVQYQVSPFNHGHKVAKFCYADKSLLNKAIEAALAARKEWDLKP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 MEAIPCVVGDEEVWTSDVQYQVSPFNHGHKVAKFCYADKSLLNKAIEAALAARKEWDLKP 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB3 IADRAQIFLKAADMLSGPRRAEILAKTMVGQGKTVIQAEIDAAAELIDFFRFNAKYAVEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 IADRAQIFLKAADMLSGPRRAEILAKTMVGQGKTVIQAEIDAAAELIDFFRFNAKYAVEL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB3 EGQQPISVPPSTNSTVYRGLEGFVAAISPFNFTAIGGNLAGAPALMGNVVLWKPSDTAML :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 EGQQPISVPPSTNSTVYRGLEGFVAAISPFNFTAIGGNLAGAPALMGNVVLWKPSDTAML 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB3 ASYAVYRILREAGLPPNIIQFVPADGPLFGDTVTSSEHLCGINFTGSVPTFKHLWKQVAQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 ASYAVYRILREAGLPPNIIQFVPADGPLFGDTVTSSEHLCGINFTGSVPTFKHLWKQVAQ 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB3 NLDRFHTFPRLAGECGGKNFHFVHRSADVESVVSGTLRSAFEYGGQKCSACSRLYVPHSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 NLDRFHTFPRLAGECGGKNFHFVHRSADVESVVSGTLRSAFEYGGQKCSACSRLYVPHSL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB3 WPQIKGRLLEEHSRIKVGDPAEDFGTFFSAVIDAKSFARIKKWLEHARSSPSLTILAGGK ::::::::::::::::::::::::::::::::::: CCDS81 WPQIKGRLLEEHSRIKVGDPAEDFGTFFSAVIDAK------------------------- 370 380 390 430 440 450 460 470 480 pF1KB3 CDDSVGYFVEPCIVESKDPQEPIMKEEIFGPVLSVYVYPDDKYKETLQLVDSTTSYGLTG :::::::::::::::::::::::::::::::::: CCDS81 --------------------------EIFGPVLSVYVYPDDKYKETLQLVDSTTSYGLTG 400 410 420 490 500 510 520 530 540 pF1KB3 AVFSQDKDVVQEATKVLRNAAGNFYINDKSTGSIVGQQPFGGARASGTNDKPGGPHYILR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 AVFSQDKDVVQEATKVLRNAAGNFYINDKSTGSIVGQQPFGGARASGTNDKPGGPHYILR 430 440 450 460 470 480 550 560 pF1KB3 WTSPQVIKETHKPLGDWSYAYMQ ::::::::::::::::::::::: CCDS81 WTSPQVIKETHKPLGDWSYAYMQ 490 500 510 >>CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 (501 aa) initn: 365 init1: 157 opt: 496 Z-score: 586.8 bits: 118.3 E(32554): 2.3e-26 Smith-Waterman score: 588; 27.8% identity (58.1% similar) in 518 aa overlap (41-547:3-492) 20 30 40 50 60 70 pF1KB3 ALLSRPWTGAGLRWKHTSSLKVANEPVLAFTQGSPERDALQKALKDLKGRMEAIPCVVGD ..:.:. .: : ::: .. : ... CCDS66 MSSSGTPDLPVL---LTDLKIQYTKI--FINN 10 20 80 90 100 110 120 pF1KB3 EEVWTSDVQYQVSPFNHGHKVAKFCYA---DKSLLNKAIEAALAARK---EWDLKPIADR : : ..:. . : . ..: . :: ..::..:: : . : ..: CCDS66 E--WHDSVSGKKFPVFNPATEEELCQVEEGDKEDVDKAVKAARQAFQIGSPWRTMDASER 30 40 50 60 70 80 130 140 150 160 170 180 pF1KB3 AQIFLKAADMLSGPRRAEILAKTMVGQGKTVIQAEIDAAAELIDFFRFNAKYAVELEGQQ .... : ::.. : ..: : :: .: .. : : .:. : .: ...:. CCDS66 GRLLYKLADLIERDRLLLATMESMNG-GKLYSNAYLNDLAGCIKTLRYCAGWADKIQGR- 90 100 110 120 130 140 190 200 210 220 230 240 pF1KB3 PISVPPSTNSTVYRGLE--GFVAAISPFNFTAIGGNLAGAPALM-GNVVLWKPSDTAMLA ..: . : .: : : . : :.:: . .::: ::.:. ::.. . :. CCDS66 --TIPIDGNFFTYTRHEPIGVCGQIIPWNFPLVMLIWKIGPALSCGNTVVVKPAEQTPLT 150 160 170 180 190 200 250 260 270 280 290 300 pF1KB3 SYAVYRILREAGLPPNIIQFVPADGPLFGDTVTSSEHLCGINFTGSVPTFKHLWKQVAQN . : ...:::.::.....::. :: : ...: . . ::::. . : : :..: . CCDS66 ALHVASLIKEAGFPPGVVNIVPGYGPTAGAAISSHMDIDKVAFTGSTEVGK-LIKEAAGK 210 220 230 240 250 260 310 320 330 340 350 360 pF1KB3 LDRFHTFPRLAGECGGKNFHFVHRSADVESVVSGTLRSAFEYGGQKCSACSRLYVPHSLW . . :.. : :::. .: .::....: . ...: . :: : : ::..: .:.. CCDS66 SN----LKRVTLELGGKSPCIVLADADLDNAVEFAHHGVFYHQGQCCIAASRIFVEESIY 270 280 290 300 310 370 380 390 400 410 420 pF1KB3 PQIKGRLLEEHSRIKVGDPAEDFGTFFSAVIDAKSFARIKKWLEHARSSPSLTILAGGKC .. : .:. .. .:.: :. . :: ... .: .: ... . .:: CCDS66 DEFVRRSVERAKKYILGNPLTP-GVTQGPQIDKEQYDKILDLIESGKKEGAKLECGGGPW 320 330 340 350 360 370 430 440 450 460 470 pF1KB3 DDSVGYFVEPCIVESKDPQEPIMKEEIFGPVLSVYVYP--DDKYKETLQLVDSTTSYGLT .. ::::.: . . . : :::::::: ... . :: :.. ..: :::. CCDS66 GNK-GYFVQPTVFSNVTDEMRIAKEEIFGPVQQIMKFKSLDDVIKRA-----NNTFYGLS 380 390 400 410 420 480 490 500 510 520 530 pF1KB3 GAVFSQDKDVVQEATKVLRNAAGNFYINDKSTGSIVGQQPFGGARASGTNDKPGGPHYIL ..::..: : . ...:. ::. ..: : . .: :::: . :: : . : . . CCDS66 AGVFTKDIDKAITISSALQ--AGTVWVN--CYGVVSAQCPFGGFKMSG-NGRELGEYGFH 430 440 450 460 470 480 540 550 560 pF1KB3 RWTSPQVIKETHKPLGDWSYAYMQ ..: ... CCDS66 EYTEVKTVTVKISQKNS 490 500 >>CCDS31891.1 ALDH1L2 gene_id:160428|Hs108|chr12 (923 aa) initn: 395 init1: 130 opt: 498 Z-score: 585.0 bits: 118.8 E(32554): 2.9e-26 Smith-Waterman score: 498; 24.3% identity (58.4% similar) in 493 aa overlap (48-527:428-900) 20 30 40 50 60 70 pF1KB3 TGAGLRWKHTSSLKVANEPVLAFTQGSPERDALQKALKDLKGRMEAIPCVVGDEEVWTSD : ..: .... .: : .. . . ..: CCDS31 DVYMATKFEGFIQKVVRKLRGEDQEVELVVDYISKEVNEIMVKMP-YQCFINGQFTDADD 400 410 420 430 440 450 80 90 100 110 120 130 pF1KB3 VQ-YQ-VSPFNHGHKVAKFCYADKSLLNKAIEAALAARK--EWDLKPIADRAQIFLKAAD . :. ..: . : . : ::. . ..::. :: : . :: .:.... . :: CCDS31 GKTYDTINPTD-GSTICKVSYASLADVDKAVAAAKDAFENGEWGRMNARERGRLMYRLAD 460 470 480 490 500 510 140 150 160 170 180 190 pF1KB3 MLSGPRRAEILAKTMVGQGKTVIQAEIDAAAELIDFFRFNAKYAVELEGQQ-PIS-VPPS .: . :. . . .: . : . .. ::. : . ...:. ::. . :. CCDS31 LLE-ENQEELATIEALDSGAVYTLALKTHIGMSVQTFRYFAGWCDKIQGSTIPINQARPN 520 530 540 550 560 570 200 210 220 230 240 pF1KB3 TNSTVYRGLE-GFVAAISPFNFTAIGGNLAGAPALM-GNVVLWKPSDTAMLASYAVYRIL : : . : : : :.:. . .: : ::... ::.... :.. .. CCDS31 RNLTFTKKEPLGVCAIIIPWNYPLMMLAWKSAACLAAGNTLVLKPAQVTPLTALKFAELS 580 590 600 610 620 630 250 260 270 280 290 300 pF1KB3 REAGLPPNIIQFVPADGPLFGDTVTSSEHLCGINFTGSVPTFKHLWKQVAQNLDRFHTFP .::.: ..:...:..: . :. .. . ..::::.: :.. :. : . .. CCDS31 VKAGFPKGVINIIPGSGGIAGQRLSEHPDIRKLGFTGSTPIGKQIMKSCAVS-----NLK 640 650 660 670 680 310 320 330 340 350 360 pF1KB3 RLAGECGGKNFHFVHRSADVESVVSGTLRSAFEYGGQKCSACSRLYVPHSLWPQIKGRLL ... : :::. .. . .....: . ..: :..: : .::.: .:. .. :.. CCDS31 KVSLELGGKSPLIIFNDCELDKAVRMGMGAVFFNKGENCIAAGRLFVEESIHDEFVTRVV 690 700 710 720 730 740 370 380 390 400 410 420 pF1KB3 EEHSRIKVGDPAE---DFGTFFSAVIDAKSFARIKKWLEHARSS--PSLTILAGGKCDDS :: ...:.::: . : : . :...: :.. ... . :.. ::. . CCDS31 EEIKKMKIGDPLDRSTDHG-------PQNHKAHLEKLLQYCETGVKEGATLVYGGRQVQR 750 760 770 780 790 800 430 440 450 460 470 480 pF1KB3 VGYFVEPCIVESKDPQEPIMKEEIFGPVLSVYVYPDDKYKETLQLVDSTTSYGLTGAVFS :.:.:: . . . . ::: :::.. . . . .:: ..:: :::...::. CCDS31 PGFFMEPTVFTDVEDYMYLAKEESFGPIMVISKFQNGDIDGVLQRANSTE-YGLASGVFT 810 820 830 840 850 860 490 500 510 520 530 540 pF1KB3 QDKDVVQEATKVLRNAAGNFYINDKSTGSIVGQQPFGGARASGTNDKPGGPHYILRWTSP .: . .. ... :. ::. .:: . .... ::::.. :: CCDS31 RDINKAMYVSEKLE--AGTVFINTYNKTDVAA--PFGGVKQSGFGKDLGEEALNEYLKTK 870 880 890 900 910 550 560 pF1KB3 QVIKETHKPLGDWSYAYMQ CCDS31 TVTLEY 920 >>CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 (517 aa) initn: 382 init1: 125 opt: 494 Z-score: 584.2 bits: 117.8 E(32554): 3.2e-26 Smith-Waterman score: 527; 25.6% identity (57.3% similar) in 511 aa overlap (36-533:7-495) 10 20 30 40 50 60 pF1KB3 PALRRALLSRPWTGAGLRWKHTSSLKVANEPVLAFTQGSPERDALQKALKD--LKGRMEA : : :: : . :: . :. . CCDS66 MLRFLAPRLLSLQGRTARYSSAAALPSPILNPDIPY 10 20 30 70 80 90 100 110 pF1KB3 IPCVVGDEEVWTSDVQYQVSPFNH---GHKVAKFCYADKSLLNKAIEAALAARK---EWD ...: : . :. .. : . :. ... .:.. ...:..:: : . : CCDS66 NQLFINNE--WQDAVSKKTFPTVNPTTGEVIGHVAEGDRADVDRAVKAAREAFRLGSPWR 40 50 60 70 80 90 120 130 140 150 160 170 pF1KB3 LKPIADRAQIFLKAADMLSGPRRAEILAKTMVGQGKTVIQAEIDAAAELIDFFRFNAKYA ..:.... . ::.. : . . . . .:: .. :.: .:. : .: CCDS66 RMDASERGRLLNRLADLVERDR-VYLASLETLDNGKPFQESYALDLDEVIKVYRYFAGWA 100 110 120 130 140 150 180 190 200 210 220 230 pF1KB3 VELEGQQPISVPPSTNSTVYRGLE--GFVAAISPFNFTAIGGNLAGAPALM-GNVVLWKP . .:. ..: . . . : : . : :.:: . . :::: ::.:. : CCDS66 DKWHGK---TIPMDGQHFCFTRHEPVGVCGQIIPWNFPLVMQGWKLAPALATGNTVVMKV 160 170 180 190 200 210 240 250 260 270 280 290 pF1KB3 SDTAMLASYAVYRILREAGLPPNIIQFVPADGPLFGDTVTSSEHLCGINFTGSVPTFKHL .. . :.. . ...:::.::...... . :: : .... . . ::::. . :: CCDS66 AEQTPLSALYLASLIKEAGFPPGVVNIITGYGPTAGAAIAQHVDVDKVAFTGSTEV-GHL 220 230 240 250 260 300 310 320 330 340 350 pF1KB3 WKQVAQNLDRFHTFPRLAGECGGKNFHFVHRSADVESVVSGTLRSAFEYGGQKCSACSRL ...: . . . :.. : :::. .: .::.: .: .. : :: : : :: CCDS66 IQKAAGDSN----LKRVTLELGGKSPSIVLADADMEHAVEQCHEALFFNMGQCCCAGSRT 270 280 290 300 310 320 360 370 380 390 400 410 pF1KB3 YVPHSLWPQIKGRLLEEHSRIKVGDPAEDFGTFFSAVIDAKSFARIKKWLEHARSSPSLT .: .:.. .. : .:. .. :::.: : . : . .: ..: :. ... ... . CCDS66 FVEESIYNEFLERTVEKAKQRKVGNPFE-LDTQQGPQVDKEQFERVLGYIQLGQKEGA-K 330 340 350 360 370 380 420 430 440 450 460 470 pF1KB3 ILAGGKCDDSVGYFVEPCIVESKDPQEPIMKEEIFGPVLSVYVYPDDKYKETLQLVD--S .: ::. :.:..: . . . . : :::::::: .. :.:. ..:. . CCDS66 LLCGGERFGERGFFIKPTVFGGVQDDMRIAKEEIFGPVQPLF-----KFKKIEEVVERAN 390 400 410 420 430 480 490 500 510 520 530 pF1KB3 TTSYGLTGAVFSQDKDVVQEATKVLRNAAGNFYINDKSTGSIVGQQPFGGARASGTNDKP .: :::..:::..: : .. :..:. ::. ..: . . .. . :::: . ::.. . CCDS66 NTRYGLAAAVFTRDLDKAMYFTQALQ--AGTVWVN--TYNIVTCHTPFGGFKESGNGREL 440 450 460 470 480 490 540 550 560 pF1KB3 GGPHYILRWTSPQVIKETHKPLGDWSYAYMQ : CCDS66 GEDGLKAYTEVKTVTIKVPQKNS 500 510 >>CCDS1250.2 ALDH9A1 gene_id:223|Hs108|chr1 (518 aa) initn: 389 init1: 133 opt: 491 Z-score: 580.6 bits: 117.2 E(32554): 5.1e-26 Smith-Waterman score: 566; 28.2% identity (62.4% similar) in 458 aa overlap (88-533:61-494) 60 70 80 90 100 110 pF1KB3 KGRMEAIPCVVGDEEVWTSDVQYQVSPFNHGHKVAKF-CYADKSLLNKAIEAALAARKEW :. .: : : ..: . : :.. : :: : : CCDS12 VVSQPLNYRGGARVEPADASGTEKAFEPATGRVIATFTCSGEKEV-NLAVQNAKAAFKIW 40 50 60 70 80 120 130 140 150 160 170 pF1KB3 DLKPIADRAQIFLKAADMLSGPRRAEILAKTMVGQGKTVIQA--EIDAAAELIDFFRFNA . : .: .:.:.:: .. :. :: . ...::....: .:: . . .... : CCDS12 SQKSGMERCRILLEAARIIR-EREDEIATMECINNGKSIFEARLDIDISWQCLEYY---A 90 100 110 120 130 140 180 190 200 210 220 230 pF1KB3 KYAVELEGQQPISVPPSTNSTVYRGLEGFVAAISPFNFTAIGGNLAGAPALM-GNVVLWK :. . :.. :..: .. . . : : ..:. .:. .. .:::: ::....: CCDS12 GLAASMAGEH-IQLPGGSFGYTRREPLGVCVGIGAWNYPFQIASWKSAPALACGNAMVFK 150 160 170 180 190 200 240 250 260 270 280 290 pF1KB3 PSDTAMLASYAVYRILREAGLPPNIIQFVPADGPLFGDTVTSSEHLCGINFTGSVPTFKH :: . ... . .: :::.::.... : . : :. . . . ..::::::: . CCDS12 PSPFTPVSALLLAEIYSEAGVPPGLFNVVQG-GAATGQFLCQHPDVAKVSFTGSVPTGMK 210 220 230 240 250 260 300 310 320 330 340 350 pF1KB3 LWKQVAQNLDRFHTFPRLAGECGGKNFHFVHRSADVESVVSGTLRSAFEYGGQKCSACSR . .. :... : .. : :::. .. . :....:.:.: . : :: : .: CCDS12 IMEMSAKGIK-----P-VTLELGGKSPLIIFSDCDMNNAVKGALMANFLTQGQVCCNGTR 270 280 290 300 310 360 370 380 390 400 410 pF1KB3 LYVPHSLWPQIKGRLLEEHSRIKVGDPA-EDFGTFFSAVIDAKSFARIKKWLEHARSSPS ..: . . .. ..... .:::.::: :: : .. .:. . :. ... :. . . CCDS12 VFVQKEILDKFTEEVVKQTQRIKIGDPLLED--TRMGPLINRPHLERVLGFVKVAKEQGA 320 330 340 350 360 370 420 430 440 450 460 pF1KB3 LTILAGGKC----DDSV--GYFVEPCIVESKDPQEPIMKEEIFGPVLSVYVYPDDKYKET .: :: : .. ::...::.. . . .::::::::.:. . : :. CCDS12 -KVLCGGDIYVPEDPKLKDGYYMRPCVLTNCRDDMTCVKEEIFGPVMSILSF--DTEAEV 380 390 400 410 420 430 470 480 490 500 510 520 pF1KB3 LQLVDSTTSYGLTGAVFSQDKDVVQEATKVLRN-AAGNFYINDKSTGSIVGQQPFGGARA :. ...:: .::...::..: .:.: .:. . ::. .::. ... . . :::: . CCDS12 LERANDTT-FGLAAGVFTRD---IQRAHRVVAELQAGTCFINNYNVSPV--ELPFGGYKK 440 450 460 470 480 530 540 550 560 pF1KB3 SGTNDKPGGPHYILRWTSPQVIKETHKPLGDWSYAYMQ :: . . : CCDS12 SGFGRENGRVTIEYYSQLKTVCVEMGDVESAF 490 500 510 >>CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 (512 aa) initn: 495 init1: 155 opt: 490 Z-score: 579.5 bits: 117.0 E(32554): 5.8e-26 Smith-Waterman score: 594; 27.8% identity (58.6% similar) in 529 aa overlap (39-556:7-509) 10 20 30 40 50 60 pF1KB3 RRALLSRPWTGAGLRWKHTSSLKVANEPVLAFTQGSPERD--ALQKALKDLKGRMEAIPC : .:.:.: :: . ...:. .. : CCDS10 MATANGAVENGQPDRKPPALPRPIRNLEVKFTKI-- 10 20 30 70 80 90 100 110 120 pF1KB3 VVGDEEVW---TSDVQYQVSPFNHGHKVAKFCYADKSLLNKAIEAALAARKE---WDLKP ...: : : .. . . ... . .:: ..::.::: .: .. : CCDS10 FINNE--WHESKSGKKFATCNPSTREQICEVEEGDKPDVDKAVEAAQVAFQRGSPWRRLD 40 50 60 70 80 90 130 140 150 160 170 180 pF1KB3 IADRAQIFLKAADMLSGPRRAEILAKTMVGQGKTVIQAEIDAAAELIDFFRFNAKYAVEL .:.... . ::.. : : . : . :: ..: . : .:. : .: .. CCDS10 ALSRGRLLHQLADLVERDR-ATLAALETMDTGKPFLHAFFIDLEGCIRTLRYFAGWADKI 100 110 120 130 140 150 190 200 210 220 230 pF1KB3 EGQQPISVPPSTNSTVYRGLE--GFVAAISPFNFTAIGGNLAGAPALM-GNVVLWKPSDT .:. ..: . : . . : : .::.:.:: . :::: ::... ::.. CCDS10 QGK---TIPTDDNVVCFTRHEPIGVCGAITPWNFPLLMLVWKLAPALCCGNTMVLKPAEQ 160 170 180 190 200 240 250 260 270 280 290 pF1KB3 AMLASYAVYRILREAGLPPNIIQFVPADGPLFGDTVTSSEHLCGINFTGSVPTFKHLWKQ . :.. . ...:::.::.....::. :: : ...: .. : ::::. . : : :. CCDS10 TPLTALYLGSLIKEAGFPPGVVNIVPGFGPTVGAAISSHPQINKIAFTGSTEVGK-LVKE 210 220 230 240 250 260 300 310 320 330 340 350 pF1KB3 VAQNLDRFHTFPRLAGECGGKNFHFVHRSADVESVVSGTLRSAFEYGGQKCSACSRLYVP .:. .. :.. : :::: .: .::.. .: . ...: :: :.: ::..: CCDS10 AASR----SNLKRVTLELGGKNPCIVCADADLDLAVECAHQGVFFNQGQCCTAASRVFVE 270 280 290 300 310 320 360 370 380 390 400 410 pF1KB3 HSLWPQIKGRLLEEHSRIKVGDPAEDFGTFFSAVIDAKSFARIKKWLEHARSSPSLTILA .... .. : .: .. :::: : : . :: :.: .: . .: ... . . CCDS10 EQVYSEFVRRSVEYAKKRPVGDPF-DVKTEQGPQIDQKQFDKILELIESGKKEGA-KLEC 330 340 350 360 370 380 420 430 440 450 460 470 pF1KB3 GGKCDDSVGYFVEPCIVESKDPQEPIMKEEIFGPVLSVYVYPDDKYKETLQLVDSTTSYG ::. .. : :..: . . : :::::::: . . . .:... ..:: .:: CCDS10 GGSAMEDKGLFIKPTVFSEVTDNMRIAKEEIFGPVQPILKFKS--IEEVIKRANST-DYG 390 400 410 420 430 480 490 500 510 520 530 pF1KB3 LTGAVFSQDKDVVQEATKVLRNAAGNFYINDKSTGSIVGQQPFGGARASGTNDKPGGPHY ::.:::... : . . ...:.. :. .:: ... .: :::: . :: : . : . CCDS10 LTAAVFTKNLDKALKLASALES--GTVWIN--CYNALYAQAPFGGFKMSG-NGRELGEYA 440 450 460 470 480 490 540 550 560 pF1KB3 ILRWTSPQVIKETHKPLGDWSYAYMQ . ..: .: . ::: CCDS10 LAEYTE---VKTVTIKLGDKNP 500 510 >>CCDS5171.1 ALDH8A1 gene_id:64577|Hs108|chr6 (487 aa) initn: 429 init1: 157 opt: 489 Z-score: 578.7 bits: 116.7 E(32554): 6.5e-26 Smith-Waterman score: 489; 26.5% identity (60.2% similar) in 437 aa overlap (99-527:44-464) 70 80 90 100 110 120 pF1KB3 GDEEVWTSDVQYQVSPFNHGHKVAKFCYADKSLLNKAIEAALAARKEWDLKPIADRAQIF :. .. :..:: : :. . .:.... CCDS51 IDGKFLPCSSYIDSYDPSTGEVYCRVPNSGKDEIEAAVKAAREAFPSWSSRSPQERSRVL 20 30 40 50 60 70 130 140 150 160 170 180 pF1KB3 LKAADMLSGPRRAEILAKTMVGQGKTVIQAEIDAAAELIDFFRFNAKYAVELEGQQPISV ..::.: . :.. ::::. :. . .. ::: :. ... .. CCDS51 NQVADLLEQSLEEFAQAESK-DQGKTLALARTMDIPRSVQNFRFFASSSLHHTSECTQMD 80 90 100 110 120 130 190 200 210 220 230 240 pF1KB3 PPSTNSTVYRGLEGFVAAISPFNFTAIGGNLAGAPALM-GNVVLWKPSDTAMLASYAVYR . . :. : .. :::.:. . :::. ::.:. :::. . .... . . CCDS51 HLGCMHYTVRAPVGVAGLISPWNLPLYLLTWKIAPAMAAGNTVIAKPSELTSVTAWMLCK 140 150 160 170 180 190 250 260 270 280 290 300 pF1KB3 ILREAGLPPNIIQFVPADGPLFGDTVTSSEHLCGINFTGSVPTFKHLWKQVAQNLDRFHT .: .::.::.....: . :: :....: .. :.:::: :: . ...: :. : CCDS51 LLDKAGVPPGVVNIVFGTGPRVGEALVSHPEVPLISFTGSQPTAE----RITQ-LSAPHC 200 210 220 230 240 310 320 330 340 350 360 pF1KB3 FPRLAGECGGKNFHFVHRSADVESVVSGTLRSAFEYGGQKCSACSRLYVPHSLWPQIKGR .:. : :::: .. ..:... . .:.::.: :. : ::..: .:.. .. : CCDS51 -KKLSLELGGKNPAIIFEDANLDECIPATVRSSFANQGEICLCTSRIFVQKSIYSEFLKR 250 260 270 280 290 300 370 380 390 400 410 420 pF1KB3 LLEEHSRIKVGDPAEDFGTFFSAVIDAKSFARIKKWLEHARSSPSLTILAGGKCD----- ..: . ::: :.. . .. .:.:. . ........: . . : : : CCDS51 FVEATRKWKVGIPSDPLVSI-GALISKAHLEKVRSYVKRALAEGA-QIWCGEGVDKLSLP 310 320 330 340 350 360 430 440 450 460 470 480 pF1KB3 --DSVGYFVEPCIVESKDPQEPIMKEEIFGPVLSVYVYPDDKYKETLQLVDSTTSYGLTG ...:::. : .. . . : ::::::: : : :. .:... .... .:::.. CCDS51 ARNQAGYFMLPTVITDIKDESCCMTEEIFGPVTCV--VPFDSEEEVIERANNV-KYGLAA 370 380 390 400 410 420 490 500 510 520 530 540 pF1KB3 AVFSQDKDVVQEATKVLRNAAGNFYINDKSTGSIVGQQPFGGARASGTNDKPGGPHYILR .:.:.. :....: :. .: . : . . :::: ..:: CCDS51 TVWSSNVGRVHRVAKKLQ--SGLVWTNCWLIREL--NLPFGGMKSSGIGREGAKDSYDFF 430 440 450 460 470 550 560 pF1KB3 WTSPQVIKETHKPLGDWSYAYMQ CCDS51 TEIKTITVKH 480 >>CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 (497 aa) initn: 411 init1: 146 opt: 476 Z-score: 563.1 bits: 113.9 E(32554): 4.8e-25 Smith-Waterman score: 556; 27.4% identity (59.7% similar) in 471 aa overlap (74-533:25-475) 50 60 70 80 90 100 pF1KB3 SPERDALQKALKDLKGRMEAIPCVVGDEEVWTSDVQYQVSP-FNH--GHKVAKFCYADKS : .. . .: : .: :..: . :::. CCDS55 MKNQCETVWLKSPIKLKLIFINNEWQNSESGRVFPVYNPATGEQVCEVQEADKA 10 20 30 40 50 110 120 130 140 150 pF1KB3 LLNKAIEAALAARKE---WDLKPIADRAQIFLKAADMLSGPRRAEILAKTMVGQGKTVIQ ..::..:: : . : ..:.... : ::.. : . ... : :: .: CCDS55 DIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVLATMESLNG-GKPFLQ 60 70 80 90 100 110 160 170 180 190 200 210 pF1KB3 AEIDAAAELIDFFRFNAKYAVELEGQQPISVPPSTNSTVYRGLE--GFVAAISPFNFTAI : .: ::. : .: ...: ...: . . .. : : . : :.:: . CCDS55 AFYVDLQGVIKTFRYYAGWADKIHG---MTIPVDGDYFTFTRHEPIGVCGQIIPWNFPLL 120 130 140 150 160 170 220 230 240 250 260 270 pF1KB3 GGNLAGAPALM-GNVVLWKPSDTAMLASYAVYRILREAGLPPNIIQFVPADGPLFGDTVT :::: ::.:. ::.. . :.. . ...:::.::..:...:. :: : ... CCDS55 MFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIKEAGFPPGVINILPGYGPTAGAAIA 180 190 200 210 220 230 280 290 300 310 320 330 pF1KB3 SSEHLCGINFTGSVPTFKHLWKQVAQNLDRFHTFPRLAGECGGKNFHFVHRSADVESVVS : . : ::::. . : . . .... .. :.. : :::. ... .::.. .: CCDS55 SHIGIDKIAFTGSTEVGKLIQEAAGRS-----NLKRVTLELGGKSPNIIFADADLDYAVE 240 250 260 270 280 340 350 360 370 380 390 pF1KB3 GTLRSAFEYGGQKCSACSRLYVPHSLWPQIKGRLLEEHSRIKVGDPAEDFGTFFSAVIDA . ...: :: :.: ::..: .:.. .. : .:. .: ::.: : : . :: CCDS55 QAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRVVGSPF-DPTTEQGPQIDK 290 300 310 320 330 340 400 410 420 430 440 450 pF1KB3 KSFARIKKWLEHARSSPSLTILAGGKCDDSVGYFVEPCIVESKDPQEPIMKEEIFGPVLS :.. .: . .. . . . . ::: :.:.:: . . . : :::::::: CCDS55 KQYNKILELIQSG-VAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFGPVQE 350 360 370 380 390 400 460 470 480 490 500 510 pF1KB3 VYVYPDDKYKETLQLVD--STTSYGLTGAVFSQDKDVVQEATKVLRNAAGNFYINDKSTG . ..: .... .....::..:::..: . . ...... ::. .:: . CCDS55 IL-----RFKTMDEVIERANNSDFGLVAAVFTNDINKALTVSSAMQ--AGTVWIN--CYN 410 420 430 440 450 520 530 540 550 560 pF1KB3 SIVGQQPFGGARASGTNDKPGGPHYILRWTSPQVIKETHKPLGDWSYAYMQ .. .:.:::: . ::.. . : CCDS55 ALNAQSPFGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS 460 470 480 490 563 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 21:54:56 2016 done: Sat Nov 5 21:54:57 2016 Total Scan time: 3.190 Total Display time: 0.090 Function used was FASTA [36.3.4 Apr, 2011]