FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB5155, 511 aa
1>>>pF1KB5155 511 - 511 aa - 511 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.2573+/-0.000897; mu= 18.4378+/- 0.054
mean_var=62.0161+/-12.572, 0's: 0 Z-trim(104.4): 44 B-trim: 422 in 1/50
Lambda= 0.162863
statistics sampled from 7842 (7879) to 7842 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.605), E-opt: 0.2 (0.242), width: 16
Scan time: 3.110
The best scores are: opt bits E(32554)
CCDS4137.2 ALDH7A1 gene_id:501|Hs108|chr5 ( 539) 3407 809.4 0
CCDS56380.2 ALDH7A1 gene_id:501|Hs108|chr5 ( 475) 2029 485.6 5.4e-137
CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 497) 764 188.3 1.7e-47
CCDS10163.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 518) 758 186.9 4.6e-47
CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 ( 517) 752 185.5 1.2e-46
CCDS31891.1 ALDH1L2 gene_id:160428|Hs108|chr12 ( 923) 740 182.8 1.4e-45
CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 512) 720 178.0 2.2e-44
CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 ( 501) 719 177.8 2.5e-44
CCDS9155.1 ALDH2 gene_id:217|Hs108|chr12 ( 517) 706 174.7 2.2e-43
CCDS58850.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 801) 697 172.7 1.4e-42
CCDS3034.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 902) 697 172.7 1.5e-42
CCDS58851.1 ALDH1L1 gene_id:10840|Hs108|chr3 ( 912) 697 172.7 1.5e-42
CCDS1250.2 ALDH9A1 gene_id:223|Hs108|chr1 ( 518) 670 166.3 7.7e-41
CCDS45266.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 422) 668 165.8 8.9e-41
CCDS5171.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 487) 644 160.1 5e-39
CCDS4555.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 535) 627 156.2 8.7e-38
CCDS55885.1 ALDH2 gene_id:217|Hs108|chr12 ( 470) 617 153.8 4e-37
CCDS9826.1 ALDH6A1 gene_id:4329|Hs108|chr14 ( 535) 558 140.0 6.6e-33
CCDS76794.1 ALDH1A3 gene_id:220|Hs108|chr15 ( 405) 519 130.7 3e-30
CCDS10164.1 ALDH1A2 gene_id:8854|Hs108|chr15 ( 480) 472 119.7 7.3e-27
CCDS55057.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 437) 457 116.2 7.7e-26
CCDS61501.1 ALDH6A1 gene_id:4329|Hs108|chr14 ( 522) 456 116.0 1.1e-25
CCDS4556.1 ALDH5A1 gene_id:7915|Hs108|chr6 ( 548) 453 115.3 1.8e-25
CCDS188.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 563) 434 110.8 4.1e-24
CCDS53272.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 503) 432 110.3 5.1e-24
CCDS11212.1 ALDH3A1 gene_id:218|Hs108|chr17 ( 453) 369 95.5 1.3e-19
CCDS82090.1 ALDH3A1 gene_id:218|Hs108|chr17 ( 380) 358 92.9 6.9e-19
CCDS11210.1 ALDH3A2 gene_id:224|Hs108|chr17 ( 485) 342 89.2 1.1e-17
CCDS32589.1 ALDH3A2 gene_id:224|Hs108|chr17 ( 508) 342 89.2 1.2e-17
CCDS5172.1 ALDH8A1 gene_id:64577|Hs108|chr6 ( 433) 340 88.7 1.4e-17
CCDS73335.1 ALDH3B1 gene_id:221|Hs108|chr11 ( 468) 323 84.7 2.5e-16
CCDS12766.1 ALDH16A1 gene_id:126133|Hs108|chr19 ( 802) 313 82.5 2e-15
CCDS81273.1 ALDH4A1 gene_id:8659|Hs108|chr1 ( 512) 295 78.2 2.5e-14
CCDS73336.1 ALDH3B1 gene_id:221|Hs108|chr11 ( 431) 279 74.4 3e-13
CCDS31622.1 ALDH3B2 gene_id:222|Hs108|chr11 ( 385) 275 73.4 5.2e-13
>>CCDS4137.2 ALDH7A1 gene_id:501|Hs108|chr5 (539 aa)
initn: 3407 init1: 3407 opt: 3407 Z-score: 4322.0 bits: 809.4 E(32554): 0
Smith-Waterman score: 3407; 100.0% identity (100.0% similar) in 511 aa overlap (1-511:29-539)
10 20 30
pF1KB5 MSTLLINQPQYAWLKELGLREENEGVYNGSWG
::::::::::::::::::::::::::::::::
CCDS41 MWRLPRALCVHAAKTSKLSGPWSRPAAFMSTLLINQPQYAWLKELGLREENEGVYNGSWG
10 20 30 40 50 60
40 50 60 70 80 90
pF1KB5 GRGEVITTYCPANNEPIARVRQASVADYEETVKKAREAWKIWADIPAPKRGEIVRQIGDA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 GRGEVITTYCPANNEPIARVRQASVADYEETVKKAREAWKIWADIPAPKRGEIVRQIGDA
70 80 90 100 110 120
100 110 120 130 140 150
pF1KB5 LREKIQVLGSLVSLEMGKILVEGVGEVQEYVDICDYAVGLSRMIGGPILPSERSGHALIE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 LREKIQVLGSLVSLEMGKILVEGVGEVQEYVDICDYAVGLSRMIGGPILPSERSGHALIE
130 140 150 160 170 180
160 170 180 190 200 210
pF1KB5 QWNPVGLVGIITAFNFPVAVYGWNNAIAMICGNVCLWKGAPTTSLISVAVTKIIAKVLED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 QWNPVGLVGIITAFNFPVAVYGWNNAIAMICGNVCLWKGAPTTSLISVAVTKIIAKVLED
190 200 210 220 230 240
220 230 240 250 260 270
pF1KB5 NKLPGAICSLTCGGADIGTAMAKDERVNLLSFTGSTQVGKQVGLMVQERFGRSLLELGGN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 NKLPGAICSLTCGGADIGTAMAKDERVNLLSFTGSTQVGKQVGLMVQERFGRSLLELGGN
250 260 270 280 290 300
280 290 300 310 320 330
pF1KB5 NAIIAFEDADLSLVVPSALFAAVGTAGQRCTTARRLFIHESIHDEVVNRLKKAYAQIRVG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 NAIIAFEDADLSLVVPSALFAAVGTAGQRCTTARRLFIHESIHDEVVNRLKKAYAQIRVG
310 320 330 340 350 360
340 350 360 370 380 390
pF1KB5 NPWDPNVLYGPLHTKQAVSMFLGAVEEAKKEGGTVVYGGKVMDRPGNYVEPTIVTGLGHD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 NPWDPNVLYGPLHTKQAVSMFLGAVEEAKKEGGTVVYGGKVMDRPGNYVEPTIVTGLGHD
370 380 390 400 410 420
400 410 420 430 440 450
pF1KB5 ASIAHTETFAPILYVFKFKNEEEVFAWNNEVKQGLSSSIFTKDLGRIFRWLGPKGSDCGI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 ASIAHTETFAPILYVFKFKNEEEVFAWNNEVKQGLSSSIFTKDLGRIFRWLGPKGSDCGI
430 440 450 460 470 480
460 470 480 490 500 510
pF1KB5 VNVNIPTSGAEIGGAFGGEKHTGGGRESGSDAWKQYMRRSTCTINYSKDLPLAQGIKFQ
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 VNVNIPTSGAEIGGAFGGEKHTGGGRESGSDAWKQYMRRSTCTINYSKDLPLAQGIKFQ
490 500 510 520 530
>>CCDS56380.2 ALDH7A1 gene_id:501|Hs108|chr5 (475 aa)
initn: 2057 init1: 2029 opt: 2029 Z-score: 2573.0 bits: 485.6 E(32554): 5.4e-137
Smith-Waterman score: 2840; 87.5% identity (87.5% similar) in 511 aa overlap (1-511:29-475)
10 20 30
pF1KB5 MSTLLINQPQYAWLKELGLREENEGVYNGSWG
::::::::::::::::::::::::::::::::
CCDS56 MWRLPRALCVHAAKTSKLSGPWSRPAAFMSTLLINQPQYAWLKELGLREENEGVYNGSWG
10 20 30 40 50 60
40 50 60 70 80 90
pF1KB5 GRGEVITTYCPANNEPIARVRQASVADYEETVKKAREAWKIWADIPAPKRGEIVRQIGDA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 GRGEVITTYCPANNEPIARVRQASVADYEETVKKAREAWKIWADIPAPKRGEIVRQIGDA
70 80 90 100 110 120
100 110 120 130 140 150
pF1KB5 LREKIQVLGSLVSLEMGKILVEGVGEVQEYVDICDYAVGLSRMIGGPILPSERSGHALIE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 LREKIQVLGSLVSLEMGKILVEGVGEVQEYVDICDYAVGLSRMIGGPILPSERSGHALIE
130 140 150 160 170 180
160 170 180 190 200 210
pF1KB5 QWNPVGLVGIITAFNFPVAVYGWNNAIAMICGNVCLWKGAPTTSLISVAVTKIIAKVLED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 QWNPVGLVGIITAFNFPVAVYGWNNAIAMICGNVCLWKGAPTTSLISVAVTKIIAKVLED
190 200 210 220 230 240
220 230 240 250 260 270
pF1KB5 NKLPGAICSLTCGGADIGTAMAKDERVNLLSFTGSTQVGKQVGLMVQERFGRSLLELGGN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 NKLPGAICSLTCGGADIGTAMAKDERVNLLSFTGSTQVGKQVGLMVQERFGRSLLELGGN
250 260 270 280 290 300
280 290 300 310 320 330
pF1KB5 NAIIAFEDADLSLVVPSALFAAVGTAGQRCTTARRLFIHESIHDEVVNRLKKAYAQIRVG
::::::::::::::::::::::::::::::::::::
CCDS56 NAIIAFEDADLSLVVPSALFAAVGTAGQRCTTARRL------------------------
310 320 330
340 350 360 370 380 390
pF1KB5 NPWDPNVLYGPLHTKQAVSMFLGAVEEAKKEGGTVVYGGKVMDRPGNYVEPTIVTGLGHD
::::::::::::::::::::
CCDS56 ----------------------------------------VMDRPGNYVEPTIVTGLGHD
340 350
400 410 420 430 440 450
pF1KB5 ASIAHTETFAPILYVFKFKNEEEVFAWNNEVKQGLSSSIFTKDLGRIFRWLGPKGSDCGI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 ASIAHTETFAPILYVFKFKNEEEVFAWNNEVKQGLSSSIFTKDLGRIFRWLGPKGSDCGI
360 370 380 390 400 410
460 470 480 490 500 510
pF1KB5 VNVNIPTSGAEIGGAFGGEKHTGGGRESGSDAWKQYMRRSTCTINYSKDLPLAQGIKFQ
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 VNVNIPTSGAEIGGAFGGEKHTGGGRESGSDAWKQYMRRSTCTINYSKDLPLAQGIKFQ
420 430 440 450 460 470
>>CCDS55968.1 ALDH1A2 gene_id:8854|Hs108|chr15 (497 aa)
initn: 708 init1: 365 opt: 764 Z-score: 966.4 bits: 188.3 E(32554): 1.7e-47
Smith-Waterman score: 764; 30.8% identity (61.4% similar) in 503 aa overlap (7-496:3-490)
10 20 30 40 50
pF1KB5 MSTLLINQPQYAWLKE-LGLREENEGVYNGSWGGR--GEVITTYCPANNEPIARVRQASV
:: . .::: . :. :. : . :.:. .: ::..: . .:..:.
CCDS55 MKNQCETVWLKSPIKLKL---IFINNEWQNSESGRVFPVYNPATGEQVCEVQEADK
10 20 30 40 50
60 70 80 90 100 110
pF1KB5 ADYEETVKKAREAWK---IWADIPAPKRGEIVRQIGDALREKIQVLGSLVSLEMGKILVE
:: ...:. :: :.. .: . : .::... ...: ... ::... ::. :: ...
CCDS55 ADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVLATMESLNGGKPFLQ
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB5 GVG-EVQEYVDICDYAVGLSRMIGGPILPSERSGHALIEQWNPVGLVGIITAFNFPVAVY
. ..: . : .: . : : .: . . . . . .:.:. : : .:::. ..
CCDS55 AFYVDLQGVIKTFRYYAGWADKIHGMTIPVD-GDYFTFTRHEPIGVCGQIIPWNFPLLMF
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB5 GWNNAIAMICGNVCLWKGAPTTSLISVAVTKIIAKVLEDNKLPGAICSLTCGGADIGTAM
.:. : :. :::. . : : : : .. . .: : . ::.: : : :.:.
CCDS55 AWKIAPALCCGNTVVIKPAEQTPLSALYMGALIK---EAGFPPGVINILPGYGPTAGAAI
180 190 200 210 220
240 250 260 270 280
pF1KB5 AKDERVNLLSFTGSTQVGKQVGLMVQERFGRS-----LLELGGNNAIIAFEDADLSLVVP
:. .. ..:::::.::: ..:: ::: :::::.. : : ::::. .:
CCDS55 ASHIGIDKIAFTGSTEVGK----LIQEAAGRSNLKRVTLELGGKSPNIIFADADLDYAVE
230 240 250 260 270 280
290 300 310 320 330 340
pF1KB5 SALFAAVGTAGQRCTTARRLFIHESIHDEVVNR-LKKAYAQIRVGNPWDPNVLYGPLHTK
.: .. . :: ::.. :.:..:::..: : : ...: .. ::.:.::.. :: :
CCDS55 QAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRV-VGSPFDPTTEQGPQIDK
290 300 310 320 330 340
350 360 370 380 390 400
pF1KB5 QAVSMFLGAVEEAKKEGGTVVYGGKVMDRPGNYVEPTIVTGLGHDASIAHTETFAPILYV
. . .: .. . ::. . ::: . : : ..:::. ... : ::. : :.:. .
CCDS55 KQYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFGPVQEI
350 360 370 380 390 400
410 420 430 440 450 460
pF1KB5 FKFKNEEEVFAWNNEVKQGLSSSIFTKDLGRIFRWLGPKGSDCGIVNVNIPTSGAEIGGA
..::. .::. :. :: ...::.:... . .. . : : .: .. . .
CCDS55 LRFKTMDEVIERANNSDFGLVAAVFTNDINKALTV--SSAMQAGTVWINC-YNALNAQSP
410 420 430 440 450 460
470 480 490 500 510
pF1KB5 FGGEKHTGGGRESGSDAWKQYMRRSTCTINYSKDLPLAQGIKFQ
::: : .:.::: : . ..: . .: :.
CCDS55 FGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS
470 480 490
>>CCDS10163.1 ALDH1A2 gene_id:8854|Hs108|chr15 (518 aa)
initn: 633 init1: 365 opt: 758 Z-score: 958.5 bits: 186.9 E(32554): 4.6e-47
Smith-Waterman score: 758; 31.0% identity (62.2% similar) in 481 aa overlap (28-496:43-511)
10 20 30 40 50
pF1KB5 MSTLLINQPQYAWLKELGLREENEGVYNGSWGGR--GEVITTYCPANNEPIARVRQA
:. : . :.:. .: ::..: . .:..:
CCDS10 KADPAALMASLHLLPSPTPNLEIKYTKIFINNEWQNSESGRVFPVYNPATGEQVCEVQEA
20 30 40 50 60 70
60 70 80 90 100 110
pF1KB5 SVADYEETVKKAREAWK---IWADIPAPKRGEIVRQIGDALREKIQVLGSLVSLEMGKIL
. :: ...:. :: :.. .: . : .::... ...: ... ::... ::. :: .
CCDS10 DKADIDKAVQAARLAFSLGSVWRRMDASERGRLLDKLADLVERDRAVLATMESLNGGKPF
80 90 100 110 120 130
120 130 140 150 160 170
pF1KB5 VEGVG-EVQEYVDICDYAVGLSRMIGGPILPSERSGHALIEQWNPVGLVGIITAFNFPVA
... ..: . : .: . : : .: . . . . . .:.:. : : .:::.
CCDS10 LQAFYVDLQGVIKTFRYYAGWADKIHGMTIPVD-GDYFTFTRHEPIGVCGQIIPWNFPLL
140 150 160 170 180 190
180 190 200 210 220 230
pF1KB5 VYGWNNAIAMICGNVCLWKGAPTTSLISVAVTKIIAKVLEDNKLPGAICSLTCGGADIGT
...:. : :. :::. . : : : : .. . .: : . ::.: : : :.
CCDS10 MFAWKIAPALCCGNTVVIKPAEQTPLSALYMGALIK---EAGFPPGVINILPGYGPTAGA
200 210 220 230 240
240 250 260 270 280
pF1KB5 AMAKDERVNLLSFTGSTQVGKQVGLMVQERFGRS-----LLELGGNNAIIAFEDADLSLV
:.:. .. ..:::::.::: ..:: ::: :::::.. : : ::::. .
CCDS10 AIASHIGIDKIAFTGSTEVGK----LIQEAAGRSNLKRVTLELGGKSPNIIFADADLDYA
250 260 270 280 290 300
290 300 310 320 330 340
pF1KB5 VPSALFAAVGTAGQRCTTARRLFIHESIHDEVVNR-LKKAYAQIRVGNPWDPNVLYGPLH
: .: .. . :: ::.. :.:..:::..: : : ...: .. ::.:.::.. ::
CCDS10 VEQAHQGVFFNQGQCCTAGSRIFVEESIYEEFVRRSVERAKRRV-VGSPFDPTTEQGPQI
310 320 330 340 350 360
350 360 370 380 390 400
pF1KB5 TKQAVSMFLGAVEEAKKEGGTVVYGGKVMDRPGNYVEPTIVTGLGHDASIAHTETFAPIL
:. . .: .. . ::. . ::: . : : ..:::. ... : ::. : :.:.
CCDS10 DKKQYNKILELIQSGVAEGAKLECGGKGLGRKGFFIEPTVFSNVTDDMRIAKEEIFGPVQ
370 380 390 400 410 420
410 420 430 440 450 460
pF1KB5 YVFKFKNEEEVFAWNNEVKQGLSSSIFTKDLGRIFRWLGPKGSDCGIVNVNIPTSGAEIG
...::. .::. :. :: ...::.:... . .. . : : .: .. .
CCDS10 EILRFKTMDEVIERANNSDFGLVAAVFTNDINKALTV--SSAMQAGTVWINC-YNALNAQ
430 440 450 460 470 480
470 480 490 500 510
pF1KB5 GAFGGEKHTGGGRESGSDAWKQYMRRSTCTINYSKDLPLAQGIKFQ
. ::: : .:.::: : . ..: . .: :.
CCDS10 SPFGGFKMSGNGREMGEFGLREYSEVKTVTVKIPQKNS
490 500 510
>>CCDS6615.1 ALDH1B1 gene_id:219|Hs108|chr9 (517 aa)
initn: 639 init1: 377 opt: 752 Z-score: 950.9 bits: 185.5 E(32554): 1.2e-46
Smith-Waterman score: 752; 31.0% identity (61.1% similar) in 481 aa overlap (23-496:37-510)
10 20 30 40 50
pF1KB5 MSTLLINQPQYAWLKELGLREENEGVYNGSWGG--RGEVITTYCPANNEPIA
:. :. : ... : :...: :.
CCDS66 PRLLSLQGRTARYSSAAALPSPILNPDIPYNQLFINNEWQDAVSKKTFPTVNPTTGEVIG
10 20 30 40 50 60
60 70 80 90 100
pF1KB5 RVRQASVADYEETVKKAREAWKI---WADIPAPKRGEIVRQIGDALREKIQVLGSLVSLE
.: ... :: ...:: ::::... : . : .::... ...: ... :.:: .:.
CCDS66 HVAEGDRADVDRAVKAAREAFRLGSPWRRMDASERGRLLNRLADLVERDRVYLASLETLD
70 80 90 100 110 120
110 120 130 140 150 160
pF1KB5 MGKILVEGVG-EVQEYVDICDYAVGLSRMIGGPILPSERSGHALIEQWNPVGLVGIITAF
:: . :. . ...: . . : .: . : .: . . : . . .:::. : : .
CCDS66 NGKPFQESYALDLDEVIKVYRYFAGWADKWHGKTIPMD-GQHFCFTRHEPVGVCGQIIPW
130 140 150 160 170 180
170 180 190 200 210 220
pF1KB5 NFPVAVYGWNNAIAMICGNVCLWKGAPTTSLISVAVTKIIAKVLEDNKLPGAICSLTCGG
:::... ::. : :. ::. . : : : : .. ....: : . ::.. .: :
CCDS66 NFPLVMQGWKLAPALATGNTVVMKVAEQTPLSALYLASLIK---EAGFPPGVVNIITGYG
190 200 210 220 230 240
230 240 250 260 270 280
pF1KB5 ADIGTAMAKDERVNLLSFTGSTQVGKQVGLMVQER-FGRSLLELGGNNAIIAFEDADLSL
:.:.:. :. ..:::::.::. . . . . : :::::.. :.. :::.
CCDS66 PTAGAAIAQHVDVDKVAFTGSTEVGHLIQKAAGDSNLKRVTLELGGKSPSIVLADADMEH
250 260 270 280 290 300
290 300 310 320 330 340
pF1KB5 VVPSALFAAVGTAGQRCTTARRLFIHESIHDEVVNRLKKAYAQIRVGNPWDPNVLYGPLH
.: . : . :: : .. : :..:::..: ..: . : .::::.. .. ::
CCDS66 AVEQCHEALFFNMGQCCCAGSRTFVEESIYNEFLERTVEKAKQRKVGNPFELDTQQGPQV
310 320 330 340 350 360
350 360 370 380 390 400
pF1KB5 TKQAVSMFLGAVEEAKKEGGTVVYGGKVMDRPGNYVEPTIVTGLGHDASIAHTETFAPIL
:. :: .. ..:::. .. ::. . . : ...::. :. : ::. : :.:.
CCDS66 DKEQFERVLGYIQLGQKEGAKLLCGGERFGERGFFIKPTVFGGVQDDMRIAKEEIFGPVQ
370 380 390 400 410 420
410 420 430 440 450 460
pF1KB5 YVFKFKNEEEVFAWNNEVKQGLSSSIFTKDLGRIFRWLGPKGSDCGIVNVNIPTSGAEIG
.::::. ::: :... ::....::.:: . . . .. . : : :: . .
CCDS66 PLFKFKKIEEVVERANNTRYGLAAAVFTRDLDKAMYFT--QALQAGTVWVNT-YNIVTCH
430 440 450 460 470
470 480 490 500 510
pF1KB5 GAFGGEKHTGGGRESGSDAWKQYMRRSTCTINYSKDLPLAQGIKFQ
::: :..:.::: : :. : : . .: ::
CCDS66 TPFGGFKESGNGRELGEDGLKAYTEVKTVTIKVPQKNS
480 490 500 510
>>CCDS31891.1 ALDH1L2 gene_id:160428|Hs108|chr12 (923 aa)
initn: 421 init1: 365 opt: 740 Z-score: 931.7 bits: 182.8 E(32554): 1.4e-45
Smith-Waterman score: 740; 28.4% identity (63.2% similar) in 497 aa overlap (14-498:434-923)
10 20 30 40
pF1KB5 MSTLLINQPQYAWLKELGLREENEGVYNGSW--GGRGEVITTY
..:. .. . ::.. . :.. :
CCDS31 KFEGFIQKVVRKLRGEDQEVELVVDYISKEVNEIMVKMPYQCFINGQFTDADDGKTYDTI
410 420 430 440 450 460
50 60 70 80 90
pF1KB5 CPANNEPIARVRQASVADYEETVKKAREAWKI--WADIPAPKRGEIVRQIGDALREKIQV
:... : .: ::.:: ...: :..:.. :. . : .::... ...: :.:. .
CCDS31 NPTDGSTICKVSYASLADVDKAVAAAKDAFENGEWGRMNARERGRLMYRLADLLEENQEE
470 480 490 500 510 520
100 110 120 130 140 150
pF1KB5 LGSLVSLEMGKILVEGVG-EVQEYVDICDYAVGLSRMIGGPILP--SERSGHAL-IEQWN
:... .:. : . . .. .. :. : .: : : .: . : .. : . . .
CCDS31 LATIEALDSGAVYTLALKTHIGMSVQTFRYFAGWCDKIQGSTIPINQARPNRNLTFTKKE
530 540 550 560 570 580
160 170 180 190 200 210
pF1KB5 PVGLVGIITAFNFPVAVYGWNNAIAMICGNVCLWKGAPTTSLISVAVTKIIAKVLEDNKL
:.:. .:: .:.:. . .:..: . ::. . : : .: : .. ... .:. .
CCDS31 PLGVCAIIIPWNYPLMMLAWKSAACLAAGNTLVLKPAQVTPLTALKFAELSVKA----GF
590 600 610 620 630
220 230 240 250 260 270
pF1KB5 PGAICSLTCGGADI-GTAMAKDERVNLLSFTGSTQVGKQVGLMVQ-ERFGRSLLELGGNN
: .. .. :.. : : ... . :.::::: .:::. . . :::::..
CCDS31 PKGVINIIPGSGGIAGQRLSEHPDIRKLGFTGSTPIGKQIMKSCAVSNLKKVSLELGGKS
640 650 660 670 680 690
280 290 300 310 320 330
pF1KB5 AIIAFEDADLSLVVPSALFAAVGTAGQRCTTARRLFIHESIHDEVVNRLKKAYAQIRVGN
.: :.: .:. .: .. :. . :. : .: :::..:::::: :.:. . ....:.
CCDS31 PLIIFNDCELDKAVRMGMGAVFFNKGENCIAAGRLFVEESIHDEFVTRVVEEIKKMKIGD
700 710 720 730 740 750
340 350 360 370 380 390
pF1KB5 PWDPNVLYGPLHTKQAVSMFLGAVEEAKKEGGTVVYGGKVMDRPGNYVEPTIVTGLGHDA
: : .. .:: . : . .: : . :::.:.::::. ..::: ..:::. : .
CCDS31 PLDRSTDHGPQNHKAHLEKLLQYCETGVKEGATLVYGGRQVQRPGFFMEPTVFTDVEDYM
760 770 780 790 800 810
400 410 420 430 440 450
pF1KB5 SIAHTETFAPILYVFKFKNEE--EVFAWNNEVKQGLSSSIFTKDLGRIFRWLGPKGSDCG
.:. :.:.::. . ::.: . :. : .. ::.:..::.:... . ... : . :
CCDS31 YLAKEESFGPIMVISKFQNGDIDGVLQRANSTEYGLASGVFTRDINKAM-YVSEK-LEAG
820 830 840 850 860 870
460 470 480 490 500 510
pF1KB5 IVNVNIPTSGAEIGGAFGGEKHTGGGRESGSDAWKQYMRRSTCTINYSKDLPLAQGIKFQ
: .: . ..... ::: :..: :.. : .: ..:.. .: :..:
CCDS31 TVFINT-YNKTDVAAPFGGVKQSGFGKDLGEEALNEYLKTKTVTLEY
880 890 900 910 920
>>CCDS10389.1 ALDH1A3 gene_id:220|Hs108|chr15 (512 aa)
initn: 602 init1: 368 opt: 720 Z-score: 910.3 bits: 178.0 E(32554): 2.2e-44
Smith-Waterman score: 720; 29.5% identity (62.9% similar) in 485 aa overlap (28-503:37-512)
10 20 30 40 50
pF1KB5 MSTLLINQPQYAWLKELGLREENEGVYNGSW--GGRGEVITTYCPANNEPIARVRQA
:. : . :. ..: :.. : : .:...
CCDS10 AVENGQPDRKPPALPRPIRNLEVKFTKIFINNEWHESKSGKKFATCNPSTREQICEVEEG
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB5 SVADYEETVKKAREAWK---IWADIPAPKRGEIVRQIGDALREKIQVLGSLVSLEMGKIL
. : ...:. :. :.. : . : .::....:..: ... .:..: ... :: .
CCDS10 DKPDVDKAVEAAQVAFQRGSPWRRLDALSRGRLLHQLADLVERDRATLAALETMDTGKPF
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB5 VEGVG-EVQEYVDICDYAVGLSRMIGGPILPSERSGHALIEQWNPVGLVGIITAFNFPVA
... ... . : .: . : : .:.. .. . . . .:.:. : :: .:::.
CCDS10 LHAFFIDLEGCIRTLRYFAGWADKIQGKTIPTD-DNVVCFTRHEPIGVCGAITPWNFPLL
130 140 150 160 170 180
180 190 200 210 220 230
pF1KB5 VYGWNNAIAMICGNVCLWKGAPTTSLISVAVTKIIAKVLEDNKLPGAICSLTCG-GADIG
. :. : :. :::. . : : : : .. ....... .: .. ... : : .:
CCDS10 MLVWKLAPALCCGNTMVLKPAEQTPLTAL----YLGSLIKEAGFPPGVVNIVPGFGPTVG
190 200 210 220 230 240
240 250 260 270 280
pF1KB5 TAMAKDERVNLLSFTGSTQVGKQVGLMVQER-FGRSLLELGGNNAIIAFEDADLSLVVPS
.:... ..: ..:::::.::: : ... . : :::::.: :. ::::.:.:
CCDS10 AAISSHPQINKIAFTGSTEVGKLVKEAASRSNLKRVTLELGGKNPCIVCADADLDLAVEC
250 260 270 280 290 300
290 300 310 320 330 340
pF1KB5 ALFAAVGTAGQRCTTARRLFIHESIHDEVVNRLKKAYAQIR-VGNPWDPNVLYGPLHTKQ
: .. . :: ::.: :.:..:....: : : . ::. : ::.:.: .. :: ..
CCDS10 AHQGVFFNQGQCCTAASRVFVEEQVYSEFVRR-SVEYAKKRPVGDPFDVKTEQGPQIDQK
310 320 330 340 350 360
350 360 370 380 390 400
pF1KB5 AVSMFLGAVEEAKKEGGTVVYGGKVMDRPGNYVEPTIVTGLGHDASIAHTETFAPILYVF
. .: .: .::::. . ::..:. : ...::. . . . ::. : :.:. ..
CCDS10 QFDKILELIESGKKEGAKLECGGSAMEDKGLFIKPTVFSEVTDNMRIAKEEIFGPVQPIL
370 380 390 400 410 420
410 420 430 440 450 460
pF1KB5 KFKNEEEVFAWNNEVKQGLSSSIFTKDLGRIFRWLGPKGSDCGIVNVNIPTSGAEIGGAF
:::. :::. : . ::....:::.: . .. .. . : : .: .. . :
CCDS10 KFKSIEEVIKRANSTDYGLTAAVFTKNLDKALKL--ASALESGTVWINC-YNALYAQAPF
430 440 450 460 470
470 480 490 500 510
pF1KB5 GGEKHTGGGRESGSDAWKQYMRRSTCTINYSKDLPLAQGIKFQ
:: : .:.::: : : .: . .: ::. . :
CCDS10 GGFKMSGNGRELGEYALAEYTEVKTVTIKLGDKNP
480 490 500 510
>>CCDS6644.1 ALDH1A1 gene_id:216|Hs108|chr9 (501 aa)
initn: 588 init1: 372 opt: 719 Z-score: 909.2 bits: 177.8 E(32554): 2.5e-44
Smith-Waterman score: 719; 29.2% identity (59.8% similar) in 490 aa overlap (28-500:26-498)
10 20 30 40 50
pF1KB5 MSTLLINQPQYAWLKELGLREENEGVYNGSWGGR--GEVITTYCPANNEPIARVRQASVA
:. : :. . .. ::..: . .:....
CCDS66 MSSSGTPDLPVLLTDLKIQYTKIFINNEWHDSVSGKKFPVFNPATEEELCQVEEGDKE
10 20 30 40 50
60 70 80 90 100 110
pF1KB5 DYEETVKKAREAWKI---WADIPAPKRGEIVRQIGDALREKIQVLGSLVSLEMGKILVEG
: ...:: ::.:..: : . : .::... ...: ... .:... :.. ::. ..
CCDS66 DVDKAVKAARQAFQIGSPWRTMDASERGRLLYKLADLIERDRLLLATMESMNGGKLYSNA
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB5 -VGEVQEYVDICDYAVGLSRMIGGPILPSERSGHALIEQWNPVGLVGIITAFNFPVAVYG
.... . : .: . : : .: . . . .. .:.:. : : .:::...
CCDS66 YLNDLAGCIKTLRYCAGWADKIQGRTIPIDGNFFTYTRH-EPIGVCGQIIPWNFPLVMLI
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB5 WNNAIAMICGNVCLWKGAPTTSLISVAVTKIIAKVLEDNKLPGAICSLTCGGADIGTAMA
:. . :. :::. . : : : : .. :...: : . ::.. . : :.:..
CCDS66 WKIGPALSCGNTVVVKPAEQTPLTALHVASLIK---EAGFPPGVVNIVPGYGPTAGAAIS
180 190 200 210 220 230
240 250 260 270 280
pF1KB5 KDERVNLLSFTGSTQVGKQVGLMVQERFGRS-----LLELGGNNAIIAFEDADLSLVVPS
. .. ..:::::.::: ...: :.: :::::.. :.. ::::. .:
CCDS66 SHMDIDKVAFTGSTEVGK----LIKEAAGKSNLKRVTLELGGKSPCIVLADADLDNAVEF
240 250 260 270 280 290
290 300 310 320 330 340
pF1KB5 ALFAAVGTAGQRCTTARRLFIHESIHDEVVNRLKKAYAQIRVGNPWDPNVLYGPLHTKQA
: .. :: : .: :.:..:::.:: : : . . .::: :.: :: :.
CCDS66 AHHGVFYHQGQCCIAASRIFVEESIYDEFVRRSVERAKKYILGNPLTPGVTQGPQIDKEQ
300 310 320 330 340 350
350 360 370 380 390 400
pF1KB5 VSMFLGAVEEAKKEGGTVVYGGKVMDRPGNYVEPTIVTGLGHDASIAHTETFAPILYVFK
. .: .: .::::. . :: : .:.::. ... . ::. : :.:. ..:
CCDS66 YDKILDLIESGKKEGAKLECGGGPWGNKGYFVQPTVFSNVTDEMRIAKEEIFGPVQQIMK
360 370 380 390 400 410
410 420 430 440 450 460
pF1KB5 FKNEEEVFAWNNEVKQGLSSSIFTKDLGRIFR-----WLGPKGSDC-GIVNVNIPTSGAE
::. ..:. :.. :::...::::. . . : .: :.:... :
CCDS66 FKSLDDVIKRANNTFYGLSAGVFTKDIDKAITISSALQAGTVWVNCYGVVSAQCP-----
420 430 440 450 460
470 480 490 500 510
pF1KB5 IGGAFGGEKHTGGGRESGSDAWKQYMRRSTCTINYSKDLPLAQGIKFQ
::: : .:.::: : ....: . .: :.. :.
CCDS66 ----FGGFKMSGNGRELGEYGFHEYTEVKTVTVKISQKNS
470 480 490 500
>>CCDS9155.1 ALDH2 gene_id:217|Hs108|chr12 (517 aa)
initn: 599 init1: 371 opt: 706 Z-score: 892.4 bits: 174.7 E(32554): 2.2e-43
Smith-Waterman score: 706; 30.4% identity (60.7% similar) in 484 aa overlap (23-496:37-510)
10 20 30 40 50
pF1KB5 MSTLLINQPQYAWLKELGLREENEGVYNGSWGG--RGEVITTYCPANNEPIA
:. :. : ... : :...: :
CCDS91 RFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNPSTGEVIC
10 20 30 40 50 60
60 70 80 90 100
pF1KB5 RVRQASVADYEETVKKAREAWKI---WADIPAPKRGEIVRQIGDALREKIQVLGSLVSLE
.: ... : ...:: :: :... : . : .::... ...: ... :..: .:.
CCDS91 QVAEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIERDRTYLAALETLD
70 80 90 100 110 120
110 120 130 140 150 160
pF1KB5 MGKILVEGVGEVQEYVDIC-DYAVGLSRMIGGPILPSERSGHALIEQWNPVGLVGIITAF
:: : . ..: : : .: . : .: . . . .. .:::. : : .
CCDS91 NGKPYVISYLVDLDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRH-EPVGVCGQIIPW
130 140 150 160 170 180
170 180 190 200 210 220
pF1KB5 NFPVAVYGWNNAIAMICGNVCLWKGAPTTSLISVAVTKIIAKVLEDNKLPGAICSLTCG-
:::. . .:. . :. ::: . : : : : .. : :..... .: .. ... :
CCDS91 NFPLLMQAWKLGPALATGNVVVMKVAEQTPLTALYV----ANLIKEAGFPPGVVNIVPGF
190 200 210 220 230 240
230 240 250 260 270 280
pF1KB5 GADIGTAMAKDERVNLLSFTGSTQVGKQVGLMV-QERFGRSLLELGGNNAIIAFEDADLS
: :.:.:. : :. ..:::::..:. . . . . . : :::::.. : . :::..
CCDS91 GPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDADMD
250 260 270 280 290 300
290 300 310 320 330 340
pF1KB5 LVVPSALFAAVGTAGQRCTTARRLFIHESIHDEVVNRLKKAYAQIRV-GNPWDPNVLYGP
.: .: :: . :: : .. : :..:.:.:: :.: . : :. :: :::.: .. ::
CCDS91 WAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVER-SVARAKSRVVGNPFDSKTEQGP
310 320 330 340 350 360
350 360 370 380 390 400
pF1KB5 LHTKQAVSMFLGAVEEAKKEGGTVVYGGKVMDRPGNYVEPTIVTGLGHDASIAHTETFAP
. . .:: .. .:.::. .. :: . : ...::. . .::. : :.:
CCDS91 QVDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIAKEEIFGP
370 380 390 400 410 420
410 420 430 440 450 460
pF1KB5 ILYVFKFKNEEEVFAWNNEVKQGLSSSIFTKDLGRIFRWLGPKGSDCGIVNVN-IPTSGA
.. ..:::. ::: . :. ::....::::: . .:. .. . : : :: . ::
CCDS91 VMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKA-NYLS-QALQAGTVWVNCYDVFGA
430 440 450 460 470
470 480 490 500 510
pF1KB5 EIGGAFGGEKHTGGGRESGSDAWKQYMRRSTCTINYSKDLPLAQGIKFQ
. . ::: : .:.::: : . . : . .: :.
CCDS91 Q--SPFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKNS
480 490 500 510
>>CCDS58850.1 ALDH1L1 gene_id:10840|Hs108|chr3 (801 aa)
initn: 509 init1: 333 opt: 697 Z-score: 878.1 bits: 172.7 E(32554): 1.4e-42
Smith-Waterman score: 697; 28.8% identity (62.0% similar) in 469 aa overlap (40-498:340-801)
10 20 30 40 50 60
pF1KB5 QYAWLKELGLREENEGVYNGSWGGRGEVITTYCPANNEPIARVRQASVADYEETVKKARE
: :... : .: :.:.: ...: :..
CCDS58 MAVNKRTVRMPHQLFIGGEFVDAEGAKTSETINPTDGSVICQVSLAQVTDVDKAVAAAKD
310 320 330 340 350 360
70 80 90 100 110 120
pF1KB5 AWKI--WADIPAPKRGEIVRQIGDALREKIQVLGSLVSLEMGKILVEGVG-EVQEYVDIC
:.. :. : : ::... ...: .... . :... .:. : . . .. .: ..
CCDS58 AFENGRWGKISARDRGRLMYRLADLMEQHQEELATIEALDAGAVYTLALKTHVGMSIQTF
370 380 390 400 410 420
130 140 150 160 170 180
pF1KB5 DYAVGLSRMIGGPILP--SERSGHAL-IEQWNPVGLVGIITAFNFPVAVYGWNNAIAMIC
: .: : : .: . : .. : . . .:::. ::: .:.:. . .:..: .
CCDS58 RYFAGWCDKIQGSTIPINQARPNRNLTLTRKEPVGVCGIIIPWNYPLMMLSWKTAACLAA
430 440 450 460 470 480
190 200 210 220 230 240
pF1KB5 GNVCLWKGAPTTSLISVAVTKIIAKVLEDNKLP-GAICSLTCGGADIGTAMAKDERVNLL
::. . : : .: : .. ... :. .: :.. : .:. .: .. : .
CCDS58 GNTVVIKPAQVTPLTALKFAELTLKA----GIPKGVVNVLPGSGSLVGQRLSDHPDVRKI
490 500 510 520 530 540
250 260 270 280 290 300
pF1KB5 SFTGSTQVGKQVGLMVQ-ERFGRSLLELGGNNAIIAFEDADLSLVVPSALFAAVGTAGQR
.:::::.:::.. . :::::.. .: : : ::. .: .. .. . :.
CCDS58 GFTGSTEVGKHIMKSCAISNVKKVSLELGGKSPLIIFADCDLNKAVQMGMSSVFFNKGEN
550 560 570 580 590 600
310 320 330 340 350 360
pF1KB5 CTTARRLFIHESIHDEVVNRLKKAYAQIRVGNPWDPNVLYGPLHTKQAVSMFLGAVEEAK
: .: :::...::::: : :. . ...:::: : .. .:: . . . .. ...
CCDS58 CIAAGRLFVEDSIHDEFVRRVVEEVRKMKVGNPLDRDTDHGPQNHHAHLVKLMEYCQHGV
610 620 630 640 650 660
370 380 390 400 410
pF1KB5 KEGGTVVYGGKVMDRPGNYVEPTIVTGLGHDASIAHTETFAPILYVFKFKNEE--EVFAW
:::.:.: ::. . ::: . :::. : . ::. :.:.:.. . .: . . :..
CCDS58 KEGATLVCGGNQVPRPGFFFEPTVFTDVEDHMFIAKEESFGPVMIISRFADGDLDAVLSR
670 680 690 700 710 720
420 430 440 450 460 470
pF1KB5 NNEVKQGLSSSIFTKDLGRIFRWLGPKGSDCGIVNVNIPTSGAEIGGAFGGEKHTGGGRE
: .. ::.:..::.:... . ... : . : : :: . ..... ::: :..: :..
CCDS58 ANATEFGLASGVFTRDINKAL-YVSDK-LQAGTVFVNT-YNKTDVAAPFGGFKQSGFGKD
730 740 750 760 770 780
480 490 500 510
pF1KB5 SGSDAWKQYMRRSTCTINYSKDLPLAQGIKFQ
: : ..:.: .: :..:
CCDS58 LGEAALNEYLRVKTVTFEY
790 800
511 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 02:31:46 2016 done: Sat Nov 5 02:31:47 2016
Total Scan time: 3.110 Total Display time: 0.110
Function used was FASTA [36.3.4 Apr, 2011]