FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE0376, 562 aa
1>>>pF1KE0376 562 - 562 aa - 562 aa
Library: /omim/omim.rfq.tfa
60827320 residues in 85289 sequences
Statistics: Expectation_n fit: rho(ln(x))= 4.7438+/-0.000374; mu= 22.2221+/- 0.023
mean_var=73.6510+/-15.415, 0's: 0 Z-trim(113.1): 128 B-trim: 29 in 1/49
Lambda= 0.149446
statistics sampled from 22196 (22325) to 22196 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.631), E-opt: 0.2 (0.262), width: 16
Scan time: 9.750
The best scores are: opt bits E(85289)
NP_001011719 (OMIM: 300586) arylsulfatase H [Homo ( 562) 3976 867.0 0
NP_001660 (OMIM: 300002) arylsulfatase D isoform a ( 593) 2651 581.4 2.8e-165
NP_000038 (OMIM: 300180,302950) arylsulfatase E is ( 589) 2429 533.5 7.1e-151
XP_005274576 (OMIM: 300180,302950) PREDICTED: aryl ( 589) 2429 533.5 7.1e-151
XP_005274575 (OMIM: 300180,302950) PREDICTED: aryl ( 598) 2429 533.5 7.2e-151
NP_001269557 (OMIM: 300180,302950) arylsulfatase E ( 614) 2429 533.5 7.3e-151
XP_016885014 (OMIM: 300180,302950) PREDICTED: aryl ( 614) 2429 533.5 7.3e-151
NP_001188468 (OMIM: 300003) arylsulfatase F precur ( 590) 2410 529.4 1.2e-149
NP_004033 (OMIM: 300003) arylsulfatase F precursor ( 590) 2410 529.4 1.2e-149
NP_001188467 (OMIM: 300003) arylsulfatase F precur ( 590) 2410 529.4 1.2e-149
XP_011543824 (OMIM: 300003) PREDICTED: arylsulfata ( 607) 2410 529.4 1.2e-149
XP_005274578 (OMIM: 300180,302950) PREDICTED: aryl ( 535) 2283 502.0 2e-141
NP_001269560 (OMIM: 300180,302950) arylsulfatase E ( 544) 2283 502.0 2e-141
NP_001307682 (OMIM: 300747,308100) steryl-sulfatas ( 578) 2063 454.6 4e-127
NP_001307683 (OMIM: 300747,308100) steryl-sulfatas ( 578) 2063 454.6 4e-127
NP_000342 (OMIM: 300747,308100) steryl-sulfatase i ( 583) 2063 454.6 4e-127
NP_001307681 (OMIM: 300747,308100) steryl-sulfatas ( 590) 2063 454.6 4.1e-127
NP_001307679 (OMIM: 300747,308100) steryl-sulfatas ( 590) 2063 454.6 4.1e-127
NP_001307680 (OMIM: 300747,308100) steryl-sulfatas ( 590) 2063 454.6 4.1e-127
XP_005274572 (OMIM: 300002) PREDICTED: arylsulfata ( 475) 2021 445.4 1.9e-124
XP_016885016 (OMIM: 300003) PREDICTED: arylsulfata ( 561) 1323 295.0 4.2e-79
XP_011543825 (OMIM: 300003) PREDICTED: arylsulfata ( 578) 1323 295.0 4.3e-79
XP_005274571 (OMIM: 300002) PREDICTED: arylsulfata ( 548) 1316 293.5 1.2e-78
NP_033667 (OMIM: 300002) arylsulfatase D isoform b ( 382) 1308 291.6 3e-78
XP_011543823 (OMIM: 300180,302950) PREDICTED: aryl ( 402) 1278 285.2 2.8e-76
XP_016885015 (OMIM: 300180,302950) PREDICTED: aryl ( 427) 1278 285.2 2.9e-76
XP_016885017 (OMIM: 300003) PREDICTED: arylsulfata ( 297) 969 218.4 2.5e-56
XP_011543826 (OMIM: 300003) PREDICTED: arylsulfata ( 462) 969 218.6 3.4e-56
NP_001310473 (OMIM: 253000,612222) N-acetylgalacto ( 528) 572 133.1 2.2e-30
NP_001310472 (OMIM: 253000,612222) N-acetylgalacto ( 337) 566 131.6 4e-30
XP_016878601 (OMIM: 253000,612222) PREDICTED: N-ac ( 508) 548 127.9 7.8e-29
XP_016878600 (OMIM: 253000,612222) PREDICTED: N-ac ( 511) 547 127.7 9.1e-29
XP_011521284 (OMIM: 253000,612222) PREDICTED: N-ac ( 581) 547 127.7 9.9e-29
XP_016878602 (OMIM: 253000,612222) PREDICTED: N-ac ( 390) 541 126.3 1.8e-28
NP_000503 (OMIM: 253000,612222) N-acetylgalactosam ( 522) 414 99.0 4e-20
XP_005256358 (OMIM: 253000,612222) PREDICTED: N-ac ( 575) 414 99.0 4.2e-20
XP_011528993 (OMIM: 250100,607574) PREDICTED: aryl ( 387) 401 96.1 2.2e-19
NP_001078894 (OMIM: 250100,607574) arylsulfatase A ( 509) 401 96.2 2.7e-19
NP_001078895 (OMIM: 250100,607574) arylsulfatase A ( 509) 401 96.2 2.7e-19
NP_001078896 (OMIM: 250100,607574) arylsulfatase A ( 509) 401 96.2 2.7e-19
NP_000478 (OMIM: 250100,607574) arylsulfatase A is ( 509) 401 96.2 2.7e-19
XP_016884289 (OMIM: 250100,607574) PREDICTED: aryl ( 547) 401 96.2 2.9e-19
XP_006721842 (OMIM: 610008) PREDICTED: arylsulfata ( 329) 376 90.6 8.3e-18
XP_005257229 (OMIM: 610008) PREDICTED: arylsulfata ( 344) 376 90.6 8.6e-18
XP_011522847 (OMIM: 610008) PREDICTED: arylsulfata ( 413) 376 90.7 9.8e-18
XP_016879857 (OMIM: 610008) PREDICTED: arylsulfata ( 413) 376 90.7 9.8e-18
XP_011522845 (OMIM: 610008) PREDICTED: arylsulfata ( 427) 376 90.7 1e-17
XP_011522846 (OMIM: 610008) PREDICTED: arylsulfata ( 427) 376 90.7 1e-17
XP_016879855 (OMIM: 610008) PREDICTED: arylsulfata ( 461) 376 90.8 1.1e-17
XP_016879856 (OMIM: 610008) PREDICTED: arylsulfata ( 461) 376 90.8 1.1e-17
>>NP_001011719 (OMIM: 300586) arylsulfatase H [Homo sapi (562 aa)
initn: 3976 init1: 3976 opt: 3976 Z-score: 4632.5 bits: 867.0 E(85289): 0
Smith-Waterman score: 3976; 100.0% identity (100.0% similar) in 562 aa overlap (1-562:1-562)
10 20 30 40 50 60
pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPNIDRLASEGVRLTQHLAAASMCTPSRA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPNIDRLASEGVRLTQHLAAASMCTPSRA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE0 AFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPTNETTFAKLLQHRGYRTGLIGKWHLGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 AFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPTNETTFAKLLQHRGYRTGLIGKWHLGL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE0 SCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQASKTPELHRWLRIKLWISTVALALVPFL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 SCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQASKTPELHRWLRIKLWISTVALALVPFL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE0 LLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSSYGFTRRWNCILMRNHEIIQQPMKEEK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 LLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSSYGFTRRWNCILMRNHEIIQQPMKEEK
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE0 VASLMLKEALAFIERYKREPFLLFFSFLHVHTPLISKKKFVGRSKYGRYGDNVEEMDWMV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 VASLMLKEALAFIERYKREPFLLFFSFLHVHTPLISKKKFVGRSKYGRYGDNVEEMDWMV
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE0 GKILDALDQERLANHTLVYFTSDNGGHLEPLDGAVQLGGWNGIYKGGKGMGGWEGGIRVP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 GKILDALDQERLANHTLVYFTSDNGGHLEPLDGAVQLGGWNGIYKGGKGMGGWEGGIRVP
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE0 GIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGGILSQDRVIDGQNLMPLLEGRASHSDH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 GIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGGILSQDRVIDGQNLMPLLEGRASHSDH
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE0 EFLFHYCGVYLHTVRWHQKDCATVWKAHYVTPKFYPEGTGACYGSGICSCSGDVTYHDPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 EFLFHYCGVYLHTVRWHQKDCATVWKAHYVTPKFYPEGTGACYGSGICSCSGDVTYHDPP
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE0 LLFDISRDPSEALPLNPDNEPLFDSVIKKMEAAIREHRRTLTPVPQQFSVFNTIWKPWLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 LLFDISRDPSEALPLNPDNEPLFDSVIKKMEAAIREHRRTLTPVPQQFSVFNTIWKPWLQ
490 500 510 520 530 540
550 560
pF1KE0 PCCGTFPFCGCDKEDDILPMAP
::::::::::::::::::::::
NP_001 PCCGTFPFCGCDKEDDILPMAP
550 560
>>NP_001660 (OMIM: 300002) arylsulfatase D isoform alpha (593 aa)
initn: 2293 init1: 1859 opt: 2651 Z-score: 3088.3 bits: 581.4 E(85289): 2.8e-165
Smith-Waterman score: 2651; 64.8% identity (84.5% similar) in 560 aa overlap (2-559:35-593)
10 20 30
pF1KE0 MTRNA-RPNIVLLMADDLGVGDLCCYGNNSV
: :: .:::.:.::::::.::: :::::..
NP_001 ARRGRAAPAARDSLPVLLFLCLLLKTCEPKTANAFKPNILLIMADDLGTGDLGCYGNNTL
10 20 30 40 50 60
40 50 60 70 80 90
pF1KE0 STPNIDRLASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSG
:::::.:: :::::::::::: .::::::::::::. .:::: .: : ::. : .:::
NP_001 RTPNIDQLAEEGVRLTQHLAAAPLCTPSRAAFLTGRHSFRSGM-DASNGYRALQWNAGSG
70 80 90 100 110 120
100 110 120 130 140 150
pF1KE0 GLPTNETTFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSD
::: ::::::..::..:: :::::::: :..::::.:::.::::::: ::::.:: : .:
NP_001 GLPENETTFARILQQHGYATGLIGKWHQGVNCASRGDHCHHPLNHGFDYFYGMPFTLTND
130 140 150 160 170 180
160 170 180 190 200 210
pF1KE0 CQASKTPELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTS
:. .. ::. :: .:: : ::: . : . .::: ... .: .. ::: :
NP_001 CDPGRPPEVDAALRAQLWGYTQFLALGILTLAAGQTCGFFSVSARAVTGMAGVGCLFFIS
190 200 210 220 230 240
220 230 240 250 260 270
pF1KE0 WYSSYGFTRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHV
::::.::.:::::::::::.. .::: ::.::::::::...:::.:. :::::.:.:::
NP_001 WYSSFGFVRRWNCILMRNHDVTEQPMVLEKTASLMLKEAVSYIERHKHGPFLLFLSLLHV
250 260 270 280 290 300
280 290 300 310 320 330
pF1KE0 HTPLISKKKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEP
: ::.. . :.:.:..: ::::::::::..::.:.:.... : : :..:::::.:::::
NP_001 HIPLVTTSAFLGKSQHGLYGDNVEEMDWLIGKVLNAIEDNGLKNSTFTYFTSDHGGHLEA
310 320 330 340 350 360
340 350 360 370 380 390
pF1KE0 LDGAVQLGGWNGIYKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSY
:: ::::::::::::::::::::::::::::.::.:: :::::.:::::::..::.
NP_001 RDGHSQLGGWNGIYKGGKGMGGWEGGIRVPGIFHWPGVLPAGRVIGEPTSLMDVFPTVVQ
370 380 390 400 410 420
400 410 420 430 440 450
pF1KE0 IGGGILSQDRVIDGQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKDCATVWKAHYV
. :: . :::::::..:.:::.: ..: ::::::::: .::..:::::: ..:::.::.
NP_001 LVGGEVPQDRVIDGHSLVPLLQGAEARSAHEFLFHYCGQHLHAARWHQKDSGSVWKVHYT
430 440 450 460 470 480
460 470 480 490 500
pF1KE0 TPKFYPEGTGACYGSGICSCSGD-VTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKK
::.:.:::.::::: :.: :::. ::.: ::::::.::::::: ::.::.:::. .:: .
NP_001 TPQFHPEGAGACYGRGVCPCSGEGVTHHRPPLLFDLSRDPSEARPLTPDSEPLYHAVIAR
490 500 510 520 530 540
510 520 530 540 550 560
pF1KE0 MEAAIREHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDILPMAP
. ::. :::.::.:::::::. : .:::::::::: ::::.: .. : :
NP_001 VGAAVSEHRQTLSPVPQQFSMSNILWKPWLQPCCGHFPFCSCHEDGDGTP
550 560 570 580 590
>>NP_000038 (OMIM: 300180,302950) arylsulfatase E isofor (589 aa)
initn: 2066 init1: 1642 opt: 2429 Z-score: 2829.6 bits: 533.5 E(85289): 7.1e-151
Smith-Waterman score: 2429; 60.8% identity (82.8% similar) in 553 aa overlap (5-556:36-587)
10 20 30
pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPN
.::::.::::::::.::. :::::.. :::
NP_000 HSCLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDIGCYGNNTMRTPN
10 20 30 40 50 60
40 50 60 70 80 90
pF1KE0 IDRLASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPT
::::: .::.::::..:::.::::::::::::::.::::::. . :.. : :.::::::
NP_000 IDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGY-RVLQWTGASGGLPT
70 80 90 100 110 120
100 110 120 130 140 150
pF1KE0 NETTFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQAS
:::::::.:...:: :::::::::::.: : .:::.:::.::: .:::.::.:..::
NP_000 NETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSLMGDCARW
130 140 150 160 170 180
160 170 180 190 200 210
pF1KE0 KTPELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSS
. : . :. :: . .:::: . :. :... . : : .. :: : :...: :
NP_000 ELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLLLASSYFV
190 200 210 220 230 240
220 230 240 250 260 270
pF1KE0 YGFTRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHVHTPL
.. . .:.::::: : .::: .... :.:.:. .:..: :. ::::: :::::: ::
NP_000 GALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPFLLFVSFLHVHIPL
250 260 270 280 290 300
280 290 300 310 320 330
pF1KE0 ISKKKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEPLDGA
:. ..:.:.: .: :::::::::::::.:::.:: : :.: ::.:::::.:: :: :
NP_000 ITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGGSLENQLGN
310 320 330 340 350 360
340 350 360 370 380 390
pF1KE0 VQLGGWNGIYKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGG
.: :::::::::::::::::::::::::::::.:: :::::.:::::::..::. ..::
NP_000 TQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFPTVVRLAGG
370 380 390 400 410 420
400 410 420 430 440 450
pF1KE0 ILSQDRVIDGQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKDCATVWKAHYVTPKF
. ::::::::.:.::: : :.:::::::.::: .::..::::.: .:.::.:.::: :
NP_000 EVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDRGTMWKVHFVTPVF
430 440 450 460 470 480
460 470 480 490 500 510
pF1KE0 YPEGTGACYGSGICSCSGD-VTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKKMEAA
:::.::::: .: : :. :..::::::::.::::::. :.: .::.: .:..... :
NP_000 QPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASEPVFYQVMERVQQA
490 500 510 520 530 540
520 530 540 550 560
pF1KE0 IREHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDILPMAP
. ::.:::.::: :.. ...::.:::::::: ::.: : .:::
NP_000 VWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ
550 560 570 580
>>XP_005274576 (OMIM: 300180,302950) PREDICTED: arylsulf (589 aa)
initn: 2066 init1: 1642 opt: 2429 Z-score: 2829.6 bits: 533.5 E(85289): 7.1e-151
Smith-Waterman score: 2429; 60.8% identity (82.8% similar) in 553 aa overlap (5-556:36-587)
10 20 30
pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPN
.::::.::::::::.::. :::::.. :::
XP_005 HSCLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDIGCYGNNTMRTPN
10 20 30 40 50 60
40 50 60 70 80 90
pF1KE0 IDRLASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPT
::::: .::.::::..:::.::::::::::::::.::::::. . :.. : :.::::::
XP_005 IDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGY-RVLQWTGASGGLPT
70 80 90 100 110 120
100 110 120 130 140 150
pF1KE0 NETTFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQAS
:::::::.:...:: :::::::::::.: : .:::.:::.::: .:::.::.:..::
XP_005 NETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSLMGDCARW
130 140 150 160 170 180
160 170 180 190 200 210
pF1KE0 KTPELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSS
. : . :. :: . .:::: . :. :... . : : .. :: : :...: :
XP_005 ELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLLLASSYFV
190 200 210 220 230 240
220 230 240 250 260 270
pF1KE0 YGFTRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHVHTPL
.. . .:.::::: : .::: .... :.:.:. .:..: :. ::::: :::::: ::
XP_005 GALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPFLLFVSFLHVHIPL
250 260 270 280 290 300
280 290 300 310 320 330
pF1KE0 ISKKKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEPLDGA
:. ..:.:.: .: :::::::::::::.:::.:: : :.: ::.:::::.:: :: :
XP_005 ITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGGSLENQLGN
310 320 330 340 350 360
340 350 360 370 380 390
pF1KE0 VQLGGWNGIYKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGG
.: :::::::::::::::::::::::::::::.:: :::::.:::::::..::. ..::
XP_005 TQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFPTVVRLAGG
370 380 390 400 410 420
400 410 420 430 440 450
pF1KE0 ILSQDRVIDGQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKDCATVWKAHYVTPKF
. ::::::::.:.::: : :.:::::::.::: .::..::::.: .:.::.:.::: :
XP_005 EVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDRGTMWKVHFVTPVF
430 440 450 460 470 480
460 470 480 490 500 510
pF1KE0 YPEGTGACYGSGICSCSGD-VTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKKMEAA
:::.::::: .: : :. :..::::::::.::::::. :.: .::.: .:..... :
XP_005 QPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASEPVFYQVMERVQQA
490 500 510 520 530 540
520 530 540 550 560
pF1KE0 IREHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDILPMAP
. ::.:::.::: :.. ...::.:::::::: ::.: : .:::
XP_005 VWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ
550 560 570 580
>>XP_005274575 (OMIM: 300180,302950) PREDICTED: arylsulf (598 aa)
initn: 2066 init1: 1642 opt: 2429 Z-score: 2829.6 bits: 533.5 E(85289): 7.2e-151
Smith-Waterman score: 2429; 60.8% identity (82.8% similar) in 553 aa overlap (5-556:45-596)
10 20 30
pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPN
.::::.::::::::.::. :::::.. :::
XP_005 HSCLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDIGCYGNNTMRTPN
20 30 40 50 60 70
40 50 60 70 80 90
pF1KE0 IDRLASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPT
::::: .::.::::..:::.::::::::::::::.::::::. . :.. : :.::::::
XP_005 IDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGY-RVLQWTGASGGLPT
80 90 100 110 120 130
100 110 120 130 140 150
pF1KE0 NETTFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQAS
:::::::.:...:: :::::::::::.: : .:::.:::.::: .:::.::.:..::
XP_005 NETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSLMGDCARW
140 150 160 170 180 190
160 170 180 190 200 210
pF1KE0 KTPELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSS
. : . :. :: . .:::: . :. :... . : : .. :: : :...: :
XP_005 ELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLLLASSYFV
200 210 220 230 240 250
220 230 240 250 260 270
pF1KE0 YGFTRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHVHTPL
.. . .:.::::: : .::: .... :.:.:. .:..: :. ::::: :::::: ::
XP_005 GALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPFLLFVSFLHVHIPL
260 270 280 290 300 310
280 290 300 310 320 330
pF1KE0 ISKKKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEPLDGA
:. ..:.:.: .: :::::::::::::.:::.:: : :.: ::.:::::.:: :: :
XP_005 ITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGGSLENQLGN
320 330 340 350 360 370
340 350 360 370 380 390
pF1KE0 VQLGGWNGIYKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGG
.: :::::::::::::::::::::::::::::.:: :::::.:::::::..::. ..::
XP_005 TQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFPTVVRLAGG
380 390 400 410 420 430
400 410 420 430 440 450
pF1KE0 ILSQDRVIDGQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKDCATVWKAHYVTPKF
. ::::::::.:.::: : :.:::::::.::: .::..::::.: .:.::.:.::: :
XP_005 EVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDRGTMWKVHFVTPVF
440 450 460 470 480 490
460 470 480 490 500 510
pF1KE0 YPEGTGACYGSGICSCSGD-VTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKKMEAA
:::.::::: .: : :. :..::::::::.::::::. :.: .::.: .:..... :
XP_005 QPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASEPVFYQVMERVQQA
500 510 520 530 540 550
520 530 540 550 560
pF1KE0 IREHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDILPMAP
. ::.:::.::: :.. ...::.:::::::: ::.: : .:::
XP_005 VWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ
560 570 580 590
>>NP_001269557 (OMIM: 300180,302950) arylsulfatase E iso (614 aa)
initn: 2066 init1: 1642 opt: 2429 Z-score: 2829.4 bits: 533.5 E(85289): 7.3e-151
Smith-Waterman score: 2429; 60.8% identity (82.8% similar) in 553 aa overlap (5-556:61-612)
10 20 30
pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPN
.::::.::::::::.::. :::::.. :::
NP_001 QISLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDIGCYGNNTMRTPN
40 50 60 70 80 90
40 50 60 70 80 90
pF1KE0 IDRLASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPT
::::: .::.::::..:::.::::::::::::::.::::::. . :.. : :.::::::
NP_001 IDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGY-RVLQWTGASGGLPT
100 110 120 130 140
100 110 120 130 140 150
pF1KE0 NETTFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQAS
:::::::.:...:: :::::::::::.: : .:::.:::.::: .:::.::.:..::
NP_001 NETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSLMGDCARW
150 160 170 180 190 200
160 170 180 190 200 210
pF1KE0 KTPELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSS
. : . :. :: . .:::: . :. :... . : : .. :: : :...: :
NP_001 ELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLLLASSYFV
210 220 230 240 250 260
220 230 240 250 260 270
pF1KE0 YGFTRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHVHTPL
.. . .:.::::: : .::: .... :.:.:. .:..: :. ::::: :::::: ::
NP_001 GALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPFLLFVSFLHVHIPL
270 280 290 300 310 320
280 290 300 310 320 330
pF1KE0 ISKKKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEPLDGA
:. ..:.:.: .: :::::::::::::.:::.:: : :.: ::.:::::.:: :: :
NP_001 ITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGGSLENQLGN
330 340 350 360 370 380
340 350 360 370 380 390
pF1KE0 VQLGGWNGIYKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGG
.: :::::::::::::::::::::::::::::.:: :::::.:::::::..::. ..::
NP_001 TQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFPTVVRLAGG
390 400 410 420 430 440
400 410 420 430 440 450
pF1KE0 ILSQDRVIDGQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKDCATVWKAHYVTPKF
. ::::::::.:.::: : :.:::::::.::: .::..::::.: .:.::.:.::: :
NP_001 EVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDRGTMWKVHFVTPVF
450 460 470 480 490 500
460 470 480 490 500 510
pF1KE0 YPEGTGACYGSGICSCSGD-VTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKKMEAA
:::.::::: .: : :. :..::::::::.::::::. :.: .::.: .:..... :
NP_001 QPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASEPVFYQVMERVQQA
510 520 530 540 550 560
520 530 540 550 560
pF1KE0 IREHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDILPMAP
. ::.:::.::: :.. ...::.:::::::: ::.: : .:::
NP_001 VWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ
570 580 590 600 610
>>XP_016885014 (OMIM: 300180,302950) PREDICTED: arylsulf (614 aa)
initn: 2066 init1: 1642 opt: 2429 Z-score: 2829.4 bits: 533.5 E(85289): 7.3e-151
Smith-Waterman score: 2429; 60.8% identity (82.8% similar) in 553 aa overlap (5-556:61-612)
10 20 30
pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPN
.::::.::::::::.::. :::::.. :::
XP_016 QISLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDIGCYGNNTMRTPN
40 50 60 70 80 90
40 50 60 70 80 90
pF1KE0 IDRLASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPT
::::: .::.::::..:::.::::::::::::::.::::::. . :.. : :.::::::
XP_016 IDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGY-RVLQWTGASGGLPT
100 110 120 130 140
100 110 120 130 140 150
pF1KE0 NETTFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQAS
:::::::.:...:: :::::::::::.: : .:::.:::.::: .:::.::.:..::
XP_016 NETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSLMGDCARW
150 160 170 180 190 200
160 170 180 190 200 210
pF1KE0 KTPELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSS
. : . :. :: . .:::: . :. :... . : : .. :: : :...: :
XP_016 ELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLLLASSYFV
210 220 230 240 250 260
220 230 240 250 260 270
pF1KE0 YGFTRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHVHTPL
.. . .:.::::: : .::: .... :.:.:. .:..: :. ::::: :::::: ::
XP_016 GALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPFLLFVSFLHVHIPL
270 280 290 300 310 320
280 290 300 310 320 330
pF1KE0 ISKKKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEPLDGA
:. ..:.:.: .: :::::::::::::.:::.:: : :.: ::.:::::.:: :: :
XP_016 ITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGGSLENQLGN
330 340 350 360 370 380
340 350 360 370 380 390
pF1KE0 VQLGGWNGIYKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGG
.: :::::::::::::::::::::::::::::.:: :::::.:::::::..::. ..::
XP_016 TQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFPTVVRLAGG
390 400 410 420 430 440
400 410 420 430 440 450
pF1KE0 ILSQDRVIDGQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKDCATVWKAHYVTPKF
. ::::::::.:.::: : :.:::::::.::: .::..::::.: .:.::.:.::: :
XP_016 EVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDRGTMWKVHFVTPVF
450 460 470 480 490 500
460 470 480 490 500 510
pF1KE0 YPEGTGACYGSGICSCSGD-VTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKKMEAA
:::.::::: .: : :. :..::::::::.::::::. :.: .::.: .:..... :
XP_016 QPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASEPVFYQVMERVQQA
510 520 530 540 550 560
520 530 540 550 560
pF1KE0 IREHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDILPMAP
. ::.:::.::: :.. ...::.:::::::: ::.: : .:::
XP_016 VWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ
570 580 590 600 610
>>NP_001188468 (OMIM: 300003) arylsulfatase F precursor (590 aa)
initn: 2139 init1: 1519 opt: 2410 Z-score: 2807.5 bits: 529.4 E(85289): 1.2e-149
Smith-Waterman score: 2410; 60.2% identity (82.0% similar) in 560 aa overlap (6-562:29-586)
10 20 30
pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPNIDR
.:::::.:.::::.::: ::::... ::.:::
NP_001 MRPRRPLVFMSLVCALLNTCQAHRVHDDKPNIVLIMVDDLGIGDLGCYGNDTMRTPHIDR
10 20 30 40 50 60
40 50 60 70 80 90
pF1KE0 LASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPTNET
:: ::::::::..:::.:.:::.:::::::::::::::. : :.. :. .::: :::
NP_001 LAREGVRLTQHISAASLCSPSRSAFLTGRYPIRSGMVSSGN-RRVIQNLAVPAGLPLNET
70 80 90 100 110
100 110 120 130 140 150
pF1KE0 TFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQASKTP
:.: ::...:: :::::::: ::.: ::.:.:.:: :.:: :.::.:: :...: . .
NP_001 TLAALLKKQGYSTGLIGKWHQGLNCDSRSDQCHHPYNYGFDYYYGMPFTLVDSCWPDPSR
120 130 140 150 160 170
160 170 180 190 200 210
pF1KE0 ELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSSYGF
. . .. .::. . .:.. . : . :.. : :::: .:: . :. ::. .:.::.
NP_001 NTELAFESQLWLCVQLVAIAILTLTFGKLSGWVSVPWLLIFSMILFIFLLGYAWFSSHTS
180 190 200 210 220 230
220 230 240 250 260 270
pF1KE0 TRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHVHTPLISK
:.:.:::.::: .:::: :...:.:.:::..:.::...: :::::::::::::: .
NP_001 PLYWDCLLMRGHEITEQPMKAERAGSIMVKEAISFLERHSKETFLLFFSFLHVHTPLPTT
240 250 260 270 280 290
280 290 300 310 320 330
pF1KE0 KKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEPLDGAVQL
:.: ::.: ::::::::: ::::::::.:. : :.::::::::.::::: : .::
NP_001 DDFTGTSKHGLYGDNVEEMDSMVGKILDAIDDFGLRNNTLVYFTSDHGGHLEARRGHAQL
300 310 320 330 340 350
340 350 360 370 380 390
pF1KE0 GGWNGIYKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGGILS
::::::::::::::::::::::::: :::. . :::.:.:::::::: ::.. ..:: :
NP_001 GGWNGIYKGGKGMGGWEGGIRVPGIVRWPGKVPAGRLIKEPTSLMDILPTVASVSGGSLP
360 370 380 390 400 410
400 410 420 430 440 450
pF1KE0 QDRVIDGQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKD-CATVWKAHYVTPKFYP
:::::::..:::::.: . ::.::::::::: :::.::: :: ..::::::::: : :
NP_001 QDRVIDGRDLMPLLQGNVRHSEHEFLFHYCGSYLHAVRWIPKDDSGSVWKAHYVTPVFQP
420 430 440 450 460 470
460 470 480 490 500 510
pF1KE0 EGTGACYGSGICSCSGD-VTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKKMEAAIR
..:.:: ...: : :. ::::.::::::.::::::. ::.: .::: : ::::. :..
NP_001 PASGGCYVTSLCRCFGEQVTYHNPPLLFDLSRDPSESTPLTPATEPLHDFVIKKVANALK
480 490 500 510 520 530
520 530 540 550 560
pF1KE0 EHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDI-LPMAP
::..:..:: :.: .: . ::.::::.:::: ::::... : .:
NP_001 EHQETIVPVTYQLSELNQ-GRTWLKPCCGVFPFCLCDKEEEVSQPRGPNEKR
540 550 560 570 580 590
>>NP_004033 (OMIM: 300003) arylsulfatase F precursor [Ho (590 aa)
initn: 2139 init1: 1519 opt: 2410 Z-score: 2807.5 bits: 529.4 E(85289): 1.2e-149
Smith-Waterman score: 2410; 60.2% identity (82.0% similar) in 560 aa overlap (6-562:29-586)
10 20 30
pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPNIDR
.:::::.:.::::.::: ::::... ::.:::
NP_004 MRPRRPLVFMSLVCALLNTCQAHRVHDDKPNIVLIMVDDLGIGDLGCYGNDTMRTPHIDR
10 20 30 40 50 60
40 50 60 70 80 90
pF1KE0 LASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPTNET
:: ::::::::..:::.:.:::.:::::::::::::::. : :.. :. .::: :::
NP_004 LAREGVRLTQHISAASLCSPSRSAFLTGRYPIRSGMVSSGN-RRVIQNLAVPAGLPLNET
70 80 90 100 110
100 110 120 130 140 150
pF1KE0 TFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQASKTP
:.: ::...:: :::::::: ::.: ::.:.:.:: :.:: :.::.:: :...: . .
NP_004 TLAALLKKQGYSTGLIGKWHQGLNCDSRSDQCHHPYNYGFDYYYGMPFTLVDSCWPDPSR
120 130 140 150 160 170
160 170 180 190 200 210
pF1KE0 ELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSSYGF
. . .. .::. . .:.. . : . :.. : :::: .:: . :. ::. .:.::.
NP_004 NTELAFESQLWLCVQLVAIAILTLTFGKLSGWVSVPWLLIFSMILFIFLLGYAWFSSHTS
180 190 200 210 220 230
220 230 240 250 260 270
pF1KE0 TRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHVHTPLISK
:.:.:::.::: .:::: :...:.:.:::..:.::...: :::::::::::::: .
NP_004 PLYWDCLLMRGHEITEQPMKAERAGSIMVKEAISFLERHSKETFLLFFSFLHVHTPLPTT
240 250 260 270 280 290
280 290 300 310 320 330
pF1KE0 KKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEPLDGAVQL
:.: ::.: ::::::::: ::::::::.:. : :.::::::::.::::: : .::
NP_004 DDFTGTSKHGLYGDNVEEMDSMVGKILDAIDDFGLRNNTLVYFTSDHGGHLEARRGHAQL
300 310 320 330 340 350
340 350 360 370 380 390
pF1KE0 GGWNGIYKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGGILS
::::::::::::::::::::::::: :::. . :::.:.:::::::: ::.. ..:: :
NP_004 GGWNGIYKGGKGMGGWEGGIRVPGIVRWPGKVPAGRLIKEPTSLMDILPTVASVSGGSLP
360 370 380 390 400 410
400 410 420 430 440 450
pF1KE0 QDRVIDGQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKD-CATVWKAHYVTPKFYP
:::::::..:::::.: . ::.::::::::: :::.::: :: ..::::::::: : :
NP_004 QDRVIDGRDLMPLLQGNVRHSEHEFLFHYCGSYLHAVRWIPKDDSGSVWKAHYVTPVFQP
420 430 440 450 460 470
460 470 480 490 500 510
pF1KE0 EGTGACYGSGICSCSGD-VTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKKMEAAIR
..:.:: ...: : :. ::::.::::::.::::::. ::.: .::: : ::::. :..
NP_004 PASGGCYVTSLCRCFGEQVTYHNPPLLFDLSRDPSESTPLTPATEPLHDFVIKKVANALK
480 490 500 510 520 530
520 530 540 550 560
pF1KE0 EHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDI-LPMAP
::..:..:: :.: .: . ::.::::.:::: ::::... : .:
NP_004 EHQETIVPVTYQLSELNQ-GRTWLKPCCGVFPFCLCDKEEEVSQPRGPNEKR
540 550 560 570 580 590
>>NP_001188467 (OMIM: 300003) arylsulfatase F precursor (590 aa)
initn: 2139 init1: 1519 opt: 2410 Z-score: 2807.5 bits: 529.4 E(85289): 1.2e-149
Smith-Waterman score: 2410; 60.2% identity (82.0% similar) in 560 aa overlap (6-562:29-586)
10 20 30
pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPNIDR
.:::::.:.::::.::: ::::... ::.:::
NP_001 MRPRRPLVFMSLVCALLNTCQAHRVHDDKPNIVLIMVDDLGIGDLGCYGNDTMRTPHIDR
10 20 30 40 50 60
40 50 60 70 80 90
pF1KE0 LASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPTNET
:: ::::::::..:::.:.:::.:::::::::::::::. : :.. :. .::: :::
NP_001 LAREGVRLTQHISAASLCSPSRSAFLTGRYPIRSGMVSSGN-RRVIQNLAVPAGLPLNET
70 80 90 100 110
100 110 120 130 140 150
pF1KE0 TFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQASKTP
:.: ::...:: :::::::: ::.: ::.:.:.:: :.:: :.::.:: :...: . .
NP_001 TLAALLKKQGYSTGLIGKWHQGLNCDSRSDQCHHPYNYGFDYYYGMPFTLVDSCWPDPSR
120 130 140 150 160 170
160 170 180 190 200 210
pF1KE0 ELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSSYGF
. . .. .::. . .:.. . : . :.. : :::: .:: . :. ::. .:.::.
NP_001 NTELAFESQLWLCVQLVAIAILTLTFGKLSGWVSVPWLLIFSMILFIFLLGYAWFSSHTS
180 190 200 210 220 230
220 230 240 250 260 270
pF1KE0 TRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHVHTPLISK
:.:.:::.::: .:::: :...:.:.:::..:.::...: :::::::::::::: .
NP_001 PLYWDCLLMRGHEITEQPMKAERAGSIMVKEAISFLERHSKETFLLFFSFLHVHTPLPTT
240 250 260 270 280 290
280 290 300 310 320 330
pF1KE0 KKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEPLDGAVQL
:.: ::.: ::::::::: ::::::::.:. : :.::::::::.::::: : .::
NP_001 DDFTGTSKHGLYGDNVEEMDSMVGKILDAIDDFGLRNNTLVYFTSDHGGHLEARRGHAQL
300 310 320 330 340 350
340 350 360 370 380 390
pF1KE0 GGWNGIYKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGGILS
::::::::::::::::::::::::: :::. . :::.:.:::::::: ::.. ..:: :
NP_001 GGWNGIYKGGKGMGGWEGGIRVPGIVRWPGKVPAGRLIKEPTSLMDILPTVASVSGGSLP
360 370 380 390 400 410
400 410 420 430 440 450
pF1KE0 QDRVIDGQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKD-CATVWKAHYVTPKFYP
:::::::..:::::.: . ::.::::::::: :::.::: :: ..::::::::: : :
NP_001 QDRVIDGRDLMPLLQGNVRHSEHEFLFHYCGSYLHAVRWIPKDDSGSVWKAHYVTPVFQP
420 430 440 450 460 470
460 470 480 490 500 510
pF1KE0 EGTGACYGSGICSCSGD-VTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKKMEAAIR
..:.:: ...: : :. ::::.::::::.::::::. ::.: .::: : ::::. :..
NP_001 PASGGCYVTSLCRCFGEQVTYHNPPLLFDLSRDPSESTPLTPATEPLHDFVIKKVANALK
480 490 500 510 520 530
520 530 540 550 560
pF1KE0 EHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDI-LPMAP
::..:..:: :.: .: . ::.::::.:::: ::::... : .:
NP_001 EHQETIVPVTYQLSELNQ-GRTWLKPCCGVFPFCLCDKEEEVSQPRGPNEKR
540 550 560 570 580 590
562 residues in 1 query sequences
60827320 residues in 85289 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 13:30:27 2016 done: Thu Nov 3 13:30:29 2016
Total Scan time: 9.750 Total Display time: 0.120
Function used was FASTA [36.3.4 Apr, 2011]