FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE0376, 562 aa 1>>>pF1KE0376 562 - 562 aa - 562 aa Library: /omim/omim.rfq.tfa 60827320 residues in 85289 sequences Statistics: Expectation_n fit: rho(ln(x))= 4.7438+/-0.000374; mu= 22.2221+/- 0.023 mean_var=73.6510+/-15.415, 0's: 0 Z-trim(113.1): 128 B-trim: 29 in 1/49 Lambda= 0.149446 statistics sampled from 22196 (22325) to 22196 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.631), E-opt: 0.2 (0.262), width: 16 Scan time: 9.750 The best scores are: opt bits E(85289) NP_001011719 (OMIM: 300586) arylsulfatase H [Homo ( 562) 3976 867.0 0 NP_001660 (OMIM: 300002) arylsulfatase D isoform a ( 593) 2651 581.4 2.8e-165 NP_000038 (OMIM: 300180,302950) arylsulfatase E is ( 589) 2429 533.5 7.1e-151 XP_005274576 (OMIM: 300180,302950) PREDICTED: aryl ( 589) 2429 533.5 7.1e-151 XP_005274575 (OMIM: 300180,302950) PREDICTED: aryl ( 598) 2429 533.5 7.2e-151 NP_001269557 (OMIM: 300180,302950) arylsulfatase E ( 614) 2429 533.5 7.3e-151 XP_016885014 (OMIM: 300180,302950) PREDICTED: aryl ( 614) 2429 533.5 7.3e-151 NP_001188468 (OMIM: 300003) arylsulfatase F precur ( 590) 2410 529.4 1.2e-149 NP_004033 (OMIM: 300003) arylsulfatase F precursor ( 590) 2410 529.4 1.2e-149 NP_001188467 (OMIM: 300003) arylsulfatase F precur ( 590) 2410 529.4 1.2e-149 XP_011543824 (OMIM: 300003) PREDICTED: arylsulfata ( 607) 2410 529.4 1.2e-149 XP_005274578 (OMIM: 300180,302950) PREDICTED: aryl ( 535) 2283 502.0 2e-141 NP_001269560 (OMIM: 300180,302950) arylsulfatase E ( 544) 2283 502.0 2e-141 NP_001307682 (OMIM: 300747,308100) steryl-sulfatas ( 578) 2063 454.6 4e-127 NP_001307683 (OMIM: 300747,308100) steryl-sulfatas ( 578) 2063 454.6 4e-127 NP_000342 (OMIM: 300747,308100) steryl-sulfatase i ( 583) 2063 454.6 4e-127 NP_001307681 (OMIM: 300747,308100) steryl-sulfatas ( 590) 2063 454.6 4.1e-127 NP_001307679 (OMIM: 300747,308100) steryl-sulfatas ( 590) 2063 454.6 4.1e-127 NP_001307680 (OMIM: 300747,308100) steryl-sulfatas ( 590) 2063 454.6 4.1e-127 XP_005274572 (OMIM: 300002) PREDICTED: arylsulfata ( 475) 2021 445.4 1.9e-124 XP_016885016 (OMIM: 300003) PREDICTED: arylsulfata ( 561) 1323 295.0 4.2e-79 XP_011543825 (OMIM: 300003) PREDICTED: arylsulfata ( 578) 1323 295.0 4.3e-79 XP_005274571 (OMIM: 300002) PREDICTED: arylsulfata ( 548) 1316 293.5 1.2e-78 NP_033667 (OMIM: 300002) arylsulfatase D isoform b ( 382) 1308 291.6 3e-78 XP_011543823 (OMIM: 300180,302950) PREDICTED: aryl ( 402) 1278 285.2 2.8e-76 XP_016885015 (OMIM: 300180,302950) PREDICTED: aryl ( 427) 1278 285.2 2.9e-76 XP_016885017 (OMIM: 300003) PREDICTED: arylsulfata ( 297) 969 218.4 2.5e-56 XP_011543826 (OMIM: 300003) PREDICTED: arylsulfata ( 462) 969 218.6 3.4e-56 NP_001310473 (OMIM: 253000,612222) N-acetylgalacto ( 528) 572 133.1 2.2e-30 NP_001310472 (OMIM: 253000,612222) N-acetylgalacto ( 337) 566 131.6 4e-30 XP_016878601 (OMIM: 253000,612222) PREDICTED: N-ac ( 508) 548 127.9 7.8e-29 XP_016878600 (OMIM: 253000,612222) PREDICTED: N-ac ( 511) 547 127.7 9.1e-29 XP_011521284 (OMIM: 253000,612222) PREDICTED: N-ac ( 581) 547 127.7 9.9e-29 XP_016878602 (OMIM: 253000,612222) PREDICTED: N-ac ( 390) 541 126.3 1.8e-28 NP_000503 (OMIM: 253000,612222) N-acetylgalactosam ( 522) 414 99.0 4e-20 XP_005256358 (OMIM: 253000,612222) PREDICTED: N-ac ( 575) 414 99.0 4.2e-20 XP_011528993 (OMIM: 250100,607574) PREDICTED: aryl ( 387) 401 96.1 2.2e-19 NP_001078894 (OMIM: 250100,607574) arylsulfatase A ( 509) 401 96.2 2.7e-19 NP_001078895 (OMIM: 250100,607574) arylsulfatase A ( 509) 401 96.2 2.7e-19 NP_001078896 (OMIM: 250100,607574) arylsulfatase A ( 509) 401 96.2 2.7e-19 NP_000478 (OMIM: 250100,607574) arylsulfatase A is ( 509) 401 96.2 2.7e-19 XP_016884289 (OMIM: 250100,607574) PREDICTED: aryl ( 547) 401 96.2 2.9e-19 XP_006721842 (OMIM: 610008) PREDICTED: arylsulfata ( 329) 376 90.6 8.3e-18 XP_005257229 (OMIM: 610008) PREDICTED: arylsulfata ( 344) 376 90.6 8.6e-18 XP_011522847 (OMIM: 610008) PREDICTED: arylsulfata ( 413) 376 90.7 9.8e-18 XP_016879857 (OMIM: 610008) PREDICTED: arylsulfata ( 413) 376 90.7 9.8e-18 XP_011522845 (OMIM: 610008) PREDICTED: arylsulfata ( 427) 376 90.7 1e-17 XP_011522846 (OMIM: 610008) PREDICTED: arylsulfata ( 427) 376 90.7 1e-17 XP_016879855 (OMIM: 610008) PREDICTED: arylsulfata ( 461) 376 90.8 1.1e-17 XP_016879856 (OMIM: 610008) PREDICTED: arylsulfata ( 461) 376 90.8 1.1e-17 >>NP_001011719 (OMIM: 300586) arylsulfatase H [Homo sapi (562 aa) initn: 3976 init1: 3976 opt: 3976 Z-score: 4632.5 bits: 867.0 E(85289): 0 Smith-Waterman score: 3976; 100.0% identity (100.0% similar) in 562 aa overlap (1-562:1-562) 10 20 30 40 50 60 pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPNIDRLASEGVRLTQHLAAASMCTPSRA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPNIDRLASEGVRLTQHLAAASMCTPSRA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 AFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPTNETTFAKLLQHRGYRTGLIGKWHLGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 AFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPTNETTFAKLLQHRGYRTGLIGKWHLGL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 SCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQASKTPELHRWLRIKLWISTVALALVPFL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 SCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQASKTPELHRWLRIKLWISTVALALVPFL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE0 LLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSSYGFTRRWNCILMRNHEIIQQPMKEEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 LLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSSYGFTRRWNCILMRNHEIIQQPMKEEK 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE0 VASLMLKEALAFIERYKREPFLLFFSFLHVHTPLISKKKFVGRSKYGRYGDNVEEMDWMV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 VASLMLKEALAFIERYKREPFLLFFSFLHVHTPLISKKKFVGRSKYGRYGDNVEEMDWMV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE0 GKILDALDQERLANHTLVYFTSDNGGHLEPLDGAVQLGGWNGIYKGGKGMGGWEGGIRVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 GKILDALDQERLANHTLVYFTSDNGGHLEPLDGAVQLGGWNGIYKGGKGMGGWEGGIRVP 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE0 GIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGGILSQDRVIDGQNLMPLLEGRASHSDH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 GIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGGILSQDRVIDGQNLMPLLEGRASHSDH 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE0 EFLFHYCGVYLHTVRWHQKDCATVWKAHYVTPKFYPEGTGACYGSGICSCSGDVTYHDPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 EFLFHYCGVYLHTVRWHQKDCATVWKAHYVTPKFYPEGTGACYGSGICSCSGDVTYHDPP 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE0 LLFDISRDPSEALPLNPDNEPLFDSVIKKMEAAIREHRRTLTPVPQQFSVFNTIWKPWLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 LLFDISRDPSEALPLNPDNEPLFDSVIKKMEAAIREHRRTLTPVPQQFSVFNTIWKPWLQ 490 500 510 520 530 540 550 560 pF1KE0 PCCGTFPFCGCDKEDDILPMAP :::::::::::::::::::::: NP_001 PCCGTFPFCGCDKEDDILPMAP 550 560 >>NP_001660 (OMIM: 300002) arylsulfatase D isoform alpha (593 aa) initn: 2293 init1: 1859 opt: 2651 Z-score: 3088.3 bits: 581.4 E(85289): 2.8e-165 Smith-Waterman score: 2651; 64.8% identity (84.5% similar) in 560 aa overlap (2-559:35-593) 10 20 30 pF1KE0 MTRNA-RPNIVLLMADDLGVGDLCCYGNNSV : :: .:::.:.::::::.::: :::::.. NP_001 ARRGRAAPAARDSLPVLLFLCLLLKTCEPKTANAFKPNILLIMADDLGTGDLGCYGNNTL 10 20 30 40 50 60 40 50 60 70 80 90 pF1KE0 STPNIDRLASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSG :::::.:: :::::::::::: .::::::::::::. .:::: .: : ::. : .::: NP_001 RTPNIDQLAEEGVRLTQHLAAAPLCTPSRAAFLTGRHSFRSGM-DASNGYRALQWNAGSG 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE0 GLPTNETTFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSD ::: ::::::..::..:: :::::::: :..::::.:::.::::::: ::::.:: : .: NP_001 GLPENETTFARILQQHGYATGLIGKWHQGVNCASRGDHCHHPLNHGFDYFYGMPFTLTND 130 140 150 160 170 180 160 170 180 190 200 210 pF1KE0 CQASKTPELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTS :. .. ::. :: .:: : ::: . : . .::: ... .: .. ::: : NP_001 CDPGRPPEVDAALRAQLWGYTQFLALGILTLAAGQTCGFFSVSARAVTGMAGVGCLFFIS 190 200 210 220 230 240 220 230 240 250 260 270 pF1KE0 WYSSYGFTRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHV ::::.::.:::::::::::.. .::: ::.::::::::...:::.:. :::::.:.::: NP_001 WYSSFGFVRRWNCILMRNHDVTEQPMVLEKTASLMLKEAVSYIERHKHGPFLLFLSLLHV 250 260 270 280 290 300 280 290 300 310 320 330 pF1KE0 HTPLISKKKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEP : ::.. . :.:.:..: ::::::::::..::.:.:.... : : :..:::::.::::: NP_001 HIPLVTTSAFLGKSQHGLYGDNVEEMDWLIGKVLNAIEDNGLKNSTFTYFTSDHGGHLEA 310 320 330 340 350 360 340 350 360 370 380 390 pF1KE0 LDGAVQLGGWNGIYKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSY :: ::::::::::::::::::::::::::::.::.:: :::::.:::::::..::. NP_001 RDGHSQLGGWNGIYKGGKGMGGWEGGIRVPGIFHWPGVLPAGRVIGEPTSLMDVFPTVVQ 370 380 390 400 410 420 400 410 420 430 440 450 pF1KE0 IGGGILSQDRVIDGQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKDCATVWKAHYV . :: . :::::::..:.:::.: ..: ::::::::: .::..:::::: ..:::.::. NP_001 LVGGEVPQDRVIDGHSLVPLLQGAEARSAHEFLFHYCGQHLHAARWHQKDSGSVWKVHYT 430 440 450 460 470 480 460 470 480 490 500 pF1KE0 TPKFYPEGTGACYGSGICSCSGD-VTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKK ::.:.:::.::::: :.: :::. ::.: ::::::.::::::: ::.::.:::. .:: . NP_001 TPQFHPEGAGACYGRGVCPCSGEGVTHHRPPLLFDLSRDPSEARPLTPDSEPLYHAVIAR 490 500 510 520 530 540 510 520 530 540 550 560 pF1KE0 MEAAIREHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDILPMAP . ::. :::.::.:::::::. : .:::::::::: ::::.: .. : : NP_001 VGAAVSEHRQTLSPVPQQFSMSNILWKPWLQPCCGHFPFCSCHEDGDGTP 550 560 570 580 590 >>NP_000038 (OMIM: 300180,302950) arylsulfatase E isofor (589 aa) initn: 2066 init1: 1642 opt: 2429 Z-score: 2829.6 bits: 533.5 E(85289): 7.1e-151 Smith-Waterman score: 2429; 60.8% identity (82.8% similar) in 553 aa overlap (5-556:36-587) 10 20 30 pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPN .::::.::::::::.::. :::::.. ::: NP_000 HSCLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDIGCYGNNTMRTPN 10 20 30 40 50 60 40 50 60 70 80 90 pF1KE0 IDRLASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPT ::::: .::.::::..:::.::::::::::::::.::::::. . :.. : :.:::::: NP_000 IDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGY-RVLQWTGASGGLPT 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE0 NETTFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQAS :::::::.:...:: :::::::::::.: : .:::.:::.::: .:::.::.:..:: NP_000 NETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSLMGDCARW 130 140 150 160 170 180 160 170 180 190 200 210 pF1KE0 KTPELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSS . : . :. :: . .:::: . :. :... . : : .. :: : :...: : NP_000 ELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLLLASSYFV 190 200 210 220 230 240 220 230 240 250 260 270 pF1KE0 YGFTRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHVHTPL .. . .:.::::: : .::: .... :.:.:. .:..: :. ::::: :::::: :: NP_000 GALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPFLLFVSFLHVHIPL 250 260 270 280 290 300 280 290 300 310 320 330 pF1KE0 ISKKKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEPLDGA :. ..:.:.: .: :::::::::::::.:::.:: : :.: ::.:::::.:: :: : NP_000 ITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGGSLENQLGN 310 320 330 340 350 360 340 350 360 370 380 390 pF1KE0 VQLGGWNGIYKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGG .: :::::::::::::::::::::::::::::.:: :::::.:::::::..::. ..:: NP_000 TQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFPTVVRLAGG 370 380 390 400 410 420 400 410 420 430 440 450 pF1KE0 ILSQDRVIDGQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKDCATVWKAHYVTPKF . ::::::::.:.::: : :.:::::::.::: .::..::::.: .:.::.:.::: : NP_000 EVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDRGTMWKVHFVTPVF 430 440 450 460 470 480 460 470 480 490 500 510 pF1KE0 YPEGTGACYGSGICSCSGD-VTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKKMEAA :::.::::: .: : :. :..::::::::.::::::. :.: .::.: .:..... : NP_000 QPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASEPVFYQVMERVQQA 490 500 510 520 530 540 520 530 540 550 560 pF1KE0 IREHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDILPMAP . ::.:::.::: :.. ...::.:::::::: ::.: : .::: NP_000 VWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ 550 560 570 580 >>XP_005274576 (OMIM: 300180,302950) PREDICTED: arylsulf (589 aa) initn: 2066 init1: 1642 opt: 2429 Z-score: 2829.6 bits: 533.5 E(85289): 7.1e-151 Smith-Waterman score: 2429; 60.8% identity (82.8% similar) in 553 aa overlap (5-556:36-587) 10 20 30 pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPN .::::.::::::::.::. :::::.. ::: XP_005 HSCLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDIGCYGNNTMRTPN 10 20 30 40 50 60 40 50 60 70 80 90 pF1KE0 IDRLASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPT ::::: .::.::::..:::.::::::::::::::.::::::. . :.. : :.:::::: XP_005 IDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGY-RVLQWTGASGGLPT 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE0 NETTFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQAS :::::::.:...:: :::::::::::.: : .:::.:::.::: .:::.::.:..:: XP_005 NETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSLMGDCARW 130 140 150 160 170 180 160 170 180 190 200 210 pF1KE0 KTPELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSS . : . :. :: . .:::: . :. :... . : : .. :: : :...: : XP_005 ELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLLLASSYFV 190 200 210 220 230 240 220 230 240 250 260 270 pF1KE0 YGFTRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHVHTPL .. . .:.::::: : .::: .... :.:.:. .:..: :. ::::: :::::: :: XP_005 GALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPFLLFVSFLHVHIPL 250 260 270 280 290 300 280 290 300 310 320 330 pF1KE0 ISKKKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEPLDGA :. ..:.:.: .: :::::::::::::.:::.:: : :.: ::.:::::.:: :: : XP_005 ITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGGSLENQLGN 310 320 330 340 350 360 340 350 360 370 380 390 pF1KE0 VQLGGWNGIYKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGG .: :::::::::::::::::::::::::::::.:: :::::.:::::::..::. ..:: XP_005 TQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFPTVVRLAGG 370 380 390 400 410 420 400 410 420 430 440 450 pF1KE0 ILSQDRVIDGQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKDCATVWKAHYVTPKF . ::::::::.:.::: : :.:::::::.::: .::..::::.: .:.::.:.::: : XP_005 EVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDRGTMWKVHFVTPVF 430 440 450 460 470 480 460 470 480 490 500 510 pF1KE0 YPEGTGACYGSGICSCSGD-VTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKKMEAA :::.::::: .: : :. :..::::::::.::::::. :.: .::.: .:..... : XP_005 QPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASEPVFYQVMERVQQA 490 500 510 520 530 540 520 530 540 550 560 pF1KE0 IREHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDILPMAP . ::.:::.::: :.. ...::.:::::::: ::.: : .::: XP_005 VWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ 550 560 570 580 >>XP_005274575 (OMIM: 300180,302950) PREDICTED: arylsulf (598 aa) initn: 2066 init1: 1642 opt: 2429 Z-score: 2829.6 bits: 533.5 E(85289): 7.2e-151 Smith-Waterman score: 2429; 60.8% identity (82.8% similar) in 553 aa overlap (5-556:45-596) 10 20 30 pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPN .::::.::::::::.::. :::::.. ::: XP_005 HSCLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDIGCYGNNTMRTPN 20 30 40 50 60 70 40 50 60 70 80 90 pF1KE0 IDRLASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPT ::::: .::.::::..:::.::::::::::::::.::::::. . :.. : :.:::::: XP_005 IDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGY-RVLQWTGASGGLPT 80 90 100 110 120 130 100 110 120 130 140 150 pF1KE0 NETTFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQAS :::::::.:...:: :::::::::::.: : .:::.:::.::: .:::.::.:..:: XP_005 NETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSLMGDCARW 140 150 160 170 180 190 160 170 180 190 200 210 pF1KE0 KTPELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSS . : . :. :: . .:::: . :. :... . : : .. :: : :...: : XP_005 ELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLLLASSYFV 200 210 220 230 240 250 220 230 240 250 260 270 pF1KE0 YGFTRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHVHTPL .. . .:.::::: : .::: .... :.:.:. .:..: :. ::::: :::::: :: XP_005 GALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPFLLFVSFLHVHIPL 260 270 280 290 300 310 280 290 300 310 320 330 pF1KE0 ISKKKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEPLDGA :. ..:.:.: .: :::::::::::::.:::.:: : :.: ::.:::::.:: :: : XP_005 ITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGGSLENQLGN 320 330 340 350 360 370 340 350 360 370 380 390 pF1KE0 VQLGGWNGIYKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGG .: :::::::::::::::::::::::::::::.:: :::::.:::::::..::. ..:: XP_005 TQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFPTVVRLAGG 380 390 400 410 420 430 400 410 420 430 440 450 pF1KE0 ILSQDRVIDGQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKDCATVWKAHYVTPKF . ::::::::.:.::: : :.:::::::.::: .::..::::.: .:.::.:.::: : XP_005 EVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDRGTMWKVHFVTPVF 440 450 460 470 480 490 460 470 480 490 500 510 pF1KE0 YPEGTGACYGSGICSCSGD-VTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKKMEAA :::.::::: .: : :. :..::::::::.::::::. :.: .::.: .:..... : XP_005 QPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASEPVFYQVMERVQQA 500 510 520 530 540 550 520 530 540 550 560 pF1KE0 IREHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDILPMAP . ::.:::.::: :.. ...::.:::::::: ::.: : .::: XP_005 VWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ 560 570 580 590 >>NP_001269557 (OMIM: 300180,302950) arylsulfatase E iso (614 aa) initn: 2066 init1: 1642 opt: 2429 Z-score: 2829.4 bits: 533.5 E(85289): 7.3e-151 Smith-Waterman score: 2429; 60.8% identity (82.8% similar) in 553 aa overlap (5-556:61-612) 10 20 30 pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPN .::::.::::::::.::. :::::.. ::: NP_001 QISLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDIGCYGNNTMRTPN 40 50 60 70 80 90 40 50 60 70 80 90 pF1KE0 IDRLASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPT ::::: .::.::::..:::.::::::::::::::.::::::. . :.. : :.:::::: NP_001 IDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGY-RVLQWTGASGGLPT 100 110 120 130 140 100 110 120 130 140 150 pF1KE0 NETTFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQAS :::::::.:...:: :::::::::::.: : .:::.:::.::: .:::.::.:..:: NP_001 NETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSLMGDCARW 150 160 170 180 190 200 160 170 180 190 200 210 pF1KE0 KTPELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSS . : . :. :: . .:::: . :. :... . : : .. :: : :...: : NP_001 ELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLLLASSYFV 210 220 230 240 250 260 220 230 240 250 260 270 pF1KE0 YGFTRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHVHTPL .. . .:.::::: : .::: .... :.:.:. .:..: :. ::::: :::::: :: NP_001 GALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPFLLFVSFLHVHIPL 270 280 290 300 310 320 280 290 300 310 320 330 pF1KE0 ISKKKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEPLDGA :. ..:.:.: .: :::::::::::::.:::.:: : :.: ::.:::::.:: :: : NP_001 ITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGGSLENQLGN 330 340 350 360 370 380 340 350 360 370 380 390 pF1KE0 VQLGGWNGIYKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGG .: :::::::::::::::::::::::::::::.:: :::::.:::::::..::. ..:: NP_001 TQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFPTVVRLAGG 390 400 410 420 430 440 400 410 420 430 440 450 pF1KE0 ILSQDRVIDGQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKDCATVWKAHYVTPKF . ::::::::.:.::: : :.:::::::.::: .::..::::.: .:.::.:.::: : NP_001 EVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDRGTMWKVHFVTPVF 450 460 470 480 490 500 460 470 480 490 500 510 pF1KE0 YPEGTGACYGSGICSCSGD-VTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKKMEAA :::.::::: .: : :. :..::::::::.::::::. :.: .::.: .:..... : NP_001 QPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASEPVFYQVMERVQQA 510 520 530 540 550 560 520 530 540 550 560 pF1KE0 IREHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDILPMAP . ::.:::.::: :.. ...::.:::::::: ::.: : .::: NP_001 VWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ 570 580 590 600 610 >>XP_016885014 (OMIM: 300180,302950) PREDICTED: arylsulf (614 aa) initn: 2066 init1: 1642 opt: 2429 Z-score: 2829.4 bits: 533.5 E(85289): 7.3e-151 Smith-Waterman score: 2429; 60.8% identity (82.8% similar) in 553 aa overlap (5-556:61-612) 10 20 30 pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPN .::::.::::::::.::. :::::.. ::: XP_016 QISLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDIGCYGNNTMRTPN 40 50 60 70 80 90 40 50 60 70 80 90 pF1KE0 IDRLASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPT ::::: .::.::::..:::.::::::::::::::.::::::. . :.. : :.:::::: XP_016 IDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGY-RVLQWTGASGGLPT 100 110 120 130 140 100 110 120 130 140 150 pF1KE0 NETTFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQAS :::::::.:...:: :::::::::::.: : .:::.:::.::: .:::.::.:..:: XP_016 NETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSLMGDCARW 150 160 170 180 190 200 160 170 180 190 200 210 pF1KE0 KTPELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSS . : . :. :: . .:::: . :. :... . : : .. :: : :...: : XP_016 ELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLLLASSYFV 210 220 230 240 250 260 220 230 240 250 260 270 pF1KE0 YGFTRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHVHTPL .. . .:.::::: : .::: .... :.:.:. .:..: :. ::::: :::::: :: XP_016 GALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPFLLFVSFLHVHIPL 270 280 290 300 310 320 280 290 300 310 320 330 pF1KE0 ISKKKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEPLDGA :. ..:.:.: .: :::::::::::::.:::.:: : :.: ::.:::::.:: :: : XP_016 ITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGGSLENQLGN 330 340 350 360 370 380 340 350 360 370 380 390 pF1KE0 VQLGGWNGIYKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGG .: :::::::::::::::::::::::::::::.:: :::::.:::::::..::. ..:: XP_016 TQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFPTVVRLAGG 390 400 410 420 430 440 400 410 420 430 440 450 pF1KE0 ILSQDRVIDGQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKDCATVWKAHYVTPKF . ::::::::.:.::: : :.:::::::.::: .::..::::.: .:.::.:.::: : XP_016 EVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDRGTMWKVHFVTPVF 450 460 470 480 490 500 460 470 480 490 500 510 pF1KE0 YPEGTGACYGSGICSCSGD-VTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKKMEAA :::.::::: .: : :. :..::::::::.::::::. :.: .::.: .:..... : XP_016 QPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASEPVFYQVMERVQQA 510 520 530 540 550 560 520 530 540 550 560 pF1KE0 IREHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDILPMAP . ::.:::.::: :.. ...::.:::::::: ::.: : .::: XP_016 VWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ 570 580 590 600 610 >>NP_001188468 (OMIM: 300003) arylsulfatase F precursor (590 aa) initn: 2139 init1: 1519 opt: 2410 Z-score: 2807.5 bits: 529.4 E(85289): 1.2e-149 Smith-Waterman score: 2410; 60.2% identity (82.0% similar) in 560 aa overlap (6-562:29-586) 10 20 30 pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPNIDR .:::::.:.::::.::: ::::... ::.::: NP_001 MRPRRPLVFMSLVCALLNTCQAHRVHDDKPNIVLIMVDDLGIGDLGCYGNDTMRTPHIDR 10 20 30 40 50 60 40 50 60 70 80 90 pF1KE0 LASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPTNET :: ::::::::..:::.:.:::.:::::::::::::::. : :.. :. .::: ::: NP_001 LAREGVRLTQHISAASLCSPSRSAFLTGRYPIRSGMVSSGN-RRVIQNLAVPAGLPLNET 70 80 90 100 110 100 110 120 130 140 150 pF1KE0 TFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQASKTP :.: ::...:: :::::::: ::.: ::.:.:.:: :.:: :.::.:: :...: . . NP_001 TLAALLKKQGYSTGLIGKWHQGLNCDSRSDQCHHPYNYGFDYYYGMPFTLVDSCWPDPSR 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE0 ELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSSYGF . . .. .::. . .:.. . : . :.. : :::: .:: . :. ::. .:.::. NP_001 NTELAFESQLWLCVQLVAIAILTLTFGKLSGWVSVPWLLIFSMILFIFLLGYAWFSSHTS 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE0 TRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHVHTPLISK :.:.:::.::: .:::: :...:.:.:::..:.::...: :::::::::::::: . NP_001 PLYWDCLLMRGHEITEQPMKAERAGSIMVKEAISFLERHSKETFLLFFSFLHVHTPLPTT 240 250 260 270 280 290 280 290 300 310 320 330 pF1KE0 KKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEPLDGAVQL :.: ::.: ::::::::: ::::::::.:. : :.::::::::.::::: : .:: NP_001 DDFTGTSKHGLYGDNVEEMDSMVGKILDAIDDFGLRNNTLVYFTSDHGGHLEARRGHAQL 300 310 320 330 340 350 340 350 360 370 380 390 pF1KE0 GGWNGIYKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGGILS ::::::::::::::::::::::::: :::. . :::.:.:::::::: ::.. ..:: : NP_001 GGWNGIYKGGKGMGGWEGGIRVPGIVRWPGKVPAGRLIKEPTSLMDILPTVASVSGGSLP 360 370 380 390 400 410 400 410 420 430 440 450 pF1KE0 QDRVIDGQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKD-CATVWKAHYVTPKFYP :::::::..:::::.: . ::.::::::::: :::.::: :: ..::::::::: : : NP_001 QDRVIDGRDLMPLLQGNVRHSEHEFLFHYCGSYLHAVRWIPKDDSGSVWKAHYVTPVFQP 420 430 440 450 460 470 460 470 480 490 500 510 pF1KE0 EGTGACYGSGICSCSGD-VTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKKMEAAIR ..:.:: ...: : :. ::::.::::::.::::::. ::.: .::: : ::::. :.. NP_001 PASGGCYVTSLCRCFGEQVTYHNPPLLFDLSRDPSESTPLTPATEPLHDFVIKKVANALK 480 490 500 510 520 530 520 530 540 550 560 pF1KE0 EHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDI-LPMAP ::..:..:: :.: .: . ::.::::.:::: ::::... : .: NP_001 EHQETIVPVTYQLSELNQ-GRTWLKPCCGVFPFCLCDKEEEVSQPRGPNEKR 540 550 560 570 580 590 >>NP_004033 (OMIM: 300003) arylsulfatase F precursor [Ho (590 aa) initn: 2139 init1: 1519 opt: 2410 Z-score: 2807.5 bits: 529.4 E(85289): 1.2e-149 Smith-Waterman score: 2410; 60.2% identity (82.0% similar) in 560 aa overlap (6-562:29-586) 10 20 30 pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPNIDR .:::::.:.::::.::: ::::... ::.::: NP_004 MRPRRPLVFMSLVCALLNTCQAHRVHDDKPNIVLIMVDDLGIGDLGCYGNDTMRTPHIDR 10 20 30 40 50 60 40 50 60 70 80 90 pF1KE0 LASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPTNET :: ::::::::..:::.:.:::.:::::::::::::::. : :.. :. .::: ::: NP_004 LAREGVRLTQHISAASLCSPSRSAFLTGRYPIRSGMVSSGN-RRVIQNLAVPAGLPLNET 70 80 90 100 110 100 110 120 130 140 150 pF1KE0 TFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQASKTP :.: ::...:: :::::::: ::.: ::.:.:.:: :.:: :.::.:: :...: . . NP_004 TLAALLKKQGYSTGLIGKWHQGLNCDSRSDQCHHPYNYGFDYYYGMPFTLVDSCWPDPSR 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE0 ELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSSYGF . . .. .::. . .:.. . : . :.. : :::: .:: . :. ::. .:.::. NP_004 NTELAFESQLWLCVQLVAIAILTLTFGKLSGWVSVPWLLIFSMILFIFLLGYAWFSSHTS 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE0 TRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHVHTPLISK :.:.:::.::: .:::: :...:.:.:::..:.::...: :::::::::::::: . NP_004 PLYWDCLLMRGHEITEQPMKAERAGSIMVKEAISFLERHSKETFLLFFSFLHVHTPLPTT 240 250 260 270 280 290 280 290 300 310 320 330 pF1KE0 KKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEPLDGAVQL :.: ::.: ::::::::: ::::::::.:. : :.::::::::.::::: : .:: NP_004 DDFTGTSKHGLYGDNVEEMDSMVGKILDAIDDFGLRNNTLVYFTSDHGGHLEARRGHAQL 300 310 320 330 340 350 340 350 360 370 380 390 pF1KE0 GGWNGIYKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGGILS ::::::::::::::::::::::::: :::. . :::.:.:::::::: ::.. ..:: : NP_004 GGWNGIYKGGKGMGGWEGGIRVPGIVRWPGKVPAGRLIKEPTSLMDILPTVASVSGGSLP 360 370 380 390 400 410 400 410 420 430 440 450 pF1KE0 QDRVIDGQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKD-CATVWKAHYVTPKFYP :::::::..:::::.: . ::.::::::::: :::.::: :: ..::::::::: : : NP_004 QDRVIDGRDLMPLLQGNVRHSEHEFLFHYCGSYLHAVRWIPKDDSGSVWKAHYVTPVFQP 420 430 440 450 460 470 460 470 480 490 500 510 pF1KE0 EGTGACYGSGICSCSGD-VTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKKMEAAIR ..:.:: ...: : :. ::::.::::::.::::::. ::.: .::: : ::::. :.. NP_004 PASGGCYVTSLCRCFGEQVTYHNPPLLFDLSRDPSESTPLTPATEPLHDFVIKKVANALK 480 490 500 510 520 530 520 530 540 550 560 pF1KE0 EHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDI-LPMAP ::..:..:: :.: .: . ::.::::.:::: ::::... : .: NP_004 EHQETIVPVTYQLSELNQ-GRTWLKPCCGVFPFCLCDKEEEVSQPRGPNEKR 540 550 560 570 580 590 >>NP_001188467 (OMIM: 300003) arylsulfatase F precursor (590 aa) initn: 2139 init1: 1519 opt: 2410 Z-score: 2807.5 bits: 529.4 E(85289): 1.2e-149 Smith-Waterman score: 2410; 60.2% identity (82.0% similar) in 560 aa overlap (6-562:29-586) 10 20 30 pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPNIDR .:::::.:.::::.::: ::::... ::.::: NP_001 MRPRRPLVFMSLVCALLNTCQAHRVHDDKPNIVLIMVDDLGIGDLGCYGNDTMRTPHIDR 10 20 30 40 50 60 40 50 60 70 80 90 pF1KE0 LASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPTNET :: ::::::::..:::.:.:::.:::::::::::::::. : :.. :. .::: ::: NP_001 LAREGVRLTQHISAASLCSPSRSAFLTGRYPIRSGMVSSGN-RRVIQNLAVPAGLPLNET 70 80 90 100 110 100 110 120 130 140 150 pF1KE0 TFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQASKTP :.: ::...:: :::::::: ::.: ::.:.:.:: :.:: :.::.:: :...: . . NP_001 TLAALLKKQGYSTGLIGKWHQGLNCDSRSDQCHHPYNYGFDYYYGMPFTLVDSCWPDPSR 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE0 ELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSSYGF . . .. .::. . .:.. . : . :.. : :::: .:: . :. ::. .:.::. NP_001 NTELAFESQLWLCVQLVAIAILTLTFGKLSGWVSVPWLLIFSMILFIFLLGYAWFSSHTS 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE0 TRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHVHTPLISK :.:.:::.::: .:::: :...:.:.:::..:.::...: :::::::::::::: . NP_001 PLYWDCLLMRGHEITEQPMKAERAGSIMVKEAISFLERHSKETFLLFFSFLHVHTPLPTT 240 250 260 270 280 290 280 290 300 310 320 330 pF1KE0 KKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEPLDGAVQL :.: ::.: ::::::::: ::::::::.:. : :.::::::::.::::: : .:: NP_001 DDFTGTSKHGLYGDNVEEMDSMVGKILDAIDDFGLRNNTLVYFTSDHGGHLEARRGHAQL 300 310 320 330 340 350 340 350 360 370 380 390 pF1KE0 GGWNGIYKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGGILS ::::::::::::::::::::::::: :::. . :::.:.:::::::: ::.. ..:: : NP_001 GGWNGIYKGGKGMGGWEGGIRVPGIVRWPGKVPAGRLIKEPTSLMDILPTVASVSGGSLP 360 370 380 390 400 410 400 410 420 430 440 450 pF1KE0 QDRVIDGQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKD-CATVWKAHYVTPKFYP :::::::..:::::.: . ::.::::::::: :::.::: :: ..::::::::: : : NP_001 QDRVIDGRDLMPLLQGNVRHSEHEFLFHYCGSYLHAVRWIPKDDSGSVWKAHYVTPVFQP 420 430 440 450 460 470 460 470 480 490 500 510 pF1KE0 EGTGACYGSGICSCSGD-VTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKKMEAAIR ..:.:: ...: : :. ::::.::::::.::::::. ::.: .::: : ::::. :.. NP_001 PASGGCYVTSLCRCFGEQVTYHNPPLLFDLSRDPSESTPLTPATEPLHDFVIKKVANALK 480 490 500 510 520 530 520 530 540 550 560 pF1KE0 EHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDI-LPMAP ::..:..:: :.: .: . ::.::::.:::: ::::... : .: NP_001 EHQETIVPVTYQLSELNQ-GRTWLKPCCGVFPFCLCDKEEEVSQPRGPNEKR 540 550 560 570 580 590 562 residues in 1 query sequences 60827320 residues in 85289 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 13:30:27 2016 done: Thu Nov 3 13:30:29 2016 Total Scan time: 9.750 Total Display time: 0.120 Function used was FASTA [36.3.4 Apr, 2011]