FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA1093, 1722 aa
1>>>pF1KSDA1093 1722 - 1722 aa - 1722 aa
Library: /omim/omim.rfq.tfa
60827320 residues in 85289 sequences
Statistics: Expectation_n fit: rho(ln(x))= 12.3398+/-0.000446; mu= -6.5047+/- 0.028
mean_var=457.5053+/-93.869, 0's: 0 Z-trim(122.9): 59 B-trim: 217 in 1/58
Lambda= 0.059962
statistics sampled from 41819 (41899) to 41819 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.758), E-opt: 0.2 (0.491), width: 16
Scan time: 22.010
The best scores are: opt bits E(85289)
NP_055903 (OMIM: 610740) trinucleotide repeat-cont (1723) 12064 1059.6 0
NP_001155973 (OMIM: 610740) trinucleotide repeat-c (1833) 6670 593.0 8.4e-168
NP_001020014 (OMIM: 610740) trinucleotide repeat-c (1029) 5546 495.5 1e-138
XP_016878638 (OMIM: 610739) PREDICTED: trinucleoti (1911) 2476 230.2 1.4e-58
NP_001317449 (OMIM: 610739) trinucleotide repeat-c (1913) 2343 218.7 4.1e-55
XP_016878636 (OMIM: 610739) PREDICTED: trinucleoti (1922) 2343 218.7 4.1e-55
XP_016878640 (OMIM: 610739) PREDICTED: trinucleoti (1863) 2308 215.7 3.3e-54
XP_016878643 (OMIM: 610739) PREDICTED: trinucleoti (1698) 2024 191.1 7.7e-47
XP_016878633 (OMIM: 610739) PREDICTED: trinucleoti (1960) 2024 191.1 8.5e-47
XP_016878637 (OMIM: 610739) PREDICTED: trinucleoti (1912) 2020 190.7 1.1e-46
XP_005255314 (OMIM: 610739) PREDICTED: trinucleoti (1709) 2017 190.4 1.2e-46
XP_016878642 (OMIM: 610739) PREDICTED: trinucleoti (1709) 2017 190.4 1.2e-46
XP_016878641 (OMIM: 610739) PREDICTED: trinucleoti (1829) 2017 190.5 1.2e-46
XP_016878635 (OMIM: 610739) PREDICTED: trinucleoti (1946) 2017 190.5 1.3e-46
NP_055309 (OMIM: 610739) trinucleotide repeat-cont (1962) 2017 190.5 1.3e-46
XP_016878632 (OMIM: 610739) PREDICTED: trinucleoti (1971) 2017 190.5 1.3e-46
XP_016878639 (OMIM: 610739) PREDICTED: trinucleoti (1899) 1990 188.2 6.4e-46
XP_016878634 (OMIM: 610739) PREDICTED: trinucleoti (1948) 1823 173.7 1.5e-41
XP_006722060 (OMIM: 610741) PREDICTED: trinucleoti (1921) 1528 148.2 6.9e-34
XP_016880397 (OMIM: 610741) PREDICTED: trinucleoti (1896) 1453 141.7 6.2e-32
XP_011523390 (OMIM: 610741) PREDICTED: trinucleoti (1729) 1447 141.1 8.2e-32
XP_006722059 (OMIM: 610741) PREDICTED: trinucleoti (1971) 1447 141.2 9.1e-32
NP_001136112 (OMIM: 610741) trinucleotide repeat-c (1726) 1405 137.5 1e-30
XP_016880395 (OMIM: 610741) PREDICTED: trinucleoti (1968) 1405 137.6 1.1e-30
NP_061869 (OMIM: 610741) trinucleotide repeat-cont (1690) 1058 107.5 1.1e-21
XP_016880396 (OMIM: 610741) PREDICTED: trinucleoti (1932) 1058 107.5 1.2e-21
XP_006722063 (OMIM: 610741) PREDICTED: trinucleoti (1929) 1029 105.0 6.9e-21
NP_055023 (OMIM: 125420,125485,125490,125500,60559 (1301) 347 45.9 0.003
>>NP_055903 (OMIM: 610740) trinucleotide repeat-containi (1723 aa)
initn: 8547 init1: 8547 opt: 12064 Z-score: 5655.8 bits: 1059.6 E(85289): 0
Smith-Waterman score: 12064; 99.9% identity (99.9% similar) in 1723 aa overlap (1-1722:1-1723)
10 20 30 40 50 60
pF1KSD MREKEQEREEQLMEDKKRKKEDKKKKEATQKVTEQKTKVPEVTKPSLSQPTAASPIGSSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_055 MREKEQEREEQLMEDKKRKKEDKKKKEATQKVTEQKTKVPEVTKPSLSQPTAASPIGSSP
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD SPPVNGGNNAKRVAVPNGQPPSAARYMPREVPPRFRCQQDHKVLLKRGQPPPPSCMLLGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_055 SPPVNGGNNAKRVAVPNGQPPSAARYMPREVPPRFRCQQDHKVLLKRGQPPPPSCMLLGG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD GAGPPPCTAPGANPNNAQVTGALLQSESGTAPDSTLGGAAASNYANSTWGSGASSNNGTS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_055 GAGPPPCTAPGANPNNAQVTGALLQSESGTAPDSTLGGAAASNYANSTWGSGASSNNGTS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD PNPIHIWDKVIVDGSDMEEWPCIASKDTESSSENTTDNNSASNPGSEKSTLPGSTTSNKG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_055 PNPIHIWDKVIVDGSDMEEWPCIASKDTESSSENTTDNNSASNPGSEKSTLPGSTTSNKG
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD KGSQCQSASSGNECNLGVWKSDPKAKSVQSSNSTTENNNGLGNWRNVSGQDRIGPGSGFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_055 KGSQCQSASSGNECNLGVWKSDPKAKSVQSSNSTTENNNGLGNWRNVSGQDRIGPGSGFS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD NFNPNSNPSAWPALVQEGTSRKGALETDNSNSSAQVSTVGQTSREQQSKMENAGVNFVVS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_055 NFNPNSNPSAWPALVQEGTSRKGALETDNSNSSAQVSTVGQTSREQQSKMENAGVNFVVS
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD GREQAQIHNTDGPKNGNTNSLNLSSPNPMENKGMPFGMGLGNTSRSTDAPSQSTGDRKTG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_055 GREQAQIHNTDGPKNGNTNSLNLSSPNPMENKGMPFGMGLGNTSRSTDAPSQSTGDRKTG
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD SVGSWGAARGPSGTDTVSGQSNSGNNGNNGKEREDSWKGASVQKSTGSKNDSWDNNNRST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_055 SVGSWGAARGPSGTDTVSGQSNSGNNGNNGKEREDSWKGASVQKSTGSKNDSWDNNNRST
430 440 450 460 470 480
490 500 510 520 530 540
pF1KSD GGSWNFGPQDSNDNKWGEGNKMTSGVSQGEWKQPTGSDELKIGEWSGPNQPNSSTGAWDN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_055 GGSWNFGPQDSNDNKWGEGNKMTSGVSQGEWKQPTGSDELKIGEWSGPNQPNSSTGAWDN
490 500 510 520 530 540
550 560 570 580 590 600
pF1KSD QKGHPLPENQGNAQAPCWGRSSSSTGSEVGGQSTGSNHKAGSSDSHNSGRRSYRPTHPDC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_055 QKGHPLPENQGNAQAPCWGRSSSSTGSEVGGQSTGSNHKAGSSDSHNSGRRSYRPTHPDC
550 560 570 580 590 600
610 620 630 640 650 660
pF1KSD QAVLQTLLSRTDLDPRVLSNTGWGQTQIKQDTVWDIEEVPRPEGKSDKGTEGWESAATQT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_055 QAVLQTLLSRTDLDPRVLSNTGWGQTQIKQDTVWDIEEVPRPEGKSDKGTEGWESAATQT
610 620 630 640 650 660
670 680 690 700 710 720
pF1KSD KNSGGWGDAPSQSNQMKSGWGELSASTEWKDPKNTGGWNDYKNNNSSNWGGGRPDEKTPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_055 KNSGGWGDAPSQSNQMKSGWGELSASTEWKDPKNTGGWNDYKNNNSSNWGGGRPDEKTPS
670 680 690 700 710 720
730 740 750 760 770 780
pF1KSD SWNENPSKDQGWGGGRQPNQGWSSGKNGWGEEVDQTKNSNWESSASKPVSGWGEGGQNEI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_055 SWNENPSKDQGWGGGRQPNQGWSSGKNGWGEEVDQTKNSNWESSASKPVSGWGEGGQNEI
730 740 750 760 770 780
790 800 810 820 830 840
pF1KSD GTWGNGGNASLASKGGWEDCKRSPAWNETGRQPNSWNKQHQQQQPPQQPPPPQPEASGSW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_055 GTWGNGGNASLASKGGWEDCKRSPAWNETGRQPNSWNKQHQQQQPPQQPPPPQPEASGSW
790 800 810 820 830 840
850 860 870 880 890 900
pF1KSD GGPPPPPPGNVRPSNSSWSSGPQPATPKDEEPSGWEEPSPQSISRKMDIDDGTSAWGDPN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_055 GGPPPPPPGNVRPSNSSWSSGPQPATPKDEEPSGWEEPSPQSISRKMDIDDGTSAWGDPN
850 860 870 880 890 900
910 920 930 940 950 960
pF1KSD SYNYKNVNLWDKNSQGGPAPREPNLPTPMTSKSASDSKSMQDGWGESDGPVTGARHPSWE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_055 SYNYKNVNLWDKNSQGGPAPREPNLPTPMTSKSASDSKSMQDGWGESDGPVTGARHPSWE
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KSD EEEDGGVWNTTGSQGSASSHNSASWGQGGKKQMKCSLKGGNNDSWMNPLAKQFSNMGLLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_055 EEEDGGVWNTTGSQGSASSHNSASWGQGGKKQMKCSLKGGNNDSWMNPLAKQFSNMGLLS
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KSD QTEDNPSSKMDLSVGSLSDKKFDVDKRAMNLGDFNDIMRKDRSGFRPPNSKDMGTTDSGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_055 QTEDNPSSKMDLSVGSLSDKKFDVDKRAMNLGDFNDIMRKDRSGFRPPNSKDMGTTDSGP
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KSD YFEKGGSHGLFGNSTAQSRGLHTPVQPLNSSPSLRAQVPPQFISPQVSASMLKQFPNSGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_055 YFEKGGSHGLFGNSTAQSRGLHTPVQPLNSSPSLRAQVPPQFISPQVSASMLKQFPNSGL
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KSD SPGLFNVGPQLSPQQIAMLSQLPQIPQFQLACQLLLQQQQQQQLLQNQRKISQAVRQQQE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_055 SPGLFNVGPQLSPQQIAMLSQLPQIPQFQLACQLLLQQQQQQQLLQNQRKISQAVRQQQE
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250
pF1KSD QQLARMVSALQQQQQQQ-RQPGMKHSPSHPVGPKPHLDNMVPNALNVGLPDLQTKGPIPG
::::::::::::::::: ::::::::::::::::::::::::::::::::::::::::::
NP_055 QQLARMVSALQQQQQQQQRQPGMKHSPSHPVGPKPHLDNMVPNALNVGLPDLQTKGPIPG
1210 1220 1230 1240 1250 1260
1260 1270 1280 1290 1300 1310
pF1KSD YGSGFSSGGMDYGMVGGKEAGTESRFKQWTSMMEGLPSVATQEANMHKNGAIVAPGKTRG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_055 YGSGFSSGGMDYGMVGGKEAGTESRFKQWTSMMEGLPSVATQEANMHKNGAIVAPGKTRG
1270 1280 1290 1300 1310 1320
1320 1330 1340 1350 1360 1370
pF1KSD GSPYNQFDIIPGDTLGGHTGPAGDSWLPAKSPPTNKIGSKSSNASWPPEFQPGVPWKGIQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_055 GSPYNQFDIIPGDTLGGHTGPAGDSWLPAKSPPTNKIGSKSSNASWPPEFQPGVPWKGIQ
1330 1340 1350 1360 1370 1380
1380 1390 1400 1410 1420 1430
pF1KSD NIDPESDPYVTPGSVLGGTATSPIVDTDHQLLRDNTTGSNSSLNTSLPSPGAWPYSASDN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_055 NIDPESDPYVTPGSVLGGTATSPIVDTDHQLLRDNTTGSNSSLNTSLPSPGAWPYSASDN
1390 1400 1410 1420 1430 1440
1440 1450 1460 1470 1480 1490
pF1KSD SFTNVHSTSAKFPDYKSTWSPDPIGHNPTHLSNKMWKNHISSRNTTPLPRPPPGLTNPKP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_055 SFTNVHSTSAKFPDYKSTWSPDPIGHNPTHLSNKMWKNHISSRNTTPLPRPPPGLTNPKP
1450 1460 1470 1480 1490 1500
1500 1510 1520 1530 1540 1550
pF1KSD SSPWSSTAPRSVRGWGTQDSRLASASTWSDGGSVRPSYWLVLHNLTPQIDGSTLRTICMQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_055 SSPWSSTAPRSVRGWGTQDSRLASASTWSDGGSVRPSYWLVLHNLTPQIDGSTLRTICMQ
1510 1520 1530 1540 1550 1560
1560 1570 1580 1590 1600 1610
pF1KSD HGPLLTFHLNLTQGTALIRYSTKQEAAKAQTALHMCVLGNTTILAEFATDDEVSRFLAQA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_055 HGPLLTFHLNLTQGTALIRYSTKQEAAKAQTALHMCVLGNTTILAEFATDDEVSRFLAQA
1570 1580 1590 1600 1610 1620
1620 1630 1640 1650 1660 1670
pF1KSD QPPTPAATPSAPAAGWQSLETGQNQSDPVGPALNLFGGSTGLGQWSSSAGGSSGADLAGA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_055 QPPTPAATPSAPAAGWQSLETGQNQSDPVGPALNLFGGSTGLGQWSSSAGGSSGADLAGA
1630 1640 1650 1660 1670 1680
1680 1690 1700 1710 1720
pF1KSD SLWGPPNYSSSLWGVPTVEDPHRMGSPAPLLPGDLLGGGSDSI
:::::::::::::::::::::::::::::::::::::::::::
NP_055 SLWGPPNYSSSLWGVPTVEDPHRMGSPAPLLPGDLLGGGSDSI
1690 1700 1710 1720
>>NP_001155973 (OMIM: 610740) trinucleotide repeat-conta (1833 aa)
initn: 11267 init1: 6616 opt: 6670 Z-score: 3133.6 bits: 593.0 E(85289): 8.4e-168
Smith-Waterman score: 11261; 93.6% identity (93.7% similar) in 1754 aa overlap (1-1643:1-1754)
10 20 30 40 50 60
pF1KSD MREKEQEREEQLMEDKKRKKEDKKKKEATQKVTEQKTKVPEVTKPSLSQPTAASPIGSSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 MREKEQEREEQLMEDKKRKKEDKKKKEATQKVTEQKTKVPEVTKPSLSQPTAASPIGSSP
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD SPPVNGGNNAKRVAVPNGQPPSAARYMPREVPPRFRCQQDHKVLLKRGQPPPPSCMLLGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 SPPVNGGNNAKRVAVPNGQPPSAARYMPREVPPRFRCQQDHKVLLKRGQPPPPSCMLLGG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD GAGPPPCTAPGANPNNAQVTGALLQSESGTAPDSTLGGAAASNYANSTWGSGASSNNGTS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 GAGPPPCTAPGANPNNAQVTGALLQSESGTAPDSTLGGAAASNYANSTWGSGASSNNGTS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD PNPIHIWDKVIVDGSDMEEWPCIASKDTESSSENTTDNNSASNPGSEKSTLPGSTTSNKG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 PNPIHIWDKVIVDGSDMEEWPCIASKDTESSSENTTDNNSASNPGSEKSTLPGSTTSNKG
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD KGSQCQSASSGNECNLGVWKSDPKAKSVQSSNSTTENNNGLGNWRNVSGQDRIGPGSGFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 KGSQCQSASSGNECNLGVWKSDPKAKSVQSSNSTTENNNGLGNWRNVSGQDRIGPGSGFS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD NFNPNSNPSAWPALVQEGTSRKGALETDNSNSSAQVSTVGQTSREQQSKMENAGVNFVVS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 NFNPNSNPSAWPALVQEGTSRKGALETDNSNSSAQVSTVGQTSREQQSKMENAGVNFVVS
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD GREQAQIHNTDGPKNGNTNSLNLSSPNPMENKGMPFGMGLGNTSRSTDAPSQSTGDRKTG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 GREQAQIHNTDGPKNGNTNSLNLSSPNPMENKGMPFGMGLGNTSRSTDAPSQSTGDRKTG
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD SVGSWGAARGPSGTDTVSGQSNSGNNGNNGKEREDSWKGASVQKSTGSKNDSWDNNNRST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 SVGSWGAARGPSGTDTVSGQSNSGNNGNNGKEREDSWKGASVQKSTGSKNDSWDNNNRST
430 440 450 460 470 480
490 500 510 520 530 540
pF1KSD GGSWNFGPQDSNDNKWGEGNKMTSGVSQGEWKQPTGSDELKIGEWSGPNQPNSSTGAWDN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 GGSWNFGPQDSNDNKWGEGNKMTSGVSQGEWKQPTGSDELKIGEWSGPNQPNSSTGAWDN
490 500 510 520 530 540
550 560 570 580 590 600
pF1KSD QKGHPLPENQGNAQAPCWGRSSSSTGSEVGGQSTGSNHKAGSSDSHNSGRRSYRPTHPDC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 QKGHPLPENQGNAQAPCWGRSSSSTGSEVGGQSTGSNHKAGSSDSHNSGRRSYRPTHPDC
550 560 570 580 590 600
610 620 630 640 650 660
pF1KSD QAVLQTLLSRTDLDPRVLSNTGWGQTQIKQDTVWDIEEVPRPEGKSDKGTEGWESAATQT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 QAVLQTLLSRTDLDPRVLSNTGWGQTQIKQDTVWDIEEVPRPEGKSDKGTEGWESAATQT
610 620 630 640 650 660
670 680 690 700 710 720
pF1KSD KNSGGWGDAPSQSNQMKSGWGELSASTEWKDPKNTGGWNDYKNNNSSNWGGGRPDEKTPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 KNSGGWGDAPSQSNQMKSGWGELSASTEWKDPKNTGGWNDYKNNNSSNWGGGRPDEKTPS
670 680 690 700 710 720
730 740 750 760 770 780
pF1KSD SWNENPSKDQGWGGGRQPNQGWSSGKNGWGEEVDQTKNSNWESSASKPVSGWGEGGQNEI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 SWNENPSKDQGWGGGRQPNQGWSSGKNGWGEEVDQTKNSNWESSASKPVSGWGEGGQNEI
730 740 750 760 770 780
790 800 810 820 830 840
pF1KSD GTWGNGGNASLASKGGWEDCKRSPAWNETGRQPNSWNKQHQQQQPPQQPPPPQPEASGSW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 GTWGNGGNASLASKGGWEDCKRSPAWNETGRQPNSWNKQHQQQQPPQQPPPPQPEASGSW
790 800 810 820 830 840
850 860 870 880 890 900
pF1KSD GGPPPPPPGNVRPSNSSWSSGPQPATPKDEEPSGWEEPSPQSISRKMDIDDGTSAWGDPN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 GGPPPPPPGNVRPSNSSWSSGPQPATPKDEEPSGWEEPSPQSISRKMDIDDGTSAWGDPN
850 860 870 880 890 900
910 920 930
pF1KSD SYNYKNVNLWDKNSQGGPAPREPNLPTPMTSKSAS-------------------------
:::::::::::::::::::::::::::::::::::
NP_001 SYNYKNVNLWDKNSQGGPAPREPNLPTPMTSKSASVWSKSTPPAPDNGTSAWGEPNESSP
910 920 930 940 950 960
940 950 960
pF1KSD ----------------------------DSKSMQDGWGESDGPVTGARHPSWEEEEDGGV
.:::::::::::::::::::::::::::::::
NP_001 GWGEMDDTGASTTGWGNTPANAPNAMKPNSKSMQDGWGESDGPVTGARHPSWEEEEDGGV
970 980 990 1000 1010 1020
970 980 990 1000 1010 1020
pF1KSD WNTTGSQGSASSHNSASWGQGGKKQMKCSLKGGNNDSWMNPLAKQFSNMGLLSQTEDNPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 WNTTGSQGSASSHNSASWGQGGKKQMKCSLKGGNNDSWMNPLAKQFSNMGLLSQTEDNPS
1030 1040 1050 1060 1070 1080
1030 1040 1050 1060 1070 1080
pF1KSD SKMDLSVGSLSDKKFDVDKRAMNLGDFNDIMRKDRSGFRPPNSKDMGTTDSGPYFEK---
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 SKMDLSVGSLSDKKFDVDKRAMNLGDFNDIMRKDRSGFRPPNSKDMGTTDSGPYFEKLTL
1090 1100 1110 1120 1130 1140
1090
pF1KSD ------------------------------------------------------GGSHGL
::::::
NP_001 PFSNQDGCLGDEAPCSPFSPSPSYKLSPSGSTLPNVSLGAIGTGLNPQNFAARQGGSHGL
1150 1160 1170 1180 1190 1200
1100 1110 1120 1130 1140 1150
pF1KSD FGNSTAQSRGLHTPVQPLNSSPSLRAQVPPQFISPQVSASMLKQFPNSGLSPGLFNVGPQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 FGNSTAQSRGLHTPVQPLNSSPSLRAQVPPQFISPQVSASMLKQFPNSGLSPGLFNVGPQ
1210 1220 1230 1240 1250 1260
1160 1170 1180 1190 1200 1210
pF1KSD LSPQQIAMLSQLPQIPQFQLACQLLLQQQQQQQLLQNQRKISQAVRQQQEQQLARMVSAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 LSPQQIAMLSQLPQIPQFQLACQLLLQQQQQQQLLQNQRKISQAVRQQQEQQLARMVSAL
1270 1280 1290 1300 1310 1320
1220 1230 1240 1250 1260
pF1KSD QQQQQQQ-RQPGMKHSPSHPVGPKPHLDNMVPNALNVGLPDLQTKGPIPGYGSGFSSGGM
::::::: ::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 QQQQQQQQRQPGMKHSPSHPVGPKPHLDNMVPNALNVGLPDLQTKGPIPGYGSGFSSGGM
1330 1340 1350 1360 1370 1380
1270 1280 1290 1300 1310 1320
pF1KSD DYGMVGGKEAGTESRFKQWTSMMEGLPSVATQEANMHKNGAIVAPGKTRGGSPYNQFDII
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 DYGMVGGKEAGTESRFKQWTSMMEGLPSVATQEANMHKNGAIVAPGKTRGGSPYNQFDII
1390 1400 1410 1420 1430 1440
1330 1340 1350 1360 1370 1380
pF1KSD PGDTLGGHTGPAGDSWLPAKSPPTNKIGSKSSNASWPPEFQPGVPWKGIQNIDPESDPYV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 PGDTLGGHTGPAGDSWLPAKSPPTNKIGSKSSNASWPPEFQPGVPWKGIQNIDPESDPYV
1450 1460 1470 1480 1490 1500
1390 1400 1410 1420 1430 1440
pF1KSD TPGSVLGGTATSPIVDTDHQLLRDNTTGSNSSLNTSLPSPGAWPYSASDNSFTNVHSTSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 TPGSVLGGTATSPIVDTDHQLLRDNTTGSNSSLNTSLPSPGAWPYSASDNSFTNVHSTSA
1510 1520 1530 1540 1550 1560
1450 1460 1470 1480 1490 1500
pF1KSD KFPDYKSTWSPDPIGHNPTHLSNKMWKNHISSRNTTPLPRPPPGLTNPKPSSPWSSTAPR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 KFPDYKSTWSPDPIGHNPTHLSNKMWKNHISSRNTTPLPRPPPGLTNPKPSSPWSSTAPR
1570 1580 1590 1600 1610 1620
1510 1520 1530 1540 1550 1560
pF1KSD SVRGWGTQDSRLASASTWSDGGSVRPSYWLVLHNLTPQIDGSTLRTICMQHGPLLTFHLN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 SVRGWGTQDSRLASASTWSDGGSVRPSYWLVLHNLTPQIDGSTLRTICMQHGPLLTFHLN
1630 1640 1650 1660 1670 1680
1570 1580 1590 1600 1610 1620
pF1KSD LTQGTALIRYSTKQEAAKAQTALHMCVLGNTTILAEFATDDEVSRFLAQAQPPTPAATPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 LTQGTALIRYSTKQEAAKAQTALHMCVLGNTTILAEFATDDEVSRFLAQAQPPTPAATPS
1690 1700 1710 1720 1730 1740
1630 1640 1650 1660 1670 1680
pF1KSD APAAGWQSLETGQNQSDPVGPALNLFGGSTGLGQWSSSAGGSSGADLAGASLWGPPNYSS
::::::::::::::
NP_001 APAAGWQSLETGQNQSDPVGPALNLFGGSTGLGQWSSSAGGSSGADLAGASLWGPPNYSS
1750 1760 1770 1780 1790 1800
>--
initn: 557 init1: 557 opt: 557 Z-score: 275.6 bits: 64.2 E(85289): 1.3e-08
Smith-Waterman score: 557; 100.0% identity (100.0% similar) in 79 aa overlap (1644-1722:1755-1833)
1620 1630 1640 1650 1660 1670
pF1KSD RFLAQAQPPTPAATPSAPAAGWQSLETGQNQSDPVGPALNLFGGSTGLGQWSSSAGGSSG
::::::::::::::::::::::::::::::
NP_001 RFLAQAQPPTPAATPSAPAAGWQSLETGQNQSDPVGPALNLFGGSTGLGQWSSSAGGSSG
1730 1740 1750 1760 1770 1780
1680 1690 1700 1710 1720
pF1KSD ADLAGASLWGPPNYSSSLWGVPTVEDPHRMGSPAPLLPGDLLGGGSDSI
:::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 ADLAGASLWGPPNYSSSLWGVPTVEDPHRMGSPAPLLPGDLLGGGSDSI
1790 1800 1810 1820 1830
>>NP_001020014 (OMIM: 610740) trinucleotide repeat-conta (1029 aa)
initn: 4683 init1: 3639 opt: 5546 Z-score: 2611.4 bits: 495.5 E(85289): 1e-138
Smith-Waterman score: 5580; 86.9% identity (90.7% similar) in 953 aa overlap (786-1722:93-1029)
760 770 780 790 800 810
pF1KSD TKNSNWESSASKPVSGWGEGGQNEIGTWGNGGNASLASKGGWEDCKRSPAWNETGRQPNS
:.. : .:: .. :: . : : :: :
NP_001 EATQKVTEQKTKVPEVTKPSLSQPTAASPIGSSPSPPVNGG-NNAKRVAVPN--G-QPPS
70 80 90 100 110
820 830 840 850 860
pF1KSD WNKQHQQQQPPQ--------------QPPPPQPEASGSWGGPPPPPPGNVRPSNSSWSSG
. .. ::. :::::. :. .:::: .. :.:.. .:
NP_001 AARYMPREVPPRFRCQQDHKVLLKRGQPPPPSCMLLGGGAGPPPCTAPGANPNNAQ-VTG
120 130 140 150 160 170
870 880 890 900 910 920
pF1KSD PQPATPKDEEPSGWEEPSPQSISRKMDIDDGTSAWGDPNSYNYKNVNLWDK-NSQGGPAP
. . : : . .: . :.::::::.:: .. : . .. :. .
NP_001 ALLQSESGTAPV-WSKSTPPAP------DNGTSAWGEPN----ESSPGWGEMDDTGASTT
180 190 200 210 220
930 940 950 960 970 980
pF1KSD REPNLPTPMTSKSASDSKSMQDGWGESDGPVTGARHPSWEEEEDGGVWNTTGSQGSASSH
: :. . .::::::::::::::::::::::::::::::::::::::::::::
NP_001 GWGNTPANAPNAMKPNSKSMQDGWGESDGPVTGARHPSWEEEEDGGVWNTTGSQGSASSH
230 240 250 260 270 280
990 1000 1010 1020 1030 1040
pF1KSD NSASWGQGGKKQMKCSLKGGNNDSWMNPLAKQFSNMGLLSQTEDNPSSKMDLSVGSLSDK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 NSASWGQGGKKQMKCSLKGGNNDSWMNPLAKQFSNMGLLSQTEDNPSSKMDLSVGSLSDK
290 300 310 320 330 340
1050 1060 1070 1080 1090 1100
pF1KSD KFDVDKRAMNLGDFNDIMRKDRSGFRPPNSKDMGTTDSGPYFEKGGSHGLFGNSTAQSRG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 KFDVDKRAMNLGDFNDIMRKDRSGFRPPNSKDMGTTDSGPYFEKGGSHGLFGNSTAQSRG
350 360 370 380 390 400
1110 1120 1130 1140 1150 1160
pF1KSD LHTPVQPLNSSPSLRAQVPPQFISPQVSASMLKQFPNSGLSPGLFNVGPQLSPQQIAMLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 LHTPVQPLNSSPSLRAQVPPQFISPQVSASMLKQFPNSGLSPGLFNVGPQLSPQQIAMLS
410 420 430 440 450 460
1170 1180 1190 1200 1210
pF1KSD QLPQIPQFQLACQLLLQQQQQQQLLQNQRKISQAVRQQQEQQLARMVSALQQQQQQQ-RQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::: ::
NP_001 QLPQIPQFQLACQLLLQQQQQQQLLQNQRKISQAVRQQQEQQLARMVSALQQQQQQQQRQ
470 480 490 500 510 520
1220 1230 1240 1250 1260 1270
pF1KSD PGMKHSPSHPVGPKPHLDNMVPNALNVGLPDLQTKGPIPGYGSGFSSGGMDYGMVGGKEA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 PGMKHSPSHPVGPKPHLDNMVPNALNVGLPDLQTKGPIPGYGSGFSSGGMDYGMVGGKEA
530 540 550 560 570 580
1280 1290 1300 1310 1320 1330
pF1KSD GTESRFKQWTSMMEGLPSVATQEANMHKNGAIVAPGKTRGGSPYNQFDIIPGDTLGGHTG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 GTESRFKQWTSMMEGLPSVATQEANMHKNGAIVAPGKTRGGSPYNQFDIIPGDTLGGHTG
590 600 610 620 630 640
1340 1350 1360 1370 1380 1390
pF1KSD PAGDSWLPAKSPPTNKIGSKSSNASWPPEFQPGVPWKGIQNIDPESDPYVTPGSVLGGTA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 PAGDSWLPAKSPPTNKIGSKSSNASWPPEFQPGVPWKGIQNIDPESDPYVTPGSVLGGTA
650 660 670 680 690 700
1400 1410 1420 1430 1440 1450
pF1KSD TSPIVDTDHQLLRDNTTGSNSSLNTSLPSPGAWPYSASDNSFTNVHSTSAKFPDYKSTWS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 TSPIVDTDHQLLRDNTTGSNSSLNTSLPSPGAWPYSASDNSFTNVHSTSAKFPDYKSTWS
710 720 730 740 750 760
1460 1470 1480 1490 1500 1510
pF1KSD PDPIGHNPTHLSNKMWKNHISSRNTTPLPRPPPGLTNPKPSSPWSSTAPRSVRGWGTQDS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 PDPIGHNPTHLSNKMWKNHISSRNTTPLPRPPPGLTNPKPSSPWSSTAPRSVRGWGTQDS
770 780 790 800 810 820
1520 1530 1540 1550 1560 1570
pF1KSD RLASASTWSDGGSVRPSYWLVLHNLTPQIDGSTLRTICMQHGPLLTFHLNLTQGTALIRY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 RLASASTWSDGGSVRPSYWLVLHNLTPQIDGSTLRTICMQHGPLLTFHLNLTQGTALIRY
830 840 850 860 870 880
1580 1590 1600 1610 1620 1630
pF1KSD STKQEAAKAQTALHMCVLGNTTILAEFATDDEVSRFLAQAQPPTPAATPSAPAAGWQSLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 STKQEAAKAQTALHMCVLGNTTILAEFATDDEVSRFLAQAQPPTPAATPSAPAAGWQSLE
890 900 910 920 930 940
1640 1650 1660 1670 1680 1690
pF1KSD TGQNQSDPVGPALNLFGGSTGLGQWSSSAGGSSGADLAGASLWGPPNYSSSLWGVPTVED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 TGQNQSDPVGPALNLFGGSTGLGQWSSSAGGSSGADLAGASLWGPPNYSSSLWGVPTVED
950 960 970 980 990 1000
1700 1710 1720
pF1KSD PHRMGSPAPLLPGDLLGGGSDSI
:::::::::::::::::::::::
NP_001 PHRMGSPAPLLPGDLLGGGSDSI
1010 1020
>>XP_016878638 (OMIM: 610739) PREDICTED: trinucleotide r (1911 aa)
initn: 1972 init1: 568 opt: 2476 Z-score: 1172.6 bits: 230.2 E(85289): 1.4e-58
Smith-Waterman score: 3361; 37.7% identity (62.9% similar) in 1798 aa overlap (138-1722:193-1911)
110 120 130 140 150 160
pF1KSD GQPPPPSCMLLGGGAGPPPCTAPGANPNNAQVTGALLQSESGTAPDSTLGGAAASNYANS
: .: . .:.. . . . .: :.: ::
XP_016 HFPVIAANLGSAVKVLNSQSESSALTNQQPQNNGEVQNSKNQSDINHSTSG---SHYENS
170 180 190 200 210
170 180 190 200 210 220
pF1KSD TWGSGASSNNGTSPNPIHIWDKVIVDGSDMEEWPCIASKDTESSSENTTDNNSASNPGSE
: .::.. .: : . :. : :. : :: ..: : .:: : .:::. ::
XP_016 QRGP-VSSTSDSSTN---CKNAVVSDLSEKEAWPSAPGSDPELASE-CMDADSASSSESE
220 230 240 250 260 270
230 240 250 260
pF1KSD KSTL---PGSTTSNK-------GKGSQCQ------SASSGNECNLGVWKSDPKAK-----
.. :.: ..: : ::: . : . :. . : : . :
XP_016 RNITIMASGNTGGEKDGLRNSTGLGSQNKFVVGSSSNNVGHGSSTGPWGFSHGAIISTCQ
280 290 300 310 320 330
270 280 290 300 310 320
pF1KSD -SVQSSNSTTEN-NNGLGNWRNVSGQDRIGPGSGFSNFNPNSNPSAWPALVQEGTSRKGA
::.. .: .:. :: .. : .::... . : . :..: :: .:::.: ..: . ::
XP_016 VSVDAPESKSESSNNRMNAWGTVSSSS--NGGLNPSTLNSASNHGAWPVLENNGLALKGP
340 350 360 370 380 390
330 340 350 360
pF1KSD LETDNSNSSAQVSTVGQTSREQQ--SKM------------------ENAGVNFV-VSGRE
. . .:. . : ::.:: .:. ::. : .:.. : ::.
XP_016 VGSGSSGINIQCSTIGQMPNNQSINSKVSGGSTHGTWGSLQETCESEVSGTQKVSFSGQP
400 410 420 430 440 450
370 380 390 400 410
pF1KSD QAQIHNTDGPKNGNTNSLNLSSPNP--MENKGMPFGMGLGNTSRST------DAPSQ---
: . :: :..:: .. : :: ..:. .: . . : :: .:::
XP_016 QNITTEMTGP-NNTTNFMTSSLPNSGSVQNNELP-SSNTGAWRVSTMNHPQMQAPSGMNG
460 470 480 490 500 510
420 430 440 450 460
pF1KSD ------STGDRKTGSVGSWGAARGPSGTDTVSGQSNSGNNGN-NGKEREDSWKGASVQKS
:.:. :.: ::.:.. : :.. ::.. :: ::. :: :. ... .: .
XP_016 TSLSHLSNGESKSG--GSYGTTWGAYGSN-YSGDKCSGPNGQANG----DTVNATLMQPG
520 530 540 550 560
470 480 490 500 510 520
pF1KSD T-GSKNDSWDNNNRSTGGSWNFGPQDSNDNKWGEGNKMTSGVSQGEWKQP---TGSDELK
. : . ... :. . :: :. : .:....:: :: .:: :. : : ::.. :
XP_016 VNGPMGTNFQVNTNKGGGVWESGAANSQSTSWGSGNGANSGGSRRGWGTPAQNTGTN-LP
570 580 590 600 610 620
530 540 550 560
pF1KSD IGEWSG-PNQPNSSTGAWDNQKGHP------LPENQGNA------QAPCWGRSSSSTGSE
::. :.. .:. .: : : :.::.: :. :....... :.
XP_016 SVEWNKLPSNQHSNDSANGNGKTFTNGWKSTEEEDQGSATSQTNEQSSVWAKTGGTVESD
630 640 650 660 670 680
570 580 590 600 610 620
pF1KSD VGGQSTGSNHKAGSSDSHNSGRRSYRPTHPDCQAVLQTLLSRTDLDPRVLSNTGWGQTQI
. .::: .. :...:.. ::. : ...::....:::::::::::.::::: :
XP_016 GSTESTGRLEEKGTGESQSRDRRKI-----DQHTLLQSIVNRTDLDPRVLSNSGWGQTPI
690 700 710 720 730
630 640 650 660 670 680
pF1KSD KQDTVWDIEEVPRPEGKSDKGTEGWESAATQTKNSGGWGD--APSQSNQMK-SGWGELSA
::.:.:: : :: : :.:.:::.: :.:::: :::. : .:. .. . ::::. .
XP_016 KQNTAWDTETSPRGERKTDNGTEAWGSSATQTFNSGACIDKTSPNGNDTSSVSGWGDPKP
740 750 760 770 780 790
690 700 710 720 730
pF1KSD STEWKDPKNT---GGWNDYKNNN----SSNWGGGRPDEKTPSSWNENPSKDQGWGGGRQP
. .: : :.. :::.: . . :..::. . .:: ..::.. .. :::: :..
XP_016 ALRWGDSKGSNCQGGWEDDSAATGMVKSNQWGNCK-EEK--AAWNDSQKNKQGWGDGQKS
800 810 820 830 840 850
740 750 760 770 780
pF1KSD NQGWS-SGKNGWGE--------EVDQTKNSNWESSASKPVSGWGEGGQNEIGTWGNGGNA
.:::: :....::: :... :.:. :.... ::::.: :.. ::::. :
XP_016 SQGWSVSASDNWGETSRNNHWGEANK-KSSSGGSDSDRSVSGWNELGKTSSFTWGNNINP
860 870 880 890 900 910
790 800 810 820 830 840
pF1KSD SLASKGGW-EDCKRSPA--WNETGRQPNS--WNKQHQQQQPPQQPPPPQPEASGSWGGPP
. .: :: :. : .:. :.. .. .: :. . . . :. : . ::::
XP_016 NNSS--GWDESSKPTPSQGWGDPPKSNQSLGWGDSSKPVSSPDWNK--QQDIVGSWG---
920 930 940 950 960
850 860 870 880 890 900
pF1KSD PPPPGNVRPSNSSWSSGPQPATPKDEEPSGWEEPSPQSISRKMDIDDGTSAWGDPNSYNY
::.. .: ...: .:: :: :.:::.:::::::.:: :::.:::::::::::..:::
XP_016 -IPPATGKPPGTGWLGGPIPAPAKEEEPTGWEEPSPESIRRKMEIDDGTSAWGDPSKYNY
970 980 990 1000 1010 1020
910 920
pF1KSD KNVNLWDKNSQGG---------------PAPR-----------------EPNLPT-----
::::.:.:: .: :: ::. :.
XP_016 KNVNMWNKNVPNGNSRSDQQAQVHQLLTPASAISNKEASSGSGWGEPWGEPSTPATTVDN
1030 1040 1050 1060 1070 1080
930 940 950
pF1KSD -----------------PMTSKSASDS----------------KSMQDGWGESDGPVTGA
:... :.... ::::::: .: :. :
XP_016 GTSAWGKPIDSGPSWGEPIAAASSTSTWGSSSVGPQALSKSGPKSMQDGWCGDDMPLPGN
1090 1100 1110 1120 1130 1140
960 970 980 990 1000
pF1KSD RHPSWEEEEDG--GVWNTTGSQGSASSHNSASWGQGGKKQM-KCSLKGGNN--DSWMNPL
: .:::::: :.::...:: :: : : ::. : .::::. ..:.::.
XP_016 RPTGWEEEEDVEIGMWNSNSSQELNSSLN---WPPYTKKMSSKGMMKGGNKQEEAWINPF
1150 1160 1170 1180 1190 1200
1010 1020 1030 1040 1050 1060
pF1KSD AKQFSNMGLL--SQTEDNPSSKMDLSVGSLSDKKFDVDKRAMNLGDFNDIMRKDRSGFRP
.:::::... : :. :.::::: : :.::....::...:.::.: . : : ::
XP_016 VKQFSNISFSRDSPEENVQSNKMDLSGGMLQDKRMEIDKHSLNIGDYNRTVGKG-PGSRP
1210 1220 1230 1240 1250 1260
1070 1080 1090 1100 1110 1120
pF1KSD PNSKDMGTTDSGPYFEKGGSHGLFG--NSTAQSRGLHTP-VQPLNSS-PSLRAQVPPQFI
::. .. . .:::.:.:. ..:: :..:: ::.. : .:::.:: :.::::::: ..
XP_016 QISKE-SSMERNPYFDKNGNPSMFGVGNTAAQPRGMQQPPAQPLSSSQPNLRAQVPPPLL
1270 1280 1290 1300 1310 1320
1130 1140 1150 1160 1170 1180
pF1KSD SPQVSASMLKQFPNSGLSPGLFNVGPQLSPQQIAMLSQLPQIPQFQLACQL--LLQQQQQ
:::: .:.:: ::.: :: .: ..:::.:::.:: :. :.. :: :: :::.
XP_016 SPQVPVSLLKYAPNNG---GL---NPLFGPQQVAMLNQLSQLNQLSQISQLQRLLAQQQR
1330 1340 1350 1360 1370
1190 1200 1210 1220 1230
pF1KSD QQLLQNQRKISQAVRQQQEQQLARMVSALQQQQQQQRQ-----------PGMKHSPSHPV
:.::.. .. : ::.:: .: .:. ::..::.:: : ...: :
XP_016 A---QSQRSVPSGNRPQQDQQ-GRPLSVQQQMMQQSRQLDPNLLVKQQTPPSQQQPLHQP
1380 1390 1400 1410 1420 1430
1240 1250 1260 1270 1280
pF1KSD GPKPHLDNMVPNALNVGLPDLQTKGPIP-----GYGSGFSSG-GMDYGMVGGKEAGTESR
. : :::..:.. :.:: ::: : .. :..:. .... : . :: .::
XP_016 AMKSFLDNVMPHTT----PELQ-KGPSPINAFSNFPIGLNSNLNVNMDMNSIKEP--QSR
1440 1450 1460 1470 1480
1290 1300 1310 1320 1330 1340
pF1KSD FKQWTSMMEGLPSVATQEANMHKNGAIVAPGKTRGGSPYNQFDIIPGDTL-GGHTGPAGD
...::.. ... .. . : :.::: . : ::. .:.. ..: .. : ::
XP_016 LRKWTTV-DSISVNTSLDQNSSKHGAI-SSGFRLEESPFVPYDFMNSSTSPASPPGSIGD
1490 1500 1510 1520 1530 1540
1350 1360 1370 1380 1390 1400
pF1KSD SWLPAKSPPTNKIGSKSSNASWPPEFQPGVPWKGIQNIDPESDPYVTPGSVLGGTATSPI
.: :::: . ::...:::::.:: :::: :::::.:::::::::... . . .
XP_016 GWPRAKSP------NGSSSVNWPPEFRPGEPWKGYPNIDPETDPYVTPGSVINNLSINTV
1550 1560 1570 1580 1590
1410 1420 1430 1440 1450
pF1KSD VDTDHQLLRDNTTGSNSSLNTSLPSPGAWP-YSASDNSF---TNVHSTSAKFPDYKSTWS
..:: ::: ..::.:::::.::: .:: ::. . ....::::. : : :::
XP_016 REVDH--LRDRNSGSSSSLNTTLPSTSAWSSIRASNYNVPLSSTAQSTSARNSDSKLTWS
1600 1610 1620 1630 1640 1650
1460 1470 1480 1490 1500 1510
pF1KSD PDPIGHNPTHLSNKMWKNHISSRNTTPLPRPPPGLTNPKPS-SPWSSTAPRSVRGWGTQD
: . . : :....:: . .: : :::::::. :: : :... : :::..:
XP_016 PGSVTN--TSLAHELWKVPLPPKNITAPSRPPPGLTGQKPPLSTWDNSPLRIGGGWGNSD
1660 1670 1680 1690 1700 1710
1520 1530 1540 1550 1560 1570
pF1KSD SRLASASTWSDGGSVRPSYWLVLHNLTPQIDGSTLRTICMQHGPLLTFHLNLTQGTALIR
.: . .:.:....: : . ::::.:::::::::::::.:::::::.:::::: .:.::.:
XP_016 ARYTPGSSWGESSSGRITNWLVLKNLTPQIDGSTLRTLCMQHGPLITFHLNLPHGNALVR
1720 1730 1740 1750 1760 1770
1580 1590 1600 1610 1620 1630
pF1KSD YSTKQEAAKAQTALHMCVLGNTTILAEFATDDEVSRFLAQAQPPTPAATPSAPAAGWQSL
::.:.:..::: .::::::::::::::::...:.:::.::.: :: .: :::::
XP_016 YSSKEEVVKAQKSLHMCVLGNTTILAEFASEEEISRFFAQSQSLTP--SP-----GWQSL
1780 1790 1800 1810 1820
1640 1650 1660 1670 1680 1690
pF1KSD ETGQNQSDPVGPALNLFGGSTGLGQWSSSA-GGSSGADLAGASLWGPPNYSSSLWGVPTV
..:.. . . . :.. : :..:.... .:.. .:: :.:::: :.::.:::: :.
XP_016 GSSQSRLGSLDCSHS-FSSRTDLNHWNGAGLSGTNCGDLHGTSLWGTPHYSTSLWGPPSS
1830 1840 1850 1860 1870 1880
1700 1710 1720
pF1KSD EDPHRMGSPAPL---LPGDLLGGGSDSI
::. ..::.:. : : ::::..:.
XP_016 SDPRGISSPSPINAFLSVDHLGGGGESM
1890 1900 1910
>>NP_001317449 (OMIM: 610739) trinucleotide repeat-conta (1913 aa)
initn: 1945 init1: 568 opt: 2343 Z-score: 1110.4 bits: 218.7 E(85289): 4.1e-55
Smith-Waterman score: 3358; 37.6% identity (62.8% similar) in 1806 aa overlap (138-1722:184-1913)
110 120 130 140 150 160
pF1KSD GQPPPPSCMLLGGGAGPPPCTAPGANPNNAQVTGALLQSESGTAPDSTLGGAAASNYANS
: .: . .:.. . . . .: :.: ::
NP_001 HFPVIAANLGSAVKVLNSQSESSALTNQQPQNNGEVQNSKNQSDINHSTSG---SHYENS
160 170 180 190 200 210
170 180 190 200 210 220
pF1KSD TWGSGASSNNGTSPNPIHIWDKVIVDGSDMEEWPCIASKDTESSSENTTDNNSASNPGSE
: .::.. .: : . :. : :. : :: ..: : .:: : .:::. ::
NP_001 QRGP-VSSTSDSSTN---CKNAVVSDLSEKEAWPSAPGSDPELASE-CMDADSASSSESE
220 230 240 250 260
230 240 250 260
pF1KSD KSTL---PGSTTSNK-------GKGSQCQ------SASSGNECNLGVWKSDPKAK-----
.. :.: ..: : ::: . : . :. . : : . :
NP_001 RNITIMASGNTGGEKDGLRNSTGLGSQNKFVVGSSSNNVGHGSSTGPWGFSHGAIISTCQ
270 280 290 300 310 320
270 280 290 300 310 320
pF1KSD -SVQSSNSTTEN-NNGLGNWRNVSGQDRIGPGSGFSNFNPNSNPSAWPALVQEGTSRKGA
::.. .: .:. :: .. : .::... . : . :..: :: .:::.: ..: . ::
NP_001 VSVDAPESKSESSNNRMNAWGTVSSSS--NGGLNPSTLNSASNHGAWPVLENNGLALKGP
330 340 350 360 370 380
330 340 350 360
pF1KSD LETDNSNSSAQVSTVGQTSREQQ--SKM------------------ENAGVNFV-VSGRE
. . .:. . : ::.:: .:. ::. : .:.. : ::.
NP_001 VGSGSSGINIQCSTIGQMPNNQSINSKVSGGSTHGTWGSLQETCESEVSGTQKVSFSGQP
390 400 410 420 430 440
370 380 390 400 410
pF1KSD QAQIHNTDGPKNGNTNSLNLSSPNP--MENKGMPFGMGLGNTSRST------DAPSQ---
: . :: :..:: .. : :: ..:. .: . . : :: .:::
NP_001 QNITTEMTGP-NNTTNFMTSSLPNSGSVQNNELP-SSNTGAWRVSTMNHPQMQAPSGMNG
450 460 470 480 490 500
420 430 440 450 460
pF1KSD ------STGDRKTGSVGSWGAARGPSGTDTVSGQSNSGNNGN-NGKEREDSWKGASVQKS
:.:. :.: ::.:.. : :.. ::.. :: ::. :: :. ... .: .
NP_001 TSLSHLSNGESKSG--GSYGTTWGAYGSN-YSGDKCSGPNGQANG----DTVNATLMQPG
510 520 530 540 550
470 480 490 500 510 520
pF1KSD T-GSKNDSWDNNNRSTGGSWNFGPQDSNDNKWGEGNKMTSGVSQGEWKQP---TGSDELK
. : . ... :. . :: :. : .:....:: :: .:: :. : : ::.. :
NP_001 VNGPMGTNFQVNTNKGGGVWESGAANSQSTSWGSGNGANSGGSRRGWGTPAQNTGTN-LP
560 570 580 590 600 610
530 540 550 560
pF1KSD IGEWSG-PNQPNSSTGAWDNQKGHP------LPENQGNA------QAPCWGRSSSSTGSE
::. :.. .:. .: : : :.::.: :. :....... :.
NP_001 SVEWNKLPSNQHSNDSANGNGKTFTNGWKSTEEEDQGSATSQTNEQSSVWAKTGGTVESD
620 630 640 650 660 670
570 580 590 600 610 620
pF1KSD VGGQSTGSNHKAGSSDSHNSGRRSYRPTHPDCQAVLQTLLSRTDLDPRVLSNTGWGQTQI
. .::: .. :...:.. ::. : ...::....:::::::::::.::::: :
NP_001 GSTESTGRLEEKGTGESQSRDRRKI-----DQHTLLQSIVNRTDLDPRVLSNSGWGQTPI
680 690 700 710 720
630 640 650 660 670 680
pF1KSD KQDTVWDIEEVPRPEGKSDKGTEGWESAATQTKNSGGWGD--APSQSNQMK-SGWGELSA
::.:.:: : :: : :.:.:::.: :.:::: :::. : .:. .. . ::::. .
NP_001 KQNTAWDTETSPRGERKTDNGTEAWGSSATQTFNSGACIDKTSPNGNDTSSVSGWGDPKP
730 740 750 760 770 780
690 700 710 720 730
pF1KSD STEWKDPKNT---GGWNDYKNNN----SSNWGGGRPDEKTPSSWNENPSKDQGWGGGRQP
. .: : :.. :::.: . . :..::. . .:: ..::.. .. :::: :..
NP_001 ALRWGDSKGSNCQGGWEDDSAATGMVKSNQWGNCK-EEK--AAWNDSQKNKQGWGDGQKS
790 800 810 820 830 840
740 750 760 770 780
pF1KSD NQGWS-SGKNGWGE--------EVDQTKNSNWESSASKPVSGWGEGGQNEIGTWGNGGNA
.:::: :....::: :... :.:. :.... ::::.: :.. ::::. :
NP_001 SQGWSVSASDNWGETSRNNHWGEANK-KSSSGGSDSDRSVSGWNELGKTSSFTWGNNINP
850 860 870 880 890 900
790 800 810 820 830 840
pF1KSD SLASKGGW-EDCKRSPA--WNETGRQPNS--WNKQHQQQQPPQQPPPPQPEASGSWGGPP
. .: :: :. : .:. :.. .. .: :. . . . :. : . ::::
NP_001 NNSS--GWDESSKPTPSQGWGDPPKSNQSLGWGDSSKPVSSPDWNK--QQDIVGSWG---
910 920 930 940 950
850 860 870 880 890 900
pF1KSD PPPPGNVRPSNSSWSSGPQPATPKDEEPSGWEEPSPQSISRKMDIDDGTSAWGDPNSYNY
::.. .: ...: .:: :: :.:::.:::::::.:: :::.:::::::::::..:::
NP_001 -IPPATGKPPGTGWLGGPIPAPAKEEEPTGWEEPSPESIRRKMEIDDGTSAWGDPSKYNY
960 970 980 990 1000 1010
910 920
pF1KSD KNVNLWDKNSQGG---------------PAPR-----------------EPNLPT-----
::::.:.:: .: :: ::. :.
NP_001 KNVNMWNKNVPNGNSRSDQQAQVHQLLTPASAISNKEASSGSGWGEPWGEPSTPATTVDN
1020 1030 1040 1050 1060 1070
930 940 950
pF1KSD -----------------PMTSKSASDS----------------KSMQDGWGESDGPVTGA
:... :.... ::::::: .: :. :
NP_001 GTSAWGKPIDSGPSWGEPIAAASSTSTWGSSSVGPQALSKSGPKSMQDGWCGDDMPLPGN
1080 1090 1100 1110 1120 1130
960 970 980 990 1000
pF1KSD RHPSWEEEEDG--GVWNTTGSQGSASSHN-------SASWGQGGKKQMKCS--LKGGNN-
: .:::::: :.::...:: :: : .: : .:::. . .::::.
NP_001 RPTGWEEEEDVEIGMWNSNSSQELNSSLNWPPYTKKMSSKGLSGKKRRRERGMMKGGNKQ
1140 1150 1160 1170 1180 1190
1010 1020 1030 1040 1050
pF1KSD -DSWMNPLAKQFSNMGLL--SQTEDNPSSKMDLSVGSLSDKKFDVDKRAMNLGDFNDIMR
..:.::..:::::... : :. :.::::: : :.::....::...:.::.: .
NP_001 EEAWINPFVKQFSNISFSRDSPEENVQSNKMDLSGGMLQDKRMEIDKHSLNIGDYNRTVG
1200 1210 1220 1230 1240 1250
1060 1070 1080 1090 1100 1110
pF1KSD KDRSGFRPPNSKDMGTTDSGPYFEKGGSHGLFG--NSTAQSRGLHTP-VQPLNSS-PSLR
: : :: ::. .. . .:::.:.:. ..:: :..:: ::.. : .:::.:: :.::
NP_001 KG-PGSRPQISKE-SSMERNPYFDKNGNPSMFGVGNTAAQPRGMQQPPAQPLSSSQPNLR
1260 1270 1280 1290 1300 1310
1120 1130 1140 1150 1160 1170
pF1KSD AQVPPQFISPQVSASMLKQFPNSGLSPGLFNVGPQLSPQQIAMLSQLPQIPQFQLACQL-
::::: ..:::: .:.:: ::.: :: .: ..:::.:::.:: :. :.. ::
NP_001 AQVPPPLLSPQVPVSLLKYAPNNG---GL---NPLFGPQQVAMLNQLSQLNQLSQISQLQ
1320 1330 1340 1350 1360
1180 1190 1200 1210 1220
pF1KSD -LLQQQQQQQLLQNQRKISQAVRQQQEQQLARMVSALQQQQQQQRQ-----------PGM
:: :::. :.::.. .. : ::.:: .: .:. ::..::.:: :
NP_001 RLLAQQQRA---QSQRSVPSGNRPQQDQQ-GRPLSVQQQMMQQSRQLDPNLLVKQQTPPS
1370 1380 1390 1400 1410 1420
1230 1240 1250 1260 1270
pF1KSD KHSPSHPVGPKPHLDNMVPNALNVGLPDLQTKGPIP-----GYGSGFSSG-GMDYGMVGG
...: : . : :::..:.. :.:: ::: : .. :..:. .... : .
NP_001 QQQPLHQPAMKSFLDNVMPHTT----PELQ-KGPSPINAFSNFPIGLNSNLNVNMDMNSI
1430 1440 1450 1460 1470
1280 1290 1300 1310 1320 1330
pF1KSD KEAGTESRFKQWTSMMEGLPSVATQEANMHKNGAIVAPGKTRGGSPYNQFDIIPGDTL-G
:: .::...::.. ... .. . : :.::: . : ::. .:.. ..: .
NP_001 KEP--QSRLRKWTTV-DSISVNTSLDQNSSKHGAI-SSGFRLEESPFVPYDFMNSSTSPA
1480 1490 1500 1510 1520 1530
1340 1350 1360 1370 1380 1390
pF1KSD GHTGPAGDSWLPAKSPPTNKIGSKSSNASWPPEFQPGVPWKGIQNIDPESDPYVTPGSVL
. : ::.: :::: . ::...:::::.:: :::: :::::.:::::::::.
NP_001 SPPGSIGDGWPRAKSP------NGSSSVNWPPEFRPGEPWKGYPNIDPETDPYVTPGSVI
1540 1550 1560 1570 1580
1400 1410 1420 1430 1440 1450
pF1KSD GGTATSPIVDTDHQLLRDNTTGSNSSLNTSLPSPGAWP-YSASDNSF---TNVHSTSAKF
.. . . . ..:: ::: ..::.:::::.::: .:: ::. . ....::::.
NP_001 NNLSINTVREVDH--LRDRNSGSSSSLNTTLPSTSAWSSIRASNYNVPLSSTAQSTSARN
1590 1600 1610 1620 1630 1640
1460 1470 1480 1490 1500 1510
pF1KSD PDYKSTWSPDPIGHNPTHLSNKMWKNHISSRNTTPLPRPPPGLTNPKPS-SPWSSTAPRS
: : :::: . . : :....:: . .: : :::::::. :: : :... :
NP_001 SDSKLTWSPGSVTN--TSLAHELWKVPLPPKNITAPSRPPPGLTGQKPPLSTWDNSPLRI
1650 1660 1670 1680 1690 1700
1520 1530 1540 1550 1560 1570
pF1KSD VRGWGTQDSRLASASTWSDGGSVRPSYWLVLHNLTPQIDGSTLRTICMQHGPLLTFHLNL
:::..:.: . .:.:....: : . ::::.:::::::::::::.:::::::.::::::
NP_001 GGGWGNSDARYTPGSSWGESSSGRITNWLVLKNLTPQIDGSTLRTLCMQHGPLITFHLNL
1710 1720 1730 1740 1750 1760
1580 1590 1600 1610 1620 1630
pF1KSD TQGTALIRYSTKQEAAKAQTALHMCVLGNTTILAEFATDDEVSRFLAQAQPPTPAATPSA
.:.::.:::.:.:..::: .::::::::::::::::...:.:::.::.: :: .:
NP_001 PHGNALVRYSSKEEVVKAQKSLHMCVLGNTTILAEFASEEEISRFFAQSQSLTP--SP--
1770 1780 1790 1800 1810 1820
1640 1650 1660 1670 1680
pF1KSD PAAGWQSLETGQNQSDPVGPALNLFGGSTGLGQWSSSA-GGSSGADLAGASLWGPPNYSS
::::: ..:.. . . . :.. : :..:.... .:.. .:: :.:::: :.::.
NP_001 ---GWQSLGSSQSRLGSLDCSHS-FSSRTDLNHWNGAGLSGTNCGDLHGTSLWGTPHYST
1830 1840 1850 1860 1870
1690 1700 1710 1720
pF1KSD SLWGVPTVEDPHRMGSPAPL---LPGDLLGGGSDSI
:::: :. ::. ..::.:. : : ::::..:.
NP_001 SLWGPPSSSDPRGISSPSPINAFLSVDHLGGGGESM
1880 1890 1900 1910
>>XP_016878636 (OMIM: 610739) PREDICTED: trinucleotide r (1922 aa)
initn: 1945 init1: 568 opt: 2343 Z-score: 1110.4 bits: 218.7 E(85289): 4.1e-55
Smith-Waterman score: 3358; 37.6% identity (62.8% similar) in 1806 aa overlap (138-1722:193-1922)
110 120 130 140 150 160
pF1KSD GQPPPPSCMLLGGGAGPPPCTAPGANPNNAQVTGALLQSESGTAPDSTLGGAAASNYANS
: .: . .:.. . . . .: :.: ::
XP_016 HFPVIAANLGSAVKVLNSQSESSALTNQQPQNNGEVQNSKNQSDINHSTSG---SHYENS
170 180 190 200 210
170 180 190 200 210 220
pF1KSD TWGSGASSNNGTSPNPIHIWDKVIVDGSDMEEWPCIASKDTESSSENTTDNNSASNPGSE
: .::.. .: : . :. : :. : :: ..: : .:: : .:::. ::
XP_016 QRGP-VSSTSDSSTN---CKNAVVSDLSEKEAWPSAPGSDPELASE-CMDADSASSSESE
220 230 240 250 260 270
230 240 250 260
pF1KSD KSTL---PGSTTSNK-------GKGSQCQ------SASSGNECNLGVWKSDPKAK-----
.. :.: ..: : ::: . : . :. . : : . :
XP_016 RNITIMASGNTGGEKDGLRNSTGLGSQNKFVVGSSSNNVGHGSSTGPWGFSHGAIISTCQ
280 290 300 310 320 330
270 280 290 300 310 320
pF1KSD -SVQSSNSTTEN-NNGLGNWRNVSGQDRIGPGSGFSNFNPNSNPSAWPALVQEGTSRKGA
::.. .: .:. :: .. : .::... . : . :..: :: .:::.: ..: . ::
XP_016 VSVDAPESKSESSNNRMNAWGTVSSSS--NGGLNPSTLNSASNHGAWPVLENNGLALKGP
340 350 360 370 380 390
330 340 350 360
pF1KSD LETDNSNSSAQVSTVGQTSREQQ--SKM------------------ENAGVNFV-VSGRE
. . .:. . : ::.:: .:. ::. : .:.. : ::.
XP_016 VGSGSSGINIQCSTIGQMPNNQSINSKVSGGSTHGTWGSLQETCESEVSGTQKVSFSGQP
400 410 420 430 440 450
370 380 390 400 410
pF1KSD QAQIHNTDGPKNGNTNSLNLSSPNP--MENKGMPFGMGLGNTSRST------DAPSQ---
: . :: :..:: .. : :: ..:. .: . . : :: .:::
XP_016 QNITTEMTGP-NNTTNFMTSSLPNSGSVQNNELP-SSNTGAWRVSTMNHPQMQAPSGMNG
460 470 480 490 500 510
420 430 440 450 460
pF1KSD ------STGDRKTGSVGSWGAARGPSGTDTVSGQSNSGNNGN-NGKEREDSWKGASVQKS
:.:. :.: ::.:.. : :.. ::.. :: ::. :: :. ... .: .
XP_016 TSLSHLSNGESKSG--GSYGTTWGAYGSN-YSGDKCSGPNGQANG----DTVNATLMQPG
520 530 540 550 560
470 480 490 500 510 520
pF1KSD T-GSKNDSWDNNNRSTGGSWNFGPQDSNDNKWGEGNKMTSGVSQGEWKQP---TGSDELK
. : . ... :. . :: :. : .:....:: :: .:: :. : : ::.. :
XP_016 VNGPMGTNFQVNTNKGGGVWESGAANSQSTSWGSGNGANSGGSRRGWGTPAQNTGTN-LP
570 580 590 600 610 620
530 540 550 560
pF1KSD IGEWSG-PNQPNSSTGAWDNQKGHP------LPENQGNA------QAPCWGRSSSSTGSE
::. :.. .:. .: : : :.::.: :. :....... :.
XP_016 SVEWNKLPSNQHSNDSANGNGKTFTNGWKSTEEEDQGSATSQTNEQSSVWAKTGGTVESD
630 640 650 660 670 680
570 580 590 600 610 620
pF1KSD VGGQSTGSNHKAGSSDSHNSGRRSYRPTHPDCQAVLQTLLSRTDLDPRVLSNTGWGQTQI
. .::: .. :...:.. ::. : ...::....:::::::::::.::::: :
XP_016 GSTESTGRLEEKGTGESQSRDRRKI-----DQHTLLQSIVNRTDLDPRVLSNSGWGQTPI
690 700 710 720 730
630 640 650 660 670 680
pF1KSD KQDTVWDIEEVPRPEGKSDKGTEGWESAATQTKNSGGWGD--APSQSNQMK-SGWGELSA
::.:.:: : :: : :.:.:::.: :.:::: :::. : .:. .. . ::::. .
XP_016 KQNTAWDTETSPRGERKTDNGTEAWGSSATQTFNSGACIDKTSPNGNDTSSVSGWGDPKP
740 750 760 770 780 790
690 700 710 720 730
pF1KSD STEWKDPKNT---GGWNDYKNNN----SSNWGGGRPDEKTPSSWNENPSKDQGWGGGRQP
. .: : :.. :::.: . . :..::. . .:: ..::.. .. :::: :..
XP_016 ALRWGDSKGSNCQGGWEDDSAATGMVKSNQWGNCK-EEK--AAWNDSQKNKQGWGDGQKS
800 810 820 830 840 850
740 750 760 770 780
pF1KSD NQGWS-SGKNGWGE--------EVDQTKNSNWESSASKPVSGWGEGGQNEIGTWGNGGNA
.:::: :....::: :... :.:. :.... ::::.: :.. ::::. :
XP_016 SQGWSVSASDNWGETSRNNHWGEANK-KSSSGGSDSDRSVSGWNELGKTSSFTWGNNINP
860 870 880 890 900 910
790 800 810 820 830 840
pF1KSD SLASKGGW-EDCKRSPA--WNETGRQPNS--WNKQHQQQQPPQQPPPPQPEASGSWGGPP
. .: :: :. : .:. :.. .. .: :. . . . :. : . ::::
XP_016 NNSS--GWDESSKPTPSQGWGDPPKSNQSLGWGDSSKPVSSPDWNK--QQDIVGSWG---
920 930 940 950 960
850 860 870 880 890 900
pF1KSD PPPPGNVRPSNSSWSSGPQPATPKDEEPSGWEEPSPQSISRKMDIDDGTSAWGDPNSYNY
::.. .: ...: .:: :: :.:::.:::::::.:: :::.:::::::::::..:::
XP_016 -IPPATGKPPGTGWLGGPIPAPAKEEEPTGWEEPSPESIRRKMEIDDGTSAWGDPSKYNY
970 980 990 1000 1010 1020
910 920
pF1KSD KNVNLWDKNSQGG---------------PAPR-----------------EPNLPT-----
::::.:.:: .: :: ::. :.
XP_016 KNVNMWNKNVPNGNSRSDQQAQVHQLLTPASAISNKEASSGSGWGEPWGEPSTPATTVDN
1030 1040 1050 1060 1070 1080
930 940 950
pF1KSD -----------------PMTSKSASDS----------------KSMQDGWGESDGPVTGA
:... :.... ::::::: .: :. :
XP_016 GTSAWGKPIDSGPSWGEPIAAASSTSTWGSSSVGPQALSKSGPKSMQDGWCGDDMPLPGN
1090 1100 1110 1120 1130 1140
960 970 980 990 1000
pF1KSD RHPSWEEEEDG--GVWNTTGSQGSASSHN-------SASWGQGGKKQMKCS--LKGGNN-
: .:::::: :.::...:: :: : .: : .:::. . .::::.
XP_016 RPTGWEEEEDVEIGMWNSNSSQELNSSLNWPPYTKKMSSKGLSGKKRRRERGMMKGGNKQ
1150 1160 1170 1180 1190 1200
1010 1020 1030 1040 1050
pF1KSD -DSWMNPLAKQFSNMGLL--SQTEDNPSSKMDLSVGSLSDKKFDVDKRAMNLGDFNDIMR
..:.::..:::::... : :. :.::::: : :.::....::...:.::.: .
XP_016 EEAWINPFVKQFSNISFSRDSPEENVQSNKMDLSGGMLQDKRMEIDKHSLNIGDYNRTVG
1210 1220 1230 1240 1250 1260
1060 1070 1080 1090 1100 1110
pF1KSD KDRSGFRPPNSKDMGTTDSGPYFEKGGSHGLFG--NSTAQSRGLHTP-VQPLNSS-PSLR
: : :: ::. .. . .:::.:.:. ..:: :..:: ::.. : .:::.:: :.::
XP_016 KG-PGSRPQISKE-SSMERNPYFDKNGNPSMFGVGNTAAQPRGMQQPPAQPLSSSQPNLR
1270 1280 1290 1300 1310 1320
1120 1130 1140 1150 1160 1170
pF1KSD AQVPPQFISPQVSASMLKQFPNSGLSPGLFNVGPQLSPQQIAMLSQLPQIPQFQLACQL-
::::: ..:::: .:.:: ::.: :: .: ..:::.:::.:: :. :.. ::
XP_016 AQVPPPLLSPQVPVSLLKYAPNNG---GL---NPLFGPQQVAMLNQLSQLNQLSQISQLQ
1330 1340 1350 1360 1370
1180 1190 1200 1210 1220
pF1KSD -LLQQQQQQQLLQNQRKISQAVRQQQEQQLARMVSALQQQQQQQRQ-----------PGM
:: :::. :.::.. .. : ::.:: .: .:. ::..::.:: :
XP_016 RLLAQQQRA---QSQRSVPSGNRPQQDQQ-GRPLSVQQQMMQQSRQLDPNLLVKQQTPPS
1380 1390 1400 1410 1420 1430
1230 1240 1250 1260 1270
pF1KSD KHSPSHPVGPKPHLDNMVPNALNVGLPDLQTKGPIP-----GYGSGFSSG-GMDYGMVGG
...: : . : :::..:.. :.:: ::: : .. :..:. .... : .
XP_016 QQQPLHQPAMKSFLDNVMPHTT----PELQ-KGPSPINAFSNFPIGLNSNLNVNMDMNSI
1440 1450 1460 1470 1480
1280 1290 1300 1310 1320 1330
pF1KSD KEAGTESRFKQWTSMMEGLPSVATQEANMHKNGAIVAPGKTRGGSPYNQFDIIPGDTL-G
:: .::...::.. ... .. . : :.::: . : ::. .:.. ..: .
XP_016 KEP--QSRLRKWTTV-DSISVNTSLDQNSSKHGAI-SSGFRLEESPFVPYDFMNSSTSPA
1490 1500 1510 1520 1530 1540
1340 1350 1360 1370 1380 1390
pF1KSD GHTGPAGDSWLPAKSPPTNKIGSKSSNASWPPEFQPGVPWKGIQNIDPESDPYVTPGSVL
. : ::.: :::: . ::...:::::.:: :::: :::::.:::::::::.
XP_016 SPPGSIGDGWPRAKSP------NGSSSVNWPPEFRPGEPWKGYPNIDPETDPYVTPGSVI
1550 1560 1570 1580 1590
1400 1410 1420 1430 1440 1450
pF1KSD GGTATSPIVDTDHQLLRDNTTGSNSSLNTSLPSPGAWP-YSASDNSF---TNVHSTSAKF
.. . . . ..:: ::: ..::.:::::.::: .:: ::. . ....::::.
XP_016 NNLSINTVREVDH--LRDRNSGSSSSLNTTLPSTSAWSSIRASNYNVPLSSTAQSTSARN
1600 1610 1620 1630 1640 1650
1460 1470 1480 1490 1500 1510
pF1KSD PDYKSTWSPDPIGHNPTHLSNKMWKNHISSRNTTPLPRPPPGLTNPKPS-SPWSSTAPRS
: : :::: . . : :....:: . .: : :::::::. :: : :... :
XP_016 SDSKLTWSPGSVTN--TSLAHELWKVPLPPKNITAPSRPPPGLTGQKPPLSTWDNSPLRI
1660 1670 1680 1690 1700 1710
1520 1530 1540 1550 1560 1570
pF1KSD VRGWGTQDSRLASASTWSDGGSVRPSYWLVLHNLTPQIDGSTLRTICMQHGPLLTFHLNL
:::..:.: . .:.:....: : . ::::.:::::::::::::.:::::::.::::::
XP_016 GGGWGNSDARYTPGSSWGESSSGRITNWLVLKNLTPQIDGSTLRTLCMQHGPLITFHLNL
1720 1730 1740 1750 1760 1770
1580 1590 1600 1610 1620 1630
pF1KSD TQGTALIRYSTKQEAAKAQTALHMCVLGNTTILAEFATDDEVSRFLAQAQPPTPAATPSA
.:.::.:::.:.:..::: .::::::::::::::::...:.:::.::.: :: .:
XP_016 PHGNALVRYSSKEEVVKAQKSLHMCVLGNTTILAEFASEEEISRFFAQSQSLTP--SP--
1780 1790 1800 1810 1820 1830
1640 1650 1660 1670 1680
pF1KSD PAAGWQSLETGQNQSDPVGPALNLFGGSTGLGQWSSSA-GGSSGADLAGASLWGPPNYSS
::::: ..:.. . . . :.. : :..:.... .:.. .:: :.:::: :.::.
XP_016 ---GWQSLGSSQSRLGSLDCSHS-FSSRTDLNHWNGAGLSGTNCGDLHGTSLWGTPHYST
1840 1850 1860 1870 1880
1690 1700 1710 1720
pF1KSD SLWGVPTVEDPHRMGSPAPL---LPGDLLGGGSDSI
:::: :. ::. ..::.:. : : ::::..:.
XP_016 SLWGPPSSSDPRGISSPSPINAFLSVDHLGGGGESM
1890 1900 1910 1920
>>XP_016878640 (OMIM: 610739) PREDICTED: trinucleotide r (1863 aa)
initn: 1945 init1: 568 opt: 2308 Z-score: 1094.2 bits: 215.7 E(85289): 3.3e-54
Smith-Waterman score: 3582; 38.9% identity (64.6% similar) in 1814 aa overlap (76-1722:131-1863)
50 60 70 80 90 100
pF1KSD SLSQPTAASPIGSSPSPPVNGGNNAKRVAVPNGQPPSAARYMPREVPPRFRCQQDHKVLL
:. :: . :: ::::::::: .:.:: ::
XP_016 NQQPQQQQQQQQPQQQQPQQQPQPQPQQQQPQQQPQALPRY-PREVPPRFR-HQEHKQLL
110 120 130 140 150
110 120 130 140 150 160
pF1KSD KRGQPPPPSCMLLGGGAGPPPCTAPGANPNNAQV--TGALLQSESGTAPDSTLGGAAASN
:::: : ::... . .. .: : .: . .:.. . . . .: :.
XP_016 KRGQHFPVIAANLGSAVKVLNSQSESSALTNQQPQNNGEVQNSKNQSDINHSTSG---SH
160 170 180 190 200 210
170 180 190 200 210 220
pF1KSD YANSTWGSGASSNNGTSPNPIHIWDKVIVDGSDMEEWPCIASKDTESSSENTTDNNSASN
: :: : .::.. .: : . :. : :. : :: ..: : .:: : .:::.
XP_016 YENSQRGP-VSSTSDSSTN---CKNAVVSDLSEKEAWPSAPGSDPELASE-CMDADSASS
220 230 240 250 260 270
230 240 250 260
pF1KSD PGSEKSTL---PGSTTSNK-------GKGSQCQ------SASSGNECNLGVWKSDPKAK-
::.. :.: ..: : ::: . : . :. . : : . :
XP_016 SESERNITIMASGNTGGEKDGLRNSTGLGSQNKFVVGSSSNNVGHGSSTGPWGFSHGAII
280 290 300 310 320 330
270 280 290 300 310 320
pF1KSD -----SVQSSNSTTEN-NNGLGNWRNVSGQDRIGPGSGFSNFNPNSNPSAWPALVQEGTS
::.. .: .:. :: .. : .::... . : . :..: :: .:::.: ..: .
XP_016 STCQVSVDAPESKSESSNNRMNAWGTVSSSS--NGGLNPSTLNSASNHGAWPVLENNGLA
340 350 360 370 380
330 340 350
pF1KSD RKGALETDNSNSSAQVSTVGQTSREQQ--SKM------------------ENAGVNFV-V
:: . . .:. . : ::.:: .:. ::. : .:.. :
XP_016 LKGPVGSGSSGINIQCSTIGQMPNNQSINSKVSGGSTHGTWGSLQETCESEVSGTQKVSF
390 400 410 420 430 440
360 370 380 390 400 410
pF1KSD SGREQAQIHNTDGPKNGNTNSLNLSSPNP--MENKGMPFGMGLGNTSRST------DAPS
::. : . :: :..:: .. : :: ..:. .: . . : :: .:::
XP_016 SGQPQNITTEMTGP-NNTTNFMTSSLPNSGSVQNNELP-SSNTGAWRVSTMNHPQMQAPS
450 460 470 480 490 500
420 430 440 450 460
pF1KSD Q---------STGDRKTGSVGSWGAARGPSGTDTVSGQSNSGNNGN-NGKEREDSWKGAS
:.:. :.: ::.:.. : :.. ::.. :: ::. :: :. ...
XP_016 GMNGTSLSHLSNGESKSG--GSYGTTWGAYGSN-YSGDKCSGPNGQANG----DTVNATL
510 520 530 540 550
470 480 490 500 510
pF1KSD VQKST-GSKNDSWDNNNRSTGGSWNFGPQDSNDNKWGEGNKMTSGVSQGEWKQP---TGS
.: .. : . ... :. . :: :. : .:....:: :: .:: :. : : ::.
XP_016 MQPGVNGPMGTNFQVNTNKGGGVWESGAANSQSTSWGSGNGANSGGSRRGWGTPAQNTGT
560 570 580 590 600 610
520 530 540 550 560
pF1KSD DELKIGEWSG-PNQPNSSTGAWDNQKGHP------LPENQGNA------QAPCWGRSSSS
. : ::. :.. .:. .: : : :.::.: :. :......
XP_016 N-LPSVEWNKLPSNQHSNDSANGNGKTFTNGWKSTEEEDQGSATSQTNEQSSVWAKTGGT
620 630 640 650 660 670
570 580 590 600 610 620
pF1KSD TGSEVGGQSTGSNHKAGSSDSHNSGRRSYRPTHPDCQAVLQTLLSRTDLDPRVLSNTGWG
. :. . .::: .. :...:.. ::. : ...::....:::::::::::.:::
XP_016 VESDGSTESTGRLEEKGTGESQSRDRRKI-----DQHTLLQSIVNRTDLDPRVLSNSGWG
680 690 700 710 720 730
630 640 650 660 670 680
pF1KSD QTQIKQDTVWDIEEVPRPEGKSDKGTEGWESAATQTKNSGGWGD--APSQSNQMK-SGWG
:: :::.:.:: : :: : :.:.:::.: :.:::: :::. : .:. .. . ::::
XP_016 QTPIKQNTAWDTETSPRGERKTDNGTEAWGSSATQTFNSGACIDKTSPNGNDTSSVSGWG
740 750 760 770 780 790
690 700 710 720 730
pF1KSD ELSASTEWKDPKNT---GGWNDYKNNN----SSNWGGGRPDEKTPSSWNENPSKDQGWGG
. . . .: : :.. :::.: . . :..::. . .:: ..::.. .. ::::
XP_016 DPKPALRWGDSKGSNCQGGWEDDSAATGMVKSNQWGNCK-EEK--AAWNDSQKNKQGWGD
800 810 820 830 840 850
740 750 760 770 780
pF1KSD GRQPNQGWS-SGKNGWGEEVDQTKNSNWE----------SSASKPVSGWGEGGQNEIGTW
:.. .:::: :....::: ..:..: :.... ::::.: :.. ::
XP_016 GQKSSQGWSVSASDNWGET---SRNNHWGEANKKSSSGGSDSDRSVSGWNELGKTSSFTW
860 870 880 890 900
790 800 810 820 830
pF1KSD GNGGNASLASKGGW-EDCKRSPA--WNETGRQPNS--WNKQHQQQQPPQQPP-PPQPEAS
::. : . .: :: :. : .:. :.. .. .: :. ....: ..: : .
XP_016 GNNINPNNSS--GWDESSKPTPSQGWGDPPKSNQSLGWG---DSSKPVSSPDWNKQQDIV
910 920 930 940 950 960
840 850 860 870 880 890
pF1KSD GSWGGPPPPPPGNVRPSNSSWSSGPQPATPKDEEPSGWEEPSPQSISRKMDIDDGTSAWG
:::: ::.. .: ...: .:: :: :.:::.:::::::.:: :::.:::::::::
XP_016 GSWG----IPPATGKPPGTGWLGGPIPAPAKEEEPTGWEEPSPESIRRKMEIDDGTSAWG
970 980 990 1000 1010
900 910 920 930 940
pF1KSD DPNSYNYKNVNLWDKNSQGGPAPREPN-----LPTP---MTSKSASDS---KSMQDGWGE
::..:::::::.:.:: .: . . . : :: ...: ::.. :::::::
XP_016 DPSKYNYKNVNMWNKNVPNGNSRSDQQAQVHQLLTPASAISNKEASSGSGPKSMQDGWCG
1020 1030 1040 1050 1060 1070
950 960 970 980 990
pF1KSD SDGPVTGARHPSWEEEEDG--GVWNTTGSQGSASSHN-------SASWGQGGKKQMKCS-
.: :. : : .:::::: :.::...:: :: : .: : .:::. .
XP_016 DDMPLPGNRPTGWEEEEDVEIGMWNSNSSQELNSSLNWPPYTKKMSSKGLSGKKRRRERG
1080 1090 1100 1110 1120 1130
1000 1010 1020 1030 1040 1050
pF1KSD -LKGGNN--DSWMNPLAKQFSNMGLL--SQTEDNPSSKMDLSVGSLSDKKFDVDKRAMNL
.::::. ..:.::..:::::... : :. :.::::: : :.::....::...:.
XP_016 MMKGGNKQEEAWINPFVKQFSNISFSRDSPEENVQSNKMDLSGGMLQDKRMEIDKHSLNI
1140 1150 1160 1170 1180 1190
1060 1070 1080 1090 1100
pF1KSD GDFNDIMRKDRSGFRPPNSKDMGTTDSGPYFEKGGSHGLFG--NSTAQSRGLHTP-VQPL
::.: . : : :: ::. .. . .:::.:.:. ..:: :..:: ::.. : .:::
XP_016 GDYNRTVGKG-PGSRPQISKE-SSMERNPYFDKNGNPSMFGVGNTAAQPRGMQQPPAQPL
1200 1210 1220 1230 1240 1250
1110 1120 1130 1140 1150 1160
pF1KSD NSS-PSLRAQVPPQFISPQVSASMLKQFPNSGLSPGLFNVGPQLSPQQIAMLSQLPQIPQ
.:: :.::::::: ..:::: .:.:: ::.: :: .: ..:::.:::.:: :. :
XP_016 SSSQPNLRAQVPPPLLSPQVPVSLLKYAPNNG---GL---NPLFGPQQVAMLNQLSQLNQ
1260 1270 1280 1290 1300 1310
1170 1180 1190 1200 1210
pF1KSD FQLACQL--LLQQQQQQQLLQNQRKISQAVRQQQEQQLARMVSALQQQQQQQRQ------
.. :: :: :::. : .::.. .. : ::.:: .: .:. ::..::.::
XP_016 LSQISQLQRLLAQQQRAQ---SQRSVPSGNRPQQDQQ-GRPLSVQQQMMQQSRQLDPNLL
1320 1330 1340 1350 1360
1220 1230 1240 1250 1260
pF1KSD -----PGMKHSPSHPVGPKPHLDNMVPNALNVGLPDLQTKGPIP-----GYGSGFSSG-G
: ...: : . : :::..:.. :.:: ::: : .. :..:. .
XP_016 VKQQTPPSQQQPLHQPAMKSFLDNVMPHTT----PELQ-KGPSPINAFSNFPIGLNSNLN
1370 1380 1390 1400 1410 1420
1270 1280 1290 1300 1310 1320
pF1KSD MDYGMVGGKEAGTESRFKQWTSMMEGLPSVATQEANMHKNGAIVAPGKTRGGSPYNQFDI
... : . :: .::...::.. ... .. . : :.::: . : ::. .:.
XP_016 VNMDMNSIKE--PQSRLRKWTTV-DSISVNTSLDQNSSKHGAI-SSGFRLEESPFVPYDF
1430 1440 1450 1460 1470
1330 1340 1350 1360 1370 1380
pF1KSD IPGDTL-GGHTGPAGDSWLPAKSPPTNKIGSKSSNASWPPEFQPGVPWKGIQNIDPESDP
. ..: .. : ::.: :::: . ::...:::::.:: :::: :::::.::
XP_016 MNSSTSPASPPGSIGDGWPRAKSP------NGSSSVNWPPEFRPGEPWKGYPNIDPETDP
1480 1490 1500 1510 1520 1530
1390 1400 1410 1420 1430 1440
pF1KSD YVTPGSVLGGTATSPIVDTDHQLLRDNTTGSNSSLNTSLPSPGAWP-YSASDNSF---TN
:::::::... . . . ..:: ::: ..::.:::::.::: .:: ::. . ..
XP_016 YVTPGSVINNLSINTVREVDH--LRDRNSGSSSSLNTTLPSTSAWSSIRASNYNVPLSST
1540 1550 1560 1570 1580
1450 1460 1470 1480 1490 1500
pF1KSD VHSTSAKFPDYKSTWSPDPIGHNPTHLSNKMWKNHISSRNTTPLPRPPPGLTNPKPS-SP
..::::. : : :::: . . : :....:: . .: : :::::::. :: :
XP_016 AQSTSARNSDSKLTWSPGSVTN--TSLAHELWKVPLPPKNITAPSRPPPGLTGQKPPLST
1590 1600 1610 1620 1630 1640
1510 1520 1530 1540 1550 1560
pF1KSD WSSTAPRSVRGWGTQDSRLASASTWSDGGSVRPSYWLVLHNLTPQIDGSTLRTICMQHGP
:... : :::..:.: . .:.:....: : . ::::.:::::::::::::.::::::
XP_016 WDNSPLRIGGGWGNSDARYTPGSSWGESSSGRITNWLVLKNLTPQIDGSTLRTLCMQHGP
1650 1660 1670 1680 1690 1700
1570 1580 1590 1600 1610 1620
pF1KSD LLTFHLNLTQGTALIRYSTKQEAAKAQTALHMCVLGNTTILAEFATDDEVSRFLAQAQPP
:.:::::: .:.::.:::.:.:..::: .::::::::::::::::...:.:::.::.:
XP_016 LITFHLNLPHGNALVRYSSKEEVVKAQKSLHMCVLGNTTILAEFASEEEISRFFAQSQSL
1710 1720 1730 1740 1750 1760
1630 1640 1650 1660 1670 1680
pF1KSD TPAATPSAPAAGWQSLETGQNQSDPVGPALNLFGGSTGLGQWSSSA-GGSSGADLAGASL
:: .: ::::: ..:.. . . . :.. : :..:.... .:.. .:: :.::
XP_016 TP--SP-----GWQSLGSSQSRLGSLDCSHS-FSSRTDLNHWNGAGLSGTNCGDLHGTSL
1770 1780 1790 1800 1810
1690 1700 1710 1720
pF1KSD WGPPNYSSSLWGVPTVEDPHRMGSPAPL---LPGDLLGGGSDSI
:: :.::.:::: :. ::. ..::.:. : : ::::..:.
XP_016 WGTPHYSTSLWGPPSSSDPRGISSPSPINAFLSVDHLGGGGESM
1820 1830 1840 1850 1860
>>XP_016878643 (OMIM: 610739) PREDICTED: trinucleotide r (1698 aa)
initn: 1961 init1: 568 opt: 2024 Z-score: 961.9 bits: 191.1 E(85289): 7.7e-47
Smith-Waterman score: 3200; 37.2% identity (61.7% similar) in 1773 aa overlap (207-1722:4-1698)
180 190 200 210 220 230
pF1KSD NGTSPNPIHIWDKVIVDGSDMEEWPCIASKDTESSSENTTDNN--SASNPGSEKSTLPGS
:. ::::. . . ...: :.::. : .:
XP_016 MDADSASSSESERNITIMASGNTGGEKDGLRNS
10 20 30
240 250 260 270 280
pF1KSD TTSNKGKGSQCQ------SASSGNECNLGVWKSDPKAK------SVQSSNSTTEN-NNGL
: : ::: . : . :. . : : . : ::.. .: .:. :: .
XP_016 T----GLGSQNKFVVGSSSNNVGHGSSTGPWGFSHGAIISTCQVSVDAPESKSESSNNRM
40 50 60 70 80
290 300 310 320 330 340
pF1KSD GNWRNVSGQDRIGPGSGFSNFNPNSNPSAWPALVQEGTSRKGALETDNSNSSAQVSTVGQ
. : .::... . : . :..: :: .:::.: ..: . :: . . .:. . : ::.::
XP_016 NAWGTVSSSS--NGGLNPSTLNSASNHGAWPVLENNGLALKGPVGSGSSGINIQCSTIGQ
90 100 110 120 130 140
350 360 370 380
pF1KSD TSREQQ--SKM------------------ENAGVNFV-VSGREQAQIHNTDGPKNGNTNS
.:. ::. : .:.. : ::. : . :: :..::
XP_016 MPNNQSINSKVSGGSTHGTWGSLQETCESEVSGTQKVSFSGQPQNITTEMTGP-NNTTNF
150 160 170 180 190 200
390 400 410 420
pF1KSD LNLSSPNP--MENKGMPFGMGLGNTSRST------DAPSQ---------STGDRKTGSVG
.. : :: ..:. .: . . : :: .::: :.:. :.: :
XP_016 MTSSLPNSGSVQNNELP-SSNTGAWRVSTMNHPQMQAPSGMNGTSLSHLSNGESKSG--G
210 220 230 240 250 260
430 440 450 460 470 480
pF1KSD SWGAARGPSGTDTVSGQSNSGNNGN-NGKEREDSWKGASVQKST-GSKNDSWDNNNRSTG
:.:.. : :.. ::.. :: ::. :: :. ... .: .. : . ... :. . :
XP_016 SYGTTWGAYGSN-YSGDKCSGPNGQANG----DTVNATLMQPGVNGPMGTNFQVNTNKGG
270 280 290 300 310
490 500 510 520 530
pF1KSD GSWNFGPQDSNDNKWGEGNKMTSGVSQGEWKQP---TGSDELKIGEWSG-PNQPNSSTGA
: :. : .:....:: :: .:: :. : : ::.. : ::. :.. .:. .:
XP_016 GVWESGAANSQSTSWGSGNGANSGGSRRGWGTPAQNTGTN-LPSVEWNKLPSNQHSNDSA
320 330 340 350 360 370
540 550 560 570 580
pF1KSD WDNQKGHP------LPENQGNA------QAPCWGRSSSSTGSEVGGQSTGSNHKAGSSDS
: : :.::.: :. :....... :. . .::: .. :...:
XP_016 NGNGKTFTNGWKSTEEEDQGSATSQTNEQSSVWAKTGGTVESDGSTESTGRLEEKGTGES
380 390 400 410 420 430
590 600 610 620 630 640
pF1KSD HNSGRRSYRPTHPDCQAVLQTLLSRTDLDPRVLSNTGWGQTQIKQDTVWDIEEVPRPEGK
.. ::. : ...::....:::::::::::.::::: :::.:.:: : :: : :
XP_016 QSRDRRKI-----DQHTLLQSIVNRTDLDPRVLSNSGWGQTPIKQNTAWDTETSPRGERK
440 450 460 470 480 490
650 660 670 680 690
pF1KSD SDKGTEGWESAATQTKNSGGWGD--APSQSNQMK-SGWGELSASTEWKDPKNT---GGWN
.:.:::.: :.:::: :::. : .:. .. . ::::. . . .: : :.. :::.
XP_016 TDNGTEAWGSSATQTFNSGACIDKTSPNGNDTSSVSGWGDPKPALRWGDSKGSNCQGGWE
500 510 520 530 540 550
700 710 720 730 740 750
pF1KSD DYKNNN----SSNWGGGRPDEKTPSSWNENPSKDQGWGGGRQPNQGWS-SGKNGWGEEVD
: . . :..::. . .:: ..::.. .. :::: :.. .:::: :....:::
XP_016 DDSAATGMVKSNQWGNCK-EEK--AAWNDSQKNKQGWGDGQKSSQGWSVSASDNWGET--
560 570 580 590 600
760 770 780 790 800
pF1KSD QTKNSNWE----------SSASKPVSGWGEGGQNEIGTWGNGGNASLASKGGW-EDCKRS
..:..: :.... ::::.: :.. ::::. : . .: :: :. : .
XP_016 -SRNNHWGEANKKSSSGGSDSDRSVSGWNELGKTSSFTWGNNINPNNSS--GWDESSKPT
610 620 630 640 650 660
810 820 830 840 850
pF1KSD PA--WNETGRQPNS--WNKQHQQQQPPQQPP-PPQPEASGSWGGPPPPPPGNVRPSNSSW
:. :.. .. .: :. ....: ..: : . :::: ::.. .: ...:
XP_016 PSQGWGDPPKSNQSLGWG---DSSKPVSSPDWNKQQDIVGSWG----IPPATGKPPGTGW
670 680 690 700 710
860 870 880 890 900 910
pF1KSD SSGPQPATPKDEEPSGWEEPSPQSISRKMDIDDGTSAWGDPNSYNYKNVNLWDKNSQGG-
.:: :: :.:::.:::::::.:: :::.:::::::::::..:::::::.:.:: .:
XP_016 LGGPIPAPAKEEEPTGWEEPSPESIRRKMEIDDGTSAWGDPSKYNYKNVNMWNKNVPNGN
720 730 740 750 760 770
920
pF1KSD --------------PAPR-----------------EPNLPT-------------------
:: ::. :.
XP_016 SRSDQQAQVHQLLTPASAISNKEASSGSGWGEPWGEPSTPATTVDNGTSAWGKPIDSGPS
780 790 800 810 820 830
930 940 950 960
pF1KSD ---PMTSKSASDS----------------KSMQDGWGESDGPVTGARHPSWEEEEDG--G
:... :.... ::::::: .: :. : : .:::::: :
XP_016 WGEPIAAASSTSTWGSSSVGPQALSKSGPKSMQDGWCGDDMPLPGNRPTGWEEEEDVEIG
840 850 860 870 880 890
970 980 990 1000 1010 1020
pF1KSD VWNTTGSQGSASSHNSASWGQGGKKQM-KCSLKGGNN--DSWMNPLAKQFSNMGLL--SQ
.::...:: :: : : ::. : .::::. ..:.::..:::::... :
XP_016 MWNSNSSQELNSSLN---WPPYTKKMSSKGMMKGGNKQEEAWINPFVKQFSNISFSRDSP
900 910 920 930 940 950
1030 1040 1050 1060 1070 1080
pF1KSD TEDNPSSKMDLSVGSLSDKKFDVDKRAMNLGDFNDIMRKDRSGFRPPNSKDMGTTDSGPY
:. :.::::: : :.::....::...:.::.: . : : :: ::. .. . .::
XP_016 EENVQSNKMDLSGGMLQDKRMEIDKHSLNIGDYNRTVGKG-PGSRPQISKE-SSMERNPY
960 970 980 990 1000 1010
1090
pF1KSD FEK-------------------------------------------------GGSHGLFG
:.: .:. ..::
XP_016 FDKDGIVADESQNMQFMSSQSMKLPPSNSALPNQALGSIAGLGMQNLNSVRQNGNPSMFG
1020 1030 1040 1050 1060 1070
1100 1110 1120 1130 1140
pF1KSD --NSTAQSRGLHTP-VQPLNSS-PSLRAQVPPQFISPQVSASMLKQFPNSGLSPGLFNVG
:..:: ::.. : .:::.:: :.::::::: ..:::: .:.:: ::.: :: .
XP_016 VGNTAAQPRGMQQPPAQPLSSSQPNLRAQVPPPLLSPQVPVSLLKYAPNNG---GL---N
1080 1090 1100 1110 1120
1150 1160 1170 1180 1190 1200
pF1KSD PQLSPQQIAMLSQLPQIPQFQLACQL--LLQQQQQQQLLQNQRKISQAVRQQQEQQLARM
: ..:::.:::.:: :. :.. :: :: :::. :.::.. .. : ::.:: .:
XP_016 PLFGPQQVAMLNQLSQLNQLSQISQLQRLLAQQQRA---QSQRSVPSGNRPQQDQQ-GRP
1130 1140 1150 1160 1170 1180
1210 1220 1230 1240 1250
pF1KSD VSALQQQQQQQRQ-----------PGMKHSPSHPVGPKPHLDNMVPNALNVGLPDLQTKG
.:. ::..::.:: : ...: : . : :::..:.. :.:: ::
XP_016 LSVQQQMMQQSRQLDPNLLVKQQTPPSQQQPLHQPAMKSFLDNVMPHTT----PELQ-KG
1190 1200 1210 1220 1230
1260 1270 1280 1290 1300
pF1KSD PIP-----GYGSGFSSG-GMDYGMVGGKEAGTESRFKQWTSMMEGLPSVATQEANMHKNG
: : .. :..:. .... : . :: .::...::.. ... .. . : :.:
XP_016 PSPINAFSNFPIGLNSNLNVNMDMNSIKE--PQSRLRKWTTV-DSISVNTSLDQNSSKHG
1240 1250 1260 1270 1280 1290
1310 1320 1330 1340 1350 1360
pF1KSD AIVAPGKTRGGSPYNQFDIIPGDTL-GGHTGPAGDSWLPAKSPPTNKIGSKSSNASWPPE
:: . : ::. .:.. ..: .. : ::.: :::: ::.: : ::::
XP_016 AI-SSGFRLEESPFVPYDFMNSSTSPASPPGSIGDGWPRAKSPN----GSSSVN--WPPE
1300 1310 1320 1330 1340
1370 1380 1390 1400 1410 1420
pF1KSD FQPGVPWKGIQNIDPESDPYVTPGSVLGGTATSPIVDTDHQLLRDNTTGSNSSLNTSLPS
:.:: :::: :::::.:::::::::... . . . ..:: ::: ..::.:::::.:::
XP_016 FRPGEPWKGYPNIDPETDPYVTPGSVINNLSINTVREVDH--LRDRNSGSSSSLNTTLPS
1350 1360 1370 1380 1390 1400
1430 1440 1450 1460 1470 1480
pF1KSD PGAWP-YSASDNSF---TNVHSTSAKFPDYKSTWSPDPIGHNPTHLSNKMWKNHISSRNT
.:: ::. . ....::::. : : :::: . . : :....:: . .:
XP_016 TSAWSSIRASNYNVPLSSTAQSTSARNSDSKLTWSPGSVTN--TSLAHELWKVPLPPKNI
1410 1420 1430 1440 1450 1460
1490 1500 1510 1520 1530 1540
pF1KSD TPLPRPPPGLTNPKPS-SPWSSTAPRSVRGWGTQDSRLASASTWSDGGSVRPSYWLVLHN
: :::::::. :: : :... : :::..:.: . .:.:....: : . ::::.:
XP_016 TAPSRPPPGLTGQKPPLSTWDNSPLRIGGGWGNSDARYTPGSSWGESSSGRITNWLVLKN
1470 1480 1490 1500 1510 1520
1550 1560 1570 1580 1590 1600
pF1KSD LTPQIDGSTLRTICMQHGPLLTFHLNLTQGTALIRYSTKQEAAKAQTALHMCVLGNTTIL
::::::::::::.:::::::.:::::: .:.::.:::.:.:..::: .::::::::::::
XP_016 LTPQIDGSTLRTLCMQHGPLITFHLNLPHGNALVRYSSKEEVVKAQKSLHMCVLGNTTIL
1530 1540 1550 1560 1570 1580
1610 1620 1630 1640 1650 1660
pF1KSD AEFATDDEVSRFLAQAQPPTPAATPSAPAAGWQSLETGQNQSDPVGPALNLFGGSTGLGQ
::::...:.:::.::.: :: .: ::::: ..:.. . . . :.. : :..
XP_016 AEFASEEEISRFFAQSQSLTP--SP-----GWQSLGSSQSRLGSLDCSHS-FSSRTDLNH
1590 1600 1610 1620 1630
1670 1680 1690 1700 1710
pF1KSD WSSSA-GGSSGADLAGASLWGPPNYSSSLWGVPTVEDPHRMGSPAPL---LPGDLLGGGS
:.... .:.. .:: :.:::: :.::.:::: :. ::. ..::.:. : : ::::.
XP_016 WNGAGLSGTNCGDLHGTSLWGTPHYSTSLWGPPSSSDPRGISSPSPINAFLSVDHLGGGG
1640 1650 1660 1670 1680 1690
1720
pF1KSD DSI
.:.
XP_016 ESM
>>XP_016878633 (OMIM: 610739) PREDICTED: trinucleotide r (1960 aa)
initn: 1934 init1: 568 opt: 2024 Z-score: 961.1 bits: 191.1 E(85289): 8.5e-47
Smith-Waterman score: 3248; 37.0% identity (61.1% similar) in 1827 aa overlap (160-1722:212-1960)
130 140 150 160 170 180
pF1KSD PGANPNNAQVTGALLQSESGTAPDSTLGGAAASNYANSTWGSGASSNNGTSPNPIHIWDK
..:.: :: : .::.. .: : .
XP_016 SESSALTNQQPQNNGEVQNSKNQSDINHSTSGSHYENSQRGP-VSSTSDSSTN---CKNA
190 200 210 220 230
190 200 210 220 230
pF1KSD VIVDGSDMEEWPCIASKDTESSSENTTDNNSASNPGSEKSTL---PGSTTSNK-------
:. : :. : :: ..: : .:: : .:::. ::.. :.: ..:
XP_016 VVSDLSEKEAWPSAPGSDPELASE-CMDADSASSSESERNITIMASGNTGGEKDGLRNST
240 250 260 270 280 290
240 250 260 270 280
pF1KSD GKGSQCQ------SASSGNECNLGVWKSDPKAK------SVQSSNSTTEN-NNGLGNWRN
: ::: . : . :. . : : . : ::.. .: .:. :: .. : .
XP_016 GLGSQNKFVVGSSSNNVGHGSSTGPWGFSHGAIISTCQVSVDAPESKSESSNNRMNAWGT
300 310 320 330 340 350
290 300 310 320 330 340
pF1KSD VSGQDRIGPGSGFSNFNPNSNPSAWPALVQEGTSRKGALETDNSNSSAQVSTVGQTSREQ
::... . : . :..: :: .:::.: ..: . :: . . .:. . : ::.:: .:
XP_016 VSSSS--NGGLNPSTLNSASNHGAWPVLENNGLALKGPVGSGSSGINIQCSTIGQMPNNQ
360 370 380 390 400 410
350 360 370 380
pF1KSD Q--SKM------------------ENAGVNFV-VSGREQAQIHNTDGPKNGNTNSLNLSS
. ::. : .:.. : ::. : . ::.: .:: .. :
XP_016 SINSKVSGGSTHGTWGSLQETCESEVSGTQKVSFSGQPQNITTEMTGPNN-TTNFMTSSL
420 430 440 450 460 470
390 400 410 420
pF1KSD PNP--MENKGMPFGMGLGNTSRST------DAPSQ---------STGDRKTGSVGSWGAA
:: ..:. .: . . : :: .::: :.:. :.: ::.:..
XP_016 PNSGSVQNNELP-SSNTGAWRVSTMNHPQMQAPSGMNGTSLSHLSNGESKSG--GSYGTT
480 490 500 510 520 530
430 440 450 460 470 480
pF1KSD RGPSGTDTVSGQSNSGNNGN-NGKEREDSWKGASVQKST-GSKNDSWDNNNRSTGGSWNF
: :.. ::.. :: ::. :: :. ... .: .. : . ... :. . :: :.
XP_016 WGAYGSN-YSGDKCSGPNGQANG----DTVNATLMQPGVNGPMGTNFQVNTNKGGGVWES
540 550 560 570 580
490 500 510 520 530 540
pF1KSD GPQDSNDNKWGEGNKMTSGVSQGEWKQP---TGSDELKIGEWSG-PNQPNSSTGAWDNQK
: .:....:: :: .:: :. : : ::.. : ::. :.. .:. .: : :
XP_016 GAANSQSTSWGSGNGANSGGSRRGWGTPAQNTGTN-LPSVEWNKLPSNQHSNDSANGNGK
590 600 610 620 630 640
550 560 570 580 590
pF1KSD GHP------LPENQGNA------QAPCWGRSSSSTGSEVGGQSTGSNHKAGSSDSHNSGR
:.::.: :. :....... :. . .::: .. :...:.. :
XP_016 TFTNGWKSTEEEDQGSATSQTNEQSSVWAKTGGTVESDGSTESTGRLEEKGTGESQSRDR
650 660 670 680 690 700
600 610 620 630 640 650
pF1KSD RSYRPTHPDCQAVLQTLLSRTDLDPRVLSNTGWGQTQIKQDTVWDIEEVPRPEGKSDKGT
:. : ...::....:::::::::::.::::: :::.:.:: : :: : :.:.::
XP_016 RKI-----DQHTLLQSIVNRTDLDPRVLSNSGWGQTPIKQNTAWDTETSPRGERKTDNGT
710 720 730 740 750
660 670 680 690 700
pF1KSD EGWESAATQTKNSGGWGD--APSQSNQMK-SGWGELSASTEWKDPKNT---GGWNDYKNN
:.: :.:::: :::. : .:. .. . ::::. . . .: : :.. :::.: .
XP_016 EAWGSSATQTFNSGACIDKTSPNGNDTSSVSGWGDPKPALRWGDSKGSNCQGGWEDDSAA
760 770 780 790 800 810
710 720 730 740 750
pF1KSD N----SSNWGGGRPDEKTPSSWNENPSKDQGWGGGRQPNQGWS-SGKNGWGEEVDQTKNS
. :..::. . .:: ..::.. .. :::: :.. .:::: :....::: ..:.
XP_016 TGMVKSNQWGNCK-EEK--AAWNDSQKNKQGWGDGQKSSQGWSVSASDNWGET---SRNN
820 830 840 850 860 870
760 770 780 790 800
pF1KSD NWE----------SSASKPVSGWGEGGQNEIGTWGNGGNASLASKGGW-EDCKRSPA--W
.: :.... ::::.: :.. ::::. : . .: :: :. : .:. :
XP_016 HWGEANKKSSSGGSDSDRSVSGWNELGKTSSFTWGNNINPNNSS--GWDESSKPTPSQGW
880 890 900 910 920 930
810 820 830 840 850 860
pF1KSD NETGRQPNS--WNKQHQQQQPPQQPPPPQPEASGSWGGPPPPPPGNVRPSNSSWSSGPQP
.. .. .: :. . . . :. : . :::: :: : .: ...: .:: :
XP_016 GDPPKSNQSLGWGDSSKPVSSPDWN--KQQDIVGSWG--IPPATG--KPPGTGWLGGPIP
940 950 960 970 980
870 880 890 900 910
pF1KSD ATPKDEEPSGWEEPSPQSISRKMDIDDGTSAWGDPNSYNYKNVNLWDKNSQGG-------
: :.:::.:::::::.:: :::.:::::::::::..:::::::.:.:: .:
XP_016 APAKEEEPTGWEEPSPESIRRKMEIDDGTSAWGDPSKYNYKNVNMWNKNVPNGNSRSDQQ
990 1000 1010 1020 1030 1040
920 930
pF1KSD --------PAPR-----------------EPNLPT----------------------PMT
:: ::. :. :..
XP_016 AQVHQLLTPASAISNKEASSGSGWGEPWGEPSTPATTVDNGTSAWGKPIDSGPSWGEPIA
1050 1060 1070 1080 1090 1100
940 950 960 970
pF1KSD SKSASDS----------------KSMQDGWGESDGPVTGARHPSWEEEEDG--GVWNTTG
. :.... ::::::: .: :. : : .:::::: :.::...
XP_016 AASSTSTWGSSSVGPQALSKSGPKSMQDGWCGDDMPLPGNRPTGWEEEEDVEIGMWNSNS
1110 1120 1130 1140 1150 1160
980 990 1000 1010 1020
pF1KSD SQGSASSHNSASWGQGGKKQM-KCSLKGGNN--DSWMNPLAKQFSNMGLL--SQTEDNPS
:: :: : : ::. : .::::. ..:.::..:::::... : :. :
XP_016 SQELNSSLN---WPPYTKKMSSKGMMKGGNKQEEAWINPFVKQFSNISFSRDSPEENVQS
1170 1180 1190 1200 1210 1220
1030 1040 1050 1060 1070 1080
pF1KSD SKMDLSVGSLSDKKFDVDKRAMNLGDFNDIMRKDRSGFRPPNSKDMGTTDSGPYFEK---
.::::: : :.::....::...:.::.: . : : :: ::. .. . .:::.:
XP_016 NKMDLSGGMLQDKRMEIDKHSLNIGDYNRTVGKG-PGSRPQISKE-SSMERNPYFDKDGI
1230 1240 1250 1260 1270 1280
1090
pF1KSD ----------------------------------------------GGSHGLFG--NSTA
.:. ..:: :..:
XP_016 VADESQNMQFMSSQSMKLPPSNSALPNQALGSIAGLGMQNLNSVRQNGNPSMFGVGNTAA
1290 1300 1310 1320 1330 1340
1100 1110 1120 1130 1140 1150
pF1KSD QSRGLHTP-VQPLNSS-PSLRAQVPPQFISPQVSASMLKQFPNSGLSPGLFNVGPQLSPQ
: ::.. : .:::.:: :.::::::: ..:::: .:.:: ::.: :: .: ..::
XP_016 QPRGMQQPPAQPLSSSQPNLRAQVPPPLLSPQVPVSLLKYAPNNG---GL---NPLFGPQ
1350 1360 1370 1380 1390
1160 1170 1180 1190 1200 1210
pF1KSD QIAMLSQLPQIPQFQLACQL--LLQQQQQQQLLQNQRKISQAVRQQQEQQLARMVSALQQ
:.:::.:: :. :.. :: :: :::. : .::.. .. : ::.:: .: .:. ::
XP_016 QVAMLNQLSQLNQLSQISQLQRLLAQQQRAQ---SQRSVPSGNRPQQDQQ-GRPLSVQQQ
1400 1410 1420 1430 1440 1450
1220 1230 1240 1250
pF1KSD QQQQQRQ-----------PGMKHSPSHPVGPKPHLDNMVPNALNVGLPDLQTKGPIP---
..::.:: : ...: : . : :::..:.. :.:: ::: :
XP_016 MMQQSRQLDPNLLVKQQTPPSQQQPLHQPAMKSFLDNVMPHTT----PELQ-KGPSPINA
1460 1470 1480 1490 1500
1260 1270 1280 1290 1300 1310
pF1KSD --GYGSGFSSG-GMDYGMVGGKEAGTESRFKQWTSMMEGLPSVATQEANMHKNGAIVAPG
.. :..:. .... : . :: .::...::.. ... .. . : :.::: . :
XP_016 FSNFPIGLNSNLNVNMDMNSIKE--PQSRLRKWTTV-DSISVNTSLDQNSSKHGAI-SSG
1510 1520 1530 1540 1550 1560
1320 1330 1340 1350 1360 1370
pF1KSD KTRGGSPYNQFDIIPGDTL-GGHTGPAGDSWLPAKSPPTNKIGSKSSNASWPPEFQPGVP
::. .:.. ..: .. : ::.: :::: ::.: : :::::.:: :
XP_016 FRLEESPFVPYDFMNSSTSPASPPGSIGDGWPRAKSPN----GSSSVN--WPPEFRPGEP
1570 1580 1590 1600 1610
1380 1390 1400 1410 1420 1430
pF1KSD WKGIQNIDPESDPYVTPGSVLGGTATSPIVDTDHQLLRDNTTGSNSSLNTSLPSPGAWP-
::: :::::.:::::::::... . . . ..:: ::: ..::.:::::.::: .::
XP_016 WKGYPNIDPETDPYVTPGSVINNLSINTVREVDH--LRDRNSGSSSSLNTTLPSTSAWSS
1620 1630 1640 1650 1660 1670
1440 1450 1460 1470 1480 1490
pF1KSD YSASDNSF---TNVHSTSAKFPDYKSTWSPDPIGHNPTHLSNKMWKNHISSRNTTPLPRP
::. . ....::::. : : :::: . . : :....:: . .: : ::
XP_016 IRASNYNVPLSSTAQSTSARNSDSKLTWSPGSVTN--TSLAHELWKVPLPPKNITAPSRP
1680 1690 1700 1710 1720 1730
1500 1510 1520 1530 1540
pF1KSD PPGLTNPKPS-SPWSSTAPRSVRGWGTQDSRLASASTWSDGGSVRPSYWLVLHNLTPQID
:::::. :: : :... : :::..:.: . .:.:....: : . ::::.:::::::
XP_016 PPGLTGQKPPLSTWDNSPLRIGGGWGNSDARYTPGSSWGESSSGRITNWLVLKNLTPQID
1740 1750 1760 1770 1780 1790
1550 1560 1570 1580 1590 1600
pF1KSD GSTLRTICMQHGPLLTFHLNLTQGTALIRYSTKQEAAKAQTALHMCVLGNTTILAEFATD
::::::.:::::::.:::::: .:.::.:::.:.:..::: .::::::::::::::::..
XP_016 GSTLRTLCMQHGPLITFHLNLPHGNALVRYSSKEEVVKAQKSLHMCVLGNTTILAEFASE
1800 1810 1820 1830 1840 1850
1610 1620 1630 1640 1650 1660
pF1KSD DEVSRFLAQAQPPTPAATPSAPAAGWQSLETGQNQSDPVGPALNLFGGSTGLGQWSSSA-
.:.:::.::.: :: .: ::::: ..:.. . . . :.. : :..:....
XP_016 EEISRFFAQSQSLTP--SP-----GWQSLGSSQSRLGSLDCS-HSFSSRTDLNHWNGAGL
1860 1870 1880 1890 1900
1670 1680 1690 1700 1710 1720
pF1KSD GGSSGADLAGASLWGPPNYSSSLWGVPTVEDPHRMGSPAPL---LPGDLLGGGSDSI
.:.. .:: :.:::: :.::.:::: :. ::. ..::.:. : : ::::..:.
XP_016 SGTNCGDLHGTSLWGTPHYSTSLWGPPSSSDPRGISSPSPINAFLSVDHLGGGGESM
1910 1920 1930 1940 1950 1960
>>XP_016878637 (OMIM: 610739) PREDICTED: trinucleotide r (1912 aa)
initn: 1933 init1: 568 opt: 2020 Z-score: 959.4 bits: 190.7 E(85289): 1.1e-46
Smith-Waterman score: 3350; 37.7% identity (63.0% similar) in 1796 aa overlap (138-1722:193-1912)
110 120 130 140 150 160
pF1KSD GQPPPPSCMLLGGGAGPPPCTAPGANPNNAQVTGALLQSESGTAPDSTLGGAAASNYANS
: .: . .:.. . . . .: :.: ::
XP_016 HFPVIAANLGSAVKVLNSQSESSALTNQQPQNNGEVQNSKNQSDINHSTSG---SHYENS
170 180 190 200 210
170 180 190 200 210 220
pF1KSD TWGSGASSNNGTSPNPIHIWDKVIVDGSDMEEWPCIASKDTESSSENTTDNNSASNPGSE
: .::.. .: : . :. : :. : :: ..: : .:: : .:::. ::
XP_016 QRGP-VSSTSDSSTN---CKNAVVSDLSEKEAWPSAPGSDPELASE-CMDADSASSSESE
220 230 240 250 260 270
230 240 250 260
pF1KSD KSTL---PGSTTSNK-------GKGSQCQ------SASSGNECNLGVWKSDPKAK-----
.. :.: ..: : ::: . : . :. . : : . :
XP_016 RNITIMASGNTGGEKDGLRNSTGLGSQNKFVVGSSSNNVGHGSSTGPWGFSHGAIISTCQ
280 290 300 310 320 330
270 280 290 300 310 320
pF1KSD -SVQSSNSTTEN-NNGLGNWRNVSGQDRIGPGSGFSNFNPNSNPSAWPALVQEGTSRKGA
::.. .: .:. :: .. : .::... . : . :..: :: .:::.: ..: . ::
XP_016 VSVDAPESKSESSNNRMNAWGTVSSSS--NGGLNPSTLNSASNHGAWPVLENNGLALKGP
340 350 360 370 380 390
330 340 350 360
pF1KSD LETDNSNSSAQVSTVGQTSREQQ--SKM------------------ENAGVNFV-VSGRE
. . .:. . : ::.:: .:. ::. : .:.. : ::.
XP_016 VGSGSSGINIQCSTIGQMPNNQSINSKVSGGSTHGTWGSLQETCESEVSGTQKVSFSGQP
400 410 420 430 440 450
370 380 390 400 410
pF1KSD QAQIHNTDGPKNGNTNSLNLSSPNP--MENKGMPFGMGLGNTSRST------DAPSQ---
: . :: :..:: .. : :: ..:. .: . . : :: .:::
XP_016 QNITTEMTGP-NNTTNFMTSSLPNSGSVQNNELP-SSNTGAWRVSTMNHPQMQAPSGMNG
460 470 480 490 500 510
420 430 440 450 460
pF1KSD ------STGDRKTGSVGSWGAARGPSGTDTVSGQSNSGNNGN-NGKEREDSWKGASVQKS
:.:. :.: ::.:.. : :.. ::.. :: ::. :: :. ... .: .
XP_016 TSLSHLSNGESKSG--GSYGTTWGAYGSN-YSGDKCSGPNGQANG----DTVNATLMQPG
520 530 540 550 560
470 480 490 500 510 520
pF1KSD T-GSKNDSWDNNNRSTGGSWNFGPQDSNDNKWGEGNKMTSGVSQGEWKQP---TGSDELK
. : . ... :. . :: :. : .:....:: :: .:: :. : : ::.. :
XP_016 VNGPMGTNFQVNTNKGGGVWESGAANSQSTSWGSGNGANSGGSRRGWGTPAQNTGTN-LP
570 580 590 600 610 620
530 540 550 560
pF1KSD IGEWSG-PNQPNSSTGAWDNQKGHP------LPENQGNA------QAPCWGRSSSSTGSE
::. :.. .:. .: : : :.::.: :. :....... :.
XP_016 SVEWNKLPSNQHSNDSANGNGKTFTNGWKSTEEEDQGSATSQTNEQSSVWAKTGGTVESD
630 640 650 660 670 680
570 580 590 600 610 620
pF1KSD VGGQSTGSNHKAGSSDSHNSGRRSYRPTHPDCQAVLQTLLSRTDLDPRVLSNTGWGQTQI
. .::: .. :...:.. ::. : ...::....:::::::::::.::::: :
XP_016 GSTESTGRLEEKGTGESQSRDRRKI-----DQHTLLQSIVNRTDLDPRVLSNSGWGQTPI
690 700 710 720 730
630 640 650 660 670 680
pF1KSD KQDTVWDIEEVPRPEGKSDKGTEGWESAATQTKNSGGWGD--APSQSNQMK-SGWGELSA
::.:.:: : :: : :.:.:::.: :.:::: :::. : .:. .. . ::::. .
XP_016 KQNTAWDTETSPRGERKTDNGTEAWGSSATQTFNSGACIDKTSPNGNDTSSVSGWGDPKP
740 750 760 770 780 790
690 700 710 720 730
pF1KSD STEWKDPKNT---GGWNDYKNNN----SSNWGGGRPDEKTPSSWNENPSKDQGWGGGRQP
. .: : :.. :::.: . . :..::. . .:: ..::.. .. :::: :..
XP_016 ALRWGDSKGSNCQGGWEDDSAATGMVKSNQWGNCK-EEK--AAWNDSQKNKQGWGDGQKS
800 810 820 830 840 850
740 750 760 770 780
pF1KSD NQGWS-SGKNGWGE--------EVDQTKNSNWESSASKPVSGWGEGGQNEIGTWGNGGNA
.:::: :....::: :... :.:. :.... ::::.: :.. ::::. :
XP_016 SQGWSVSASDNWGETSRNNHWGEANK-KSSSGGSDSDRSVSGWNELGKTSSFTWGNNINP
860 870 880 890 900 910
790 800 810 820 830 840
pF1KSD SLASKGGW-EDCKRSPA--WNETGRQPNS--WNKQHQQQQPPQQPPPPQPEASGSWGGPP
. .: :: :. : .:. :.. .. .: :. . . . :. : . ::::
XP_016 NNSS--GWDESSKPTPSQGWGDPPKSNQSLGWGDSSKPVSSPDWNK--QQDIVGSWG---
920 930 940 950 960
850 860 870 880 890 900
pF1KSD PPPPGNVRPSNSSWSSGPQPATPKDEEPSGWEEPSPQSISRKMDIDDGTSAWGDPNSYNY
::.. .: ...: .:: :: :.:::.:::::::.:: :::.:::::::::::..:::
XP_016 -IPPATGKPPGTGWLGGPIPAPAKEEEPTGWEEPSPESIRRKMEIDDGTSAWGDPSKYNY
970 980 990 1000 1010 1020
910 920 930 940 950
pF1KSD KNVNLWDKNSQGGPAPREPN-----LPTPMTS------KSASDSKSMQDGWGESDGPVTG
::::.:.:: .: . . . : :: .. .:.: ::::::: .: :. :
XP_016 KNVNMWNKNVPNGNSRSDQQAQVHQLLTPASAISNKEASSGSGPKSMQDGWCGDDMPLPG
1030 1040 1050 1060 1070 1080
960 970 980 990 1000
pF1KSD ARHPSWEEEEDG--GVWNTTGSQGSASSHN-------SASWGQGGKKQMKCS--LKGGNN
: .:::::: :.::...:: :: : .: : .:::. . .::::.
XP_016 NRPTGWEEEEDVEIGMWNSNSSQELNSSLNWPPYTKKMSSKGLSGKKRRRERGMMKGGNK
1090 1100 1110 1120 1130 1140
1010 1020 1030 1040 1050
pF1KSD --DSWMNPLAKQFSNMGLL--SQTEDNPSSKMDLSVGSLSDKKFDVDKRAMNLGDFNDIM
..:.::..:::::... : :. :.::::: : :.::....::...:.::.: .
XP_016 QEEAWINPFVKQFSNISFSRDSPEENVQSNKMDLSGGMLQDKRMEIDKHSLNIGDYNRTV
1150 1160 1170 1180 1190 1200
1060 1070 1080
pF1KSD RKDRSGFRPPNSKDMGTTDSGPYFEK----------------------------------
: : :: ::. .. . .:::.:
XP_016 GKG-PGSRPQISKE-SSMERNPYFDKDGIVADESQNMQFMSSQSMKLPPSNSALPNQALG
1210 1220 1230 1240 1250 1260
1090 1100 1110 1120
pF1KSD ---------------GGSHGLFG--NSTAQSRGLHTP-VQPLNSS-PSLRAQVPPQFISP
.:. ..:: :..:: ::.. : .:::.:: :.::::::: ..::
XP_016 SIAGLGMQNLNSVRQNGNPSMFGVGNTAAQPRGMQQPPAQPLSSSQPNLRAQVPPPLLSP
1270 1280 1290 1300 1310 1320
1130 1140 1150 1160 1170 1180
pF1KSD QVSASMLKQFPNSGLSPGLFNVGPQLSPQQIAMLSQLPQIPQFQLACQL--LLQQQQQQQ
:: .:.:: ::.: :: .: ..:::.:::.:: :. :.. :: :: :::.
XP_016 QVPVSLLKYAPNNG---GL---NPLFGPQQVAMLNQLSQLNQLSQISQLQRLLAQQQRA-
1330 1340 1350 1360 1370
1190 1200 1210 1220 1230
pF1KSD LLQNQRKISQAVRQQQEQQLARMVSALQQQQQQQRQ-----------PGMKHSPSHPVGP
:.::.. .. : ::.:: .: .:. ::..::.:: : ...: : .
XP_016 --QSQRSVPSGNRPQQDQQ-GRPLSVQQQMMQQSRQLDPNLLVKQQTPPSQQQPLHQPAM
1380 1390 1400 1410 1420 1430
1240 1250 1260 1270 1280
pF1KSD KPHLDNMVPNALNVGLPDLQTKGPIP-----GYGSGFSSG-GMDYGMVGGKEAGTESRFK
: :::..:.. :.:: ::: : .. :..:. .... : . :: .::..
XP_016 KSFLDNVMPHTT----PELQ-KGPSPINAFSNFPIGLNSNLNVNMDMNSIKEP--QSRLR
1440 1450 1460 1470 1480
1290 1300 1310 1320 1330 1340
pF1KSD QWTSMMEGLPSVATQEANMHKNGAIVAPGKTRGGSPYNQFDIIPGDTL-GGHTGPAGDSW
.::.. ... .. . : :.::: . : ::. .:.. ..: .. : ::.:
XP_016 KWTTV-DSISVNTSLDQNSSKHGAI-SSGFRLEESPFVPYDFMNSSTSPASPPGSIGDGW
1490 1500 1510 1520 1530 1540
1350 1360 1370 1380 1390 1400
pF1KSD LPAKSPPTNKIGSKSSNASWPPEFQPGVPWKGIQNIDPESDPYVTPGSVLGGTATSPIVD
:::: . ::...:::::.:: :::: :::::.:::::::::... . . . .
XP_016 PRAKSP------NGSSSVNWPPEFRPGEPWKGYPNIDPETDPYVTPGSVINNLSINTVRE
1550 1560 1570 1580 1590
1410 1420 1430 1440 1450 1460
pF1KSD TDHQLLRDNTTGSNSSLNTSLPSPGAWP-YSASDNSF---TNVHSTSAKFPDYKSTWSPD
.:: ::: ..::.:::::.::: .:: ::. . ....::::. : : ::::
XP_016 VDH--LRDRNSGSSSSLNTTLPSTSAWSSIRASNYNVPLSSTAQSTSARNSDSKLTWSPG
1600 1610 1620 1630 1640 1650
1470 1480 1490 1500 1510 1520
pF1KSD PIGHNPTHLSNKMWKNHISSRNTTPLPRPPPGLTNPKPS-SPWSSTAPRSVRGWGTQDSR
. . : :....:: . .: : :::::::. :: : :... : :::..:.:
XP_016 SVTN--TSLAHELWKVPLPPKNITAPSRPPPGLTGQKPPLSTWDNSPLRIGGGWGNSDAR
1660 1670 1680 1690 1700 1710
1530 1540 1550 1560 1570 1580
pF1KSD LASASTWSDGGSVRPSYWLVLHNLTPQIDGSTLRTICMQHGPLLTFHLNLTQGTALIRYS
. .:.:....: : . ::::.:::::::::::::.:::::::.:::::: .:.::.:::
XP_016 YTPGSSWGESSSGRITNWLVLKNLTPQIDGSTLRTLCMQHGPLITFHLNLPHGNALVRYS
1720 1730 1740 1750 1760 1770
1590 1600 1610 1620 1630 1640
pF1KSD TKQEAAKAQTALHMCVLGNTTILAEFATDDEVSRFLAQAQPPTPAATPSAPAAGWQSLET
.:.:..::: .::::::::::::::::...:.:::.::.: :: .: ::::: .
XP_016 SKEEVVKAQKSLHMCVLGNTTILAEFASEEEISRFFAQSQSLTP--SP-----GWQSLGS
1780 1790 1800 1810 1820
1650 1660 1670 1680 1690
pF1KSD GQNQSDPVGPALNLFGGSTGLGQWSSSA-GGSSGADLAGASLWGPPNYSSSLWGVPTVED
.:.. . . . :.. : :..:.... .:.. .:: :.:::: :.::.:::: :. :
XP_016 SQSRLGSLDCSHS-FSSRTDLNHWNGAGLSGTNCGDLHGTSLWGTPHYSTSLWGPPSSSD
1830 1840 1850 1860 1870 1880
1700 1710 1720
pF1KSD PHRMGSPAPL---LPGDLLGGGSDSI
:. ..::.:. : : ::::..:.
XP_016 PRGISSPSPINAFLSVDHLGGGGESM
1890 1900 1910
1722 residues in 1 query sequences
60827320 residues in 85289 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 04:58:55 2016 done: Thu Nov 3 04:58:58 2016
Total Scan time: 22.010 Total Display time: 0.760
Function used was FASTA [36.3.4 Apr, 2011]