FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA1093, 1722 aa 1>>>pF1KSDA1093 1722 - 1722 aa - 1722 aa Library: /omim/omim.rfq.tfa 60827320 residues in 85289 sequences Statistics: Expectation_n fit: rho(ln(x))= 12.3398+/-0.000446; mu= -6.5047+/- 0.028 mean_var=457.5053+/-93.869, 0's: 0 Z-trim(122.9): 59 B-trim: 217 in 1/58 Lambda= 0.059962 statistics sampled from 41819 (41899) to 41819 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.758), E-opt: 0.2 (0.491), width: 16 Scan time: 22.010 The best scores are: opt bits E(85289) NP_055903 (OMIM: 610740) trinucleotide repeat-cont (1723) 12064 1059.6 0 NP_001155973 (OMIM: 610740) trinucleotide repeat-c (1833) 6670 593.0 8.4e-168 NP_001020014 (OMIM: 610740) trinucleotide repeat-c (1029) 5546 495.5 1e-138 XP_016878638 (OMIM: 610739) PREDICTED: trinucleoti (1911) 2476 230.2 1.4e-58 NP_001317449 (OMIM: 610739) trinucleotide repeat-c (1913) 2343 218.7 4.1e-55 XP_016878636 (OMIM: 610739) PREDICTED: trinucleoti (1922) 2343 218.7 4.1e-55 XP_016878640 (OMIM: 610739) PREDICTED: trinucleoti (1863) 2308 215.7 3.3e-54 XP_016878643 (OMIM: 610739) PREDICTED: trinucleoti (1698) 2024 191.1 7.7e-47 XP_016878633 (OMIM: 610739) PREDICTED: trinucleoti (1960) 2024 191.1 8.5e-47 XP_016878637 (OMIM: 610739) PREDICTED: trinucleoti (1912) 2020 190.7 1.1e-46 XP_005255314 (OMIM: 610739) PREDICTED: trinucleoti (1709) 2017 190.4 1.2e-46 XP_016878642 (OMIM: 610739) PREDICTED: trinucleoti (1709) 2017 190.4 1.2e-46 XP_016878641 (OMIM: 610739) PREDICTED: trinucleoti (1829) 2017 190.5 1.2e-46 XP_016878635 (OMIM: 610739) PREDICTED: trinucleoti (1946) 2017 190.5 1.3e-46 NP_055309 (OMIM: 610739) trinucleotide repeat-cont (1962) 2017 190.5 1.3e-46 XP_016878632 (OMIM: 610739) PREDICTED: trinucleoti (1971) 2017 190.5 1.3e-46 XP_016878639 (OMIM: 610739) PREDICTED: trinucleoti (1899) 1990 188.2 6.4e-46 XP_016878634 (OMIM: 610739) PREDICTED: trinucleoti (1948) 1823 173.7 1.5e-41 XP_006722060 (OMIM: 610741) PREDICTED: trinucleoti (1921) 1528 148.2 6.9e-34 XP_016880397 (OMIM: 610741) PREDICTED: trinucleoti (1896) 1453 141.7 6.2e-32 XP_011523390 (OMIM: 610741) PREDICTED: trinucleoti (1729) 1447 141.1 8.2e-32 XP_006722059 (OMIM: 610741) PREDICTED: trinucleoti (1971) 1447 141.2 9.1e-32 NP_001136112 (OMIM: 610741) trinucleotide repeat-c (1726) 1405 137.5 1e-30 XP_016880395 (OMIM: 610741) PREDICTED: trinucleoti (1968) 1405 137.6 1.1e-30 NP_061869 (OMIM: 610741) trinucleotide repeat-cont (1690) 1058 107.5 1.1e-21 XP_016880396 (OMIM: 610741) PREDICTED: trinucleoti (1932) 1058 107.5 1.2e-21 XP_006722063 (OMIM: 610741) PREDICTED: trinucleoti (1929) 1029 105.0 6.9e-21 NP_055023 (OMIM: 125420,125485,125490,125500,60559 (1301) 347 45.9 0.003 >>NP_055903 (OMIM: 610740) trinucleotide repeat-containi (1723 aa) initn: 8547 init1: 8547 opt: 12064 Z-score: 5655.8 bits: 1059.6 E(85289): 0 Smith-Waterman score: 12064; 99.9% identity (99.9% similar) in 1723 aa overlap (1-1722:1-1723) 10 20 30 40 50 60 pF1KSD MREKEQEREEQLMEDKKRKKEDKKKKEATQKVTEQKTKVPEVTKPSLSQPTAASPIGSSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_055 MREKEQEREEQLMEDKKRKKEDKKKKEATQKVTEQKTKVPEVTKPSLSQPTAASPIGSSP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD SPPVNGGNNAKRVAVPNGQPPSAARYMPREVPPRFRCQQDHKVLLKRGQPPPPSCMLLGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_055 SPPVNGGNNAKRVAVPNGQPPSAARYMPREVPPRFRCQQDHKVLLKRGQPPPPSCMLLGG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD GAGPPPCTAPGANPNNAQVTGALLQSESGTAPDSTLGGAAASNYANSTWGSGASSNNGTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_055 GAGPPPCTAPGANPNNAQVTGALLQSESGTAPDSTLGGAAASNYANSTWGSGASSNNGTS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD PNPIHIWDKVIVDGSDMEEWPCIASKDTESSSENTTDNNSASNPGSEKSTLPGSTTSNKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_055 PNPIHIWDKVIVDGSDMEEWPCIASKDTESSSENTTDNNSASNPGSEKSTLPGSTTSNKG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD KGSQCQSASSGNECNLGVWKSDPKAKSVQSSNSTTENNNGLGNWRNVSGQDRIGPGSGFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_055 KGSQCQSASSGNECNLGVWKSDPKAKSVQSSNSTTENNNGLGNWRNVSGQDRIGPGSGFS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD NFNPNSNPSAWPALVQEGTSRKGALETDNSNSSAQVSTVGQTSREQQSKMENAGVNFVVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_055 NFNPNSNPSAWPALVQEGTSRKGALETDNSNSSAQVSTVGQTSREQQSKMENAGVNFVVS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD GREQAQIHNTDGPKNGNTNSLNLSSPNPMENKGMPFGMGLGNTSRSTDAPSQSTGDRKTG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_055 GREQAQIHNTDGPKNGNTNSLNLSSPNPMENKGMPFGMGLGNTSRSTDAPSQSTGDRKTG 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD SVGSWGAARGPSGTDTVSGQSNSGNNGNNGKEREDSWKGASVQKSTGSKNDSWDNNNRST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_055 SVGSWGAARGPSGTDTVSGQSNSGNNGNNGKEREDSWKGASVQKSTGSKNDSWDNNNRST 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD GGSWNFGPQDSNDNKWGEGNKMTSGVSQGEWKQPTGSDELKIGEWSGPNQPNSSTGAWDN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_055 GGSWNFGPQDSNDNKWGEGNKMTSGVSQGEWKQPTGSDELKIGEWSGPNQPNSSTGAWDN 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD QKGHPLPENQGNAQAPCWGRSSSSTGSEVGGQSTGSNHKAGSSDSHNSGRRSYRPTHPDC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_055 QKGHPLPENQGNAQAPCWGRSSSSTGSEVGGQSTGSNHKAGSSDSHNSGRRSYRPTHPDC 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD QAVLQTLLSRTDLDPRVLSNTGWGQTQIKQDTVWDIEEVPRPEGKSDKGTEGWESAATQT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_055 QAVLQTLLSRTDLDPRVLSNTGWGQTQIKQDTVWDIEEVPRPEGKSDKGTEGWESAATQT 610 620 630 640 650 660 670 680 690 700 710 720 pF1KSD KNSGGWGDAPSQSNQMKSGWGELSASTEWKDPKNTGGWNDYKNNNSSNWGGGRPDEKTPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_055 KNSGGWGDAPSQSNQMKSGWGELSASTEWKDPKNTGGWNDYKNNNSSNWGGGRPDEKTPS 670 680 690 700 710 720 730 740 750 760 770 780 pF1KSD SWNENPSKDQGWGGGRQPNQGWSSGKNGWGEEVDQTKNSNWESSASKPVSGWGEGGQNEI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_055 SWNENPSKDQGWGGGRQPNQGWSSGKNGWGEEVDQTKNSNWESSASKPVSGWGEGGQNEI 730 740 750 760 770 780 790 800 810 820 830 840 pF1KSD GTWGNGGNASLASKGGWEDCKRSPAWNETGRQPNSWNKQHQQQQPPQQPPPPQPEASGSW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_055 GTWGNGGNASLASKGGWEDCKRSPAWNETGRQPNSWNKQHQQQQPPQQPPPPQPEASGSW 790 800 810 820 830 840 850 860 870 880 890 900 pF1KSD GGPPPPPPGNVRPSNSSWSSGPQPATPKDEEPSGWEEPSPQSISRKMDIDDGTSAWGDPN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_055 GGPPPPPPGNVRPSNSSWSSGPQPATPKDEEPSGWEEPSPQSISRKMDIDDGTSAWGDPN 850 860 870 880 890 900 910 920 930 940 950 960 pF1KSD SYNYKNVNLWDKNSQGGPAPREPNLPTPMTSKSASDSKSMQDGWGESDGPVTGARHPSWE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_055 SYNYKNVNLWDKNSQGGPAPREPNLPTPMTSKSASDSKSMQDGWGESDGPVTGARHPSWE 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KSD EEEDGGVWNTTGSQGSASSHNSASWGQGGKKQMKCSLKGGNNDSWMNPLAKQFSNMGLLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_055 EEEDGGVWNTTGSQGSASSHNSASWGQGGKKQMKCSLKGGNNDSWMNPLAKQFSNMGLLS 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KSD QTEDNPSSKMDLSVGSLSDKKFDVDKRAMNLGDFNDIMRKDRSGFRPPNSKDMGTTDSGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_055 QTEDNPSSKMDLSVGSLSDKKFDVDKRAMNLGDFNDIMRKDRSGFRPPNSKDMGTTDSGP 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KSD YFEKGGSHGLFGNSTAQSRGLHTPVQPLNSSPSLRAQVPPQFISPQVSASMLKQFPNSGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_055 YFEKGGSHGLFGNSTAQSRGLHTPVQPLNSSPSLRAQVPPQFISPQVSASMLKQFPNSGL 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KSD SPGLFNVGPQLSPQQIAMLSQLPQIPQFQLACQLLLQQQQQQQLLQNQRKISQAVRQQQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_055 SPGLFNVGPQLSPQQIAMLSQLPQIPQFQLACQLLLQQQQQQQLLQNQRKISQAVRQQQE 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 pF1KSD QQLARMVSALQQQQQQQ-RQPGMKHSPSHPVGPKPHLDNMVPNALNVGLPDLQTKGPIPG ::::::::::::::::: :::::::::::::::::::::::::::::::::::::::::: NP_055 QQLARMVSALQQQQQQQQRQPGMKHSPSHPVGPKPHLDNMVPNALNVGLPDLQTKGPIPG 1210 1220 1230 1240 1250 1260 1260 1270 1280 1290 1300 1310 pF1KSD YGSGFSSGGMDYGMVGGKEAGTESRFKQWTSMMEGLPSVATQEANMHKNGAIVAPGKTRG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_055 YGSGFSSGGMDYGMVGGKEAGTESRFKQWTSMMEGLPSVATQEANMHKNGAIVAPGKTRG 1270 1280 1290 1300 1310 1320 1320 1330 1340 1350 1360 1370 pF1KSD GSPYNQFDIIPGDTLGGHTGPAGDSWLPAKSPPTNKIGSKSSNASWPPEFQPGVPWKGIQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_055 GSPYNQFDIIPGDTLGGHTGPAGDSWLPAKSPPTNKIGSKSSNASWPPEFQPGVPWKGIQ 1330 1340 1350 1360 1370 1380 1380 1390 1400 1410 1420 1430 pF1KSD NIDPESDPYVTPGSVLGGTATSPIVDTDHQLLRDNTTGSNSSLNTSLPSPGAWPYSASDN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_055 NIDPESDPYVTPGSVLGGTATSPIVDTDHQLLRDNTTGSNSSLNTSLPSPGAWPYSASDN 1390 1400 1410 1420 1430 1440 1440 1450 1460 1470 1480 1490 pF1KSD SFTNVHSTSAKFPDYKSTWSPDPIGHNPTHLSNKMWKNHISSRNTTPLPRPPPGLTNPKP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_055 SFTNVHSTSAKFPDYKSTWSPDPIGHNPTHLSNKMWKNHISSRNTTPLPRPPPGLTNPKP 1450 1460 1470 1480 1490 1500 1500 1510 1520 1530 1540 1550 pF1KSD SSPWSSTAPRSVRGWGTQDSRLASASTWSDGGSVRPSYWLVLHNLTPQIDGSTLRTICMQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_055 SSPWSSTAPRSVRGWGTQDSRLASASTWSDGGSVRPSYWLVLHNLTPQIDGSTLRTICMQ 1510 1520 1530 1540 1550 1560 1560 1570 1580 1590 1600 1610 pF1KSD HGPLLTFHLNLTQGTALIRYSTKQEAAKAQTALHMCVLGNTTILAEFATDDEVSRFLAQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_055 HGPLLTFHLNLTQGTALIRYSTKQEAAKAQTALHMCVLGNTTILAEFATDDEVSRFLAQA 1570 1580 1590 1600 1610 1620 1620 1630 1640 1650 1660 1670 pF1KSD QPPTPAATPSAPAAGWQSLETGQNQSDPVGPALNLFGGSTGLGQWSSSAGGSSGADLAGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_055 QPPTPAATPSAPAAGWQSLETGQNQSDPVGPALNLFGGSTGLGQWSSSAGGSSGADLAGA 1630 1640 1650 1660 1670 1680 1680 1690 1700 1710 1720 pF1KSD SLWGPPNYSSSLWGVPTVEDPHRMGSPAPLLPGDLLGGGSDSI ::::::::::::::::::::::::::::::::::::::::::: NP_055 SLWGPPNYSSSLWGVPTVEDPHRMGSPAPLLPGDLLGGGSDSI 1690 1700 1710 1720 >>NP_001155973 (OMIM: 610740) trinucleotide repeat-conta (1833 aa) initn: 11267 init1: 6616 opt: 6670 Z-score: 3133.6 bits: 593.0 E(85289): 8.4e-168 Smith-Waterman score: 11261; 93.6% identity (93.7% similar) in 1754 aa overlap (1-1643:1-1754) 10 20 30 40 50 60 pF1KSD MREKEQEREEQLMEDKKRKKEDKKKKEATQKVTEQKTKVPEVTKPSLSQPTAASPIGSSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 MREKEQEREEQLMEDKKRKKEDKKKKEATQKVTEQKTKVPEVTKPSLSQPTAASPIGSSP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD SPPVNGGNNAKRVAVPNGQPPSAARYMPREVPPRFRCQQDHKVLLKRGQPPPPSCMLLGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 SPPVNGGNNAKRVAVPNGQPPSAARYMPREVPPRFRCQQDHKVLLKRGQPPPPSCMLLGG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD GAGPPPCTAPGANPNNAQVTGALLQSESGTAPDSTLGGAAASNYANSTWGSGASSNNGTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 GAGPPPCTAPGANPNNAQVTGALLQSESGTAPDSTLGGAAASNYANSTWGSGASSNNGTS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD PNPIHIWDKVIVDGSDMEEWPCIASKDTESSSENTTDNNSASNPGSEKSTLPGSTTSNKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 PNPIHIWDKVIVDGSDMEEWPCIASKDTESSSENTTDNNSASNPGSEKSTLPGSTTSNKG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD KGSQCQSASSGNECNLGVWKSDPKAKSVQSSNSTTENNNGLGNWRNVSGQDRIGPGSGFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 KGSQCQSASSGNECNLGVWKSDPKAKSVQSSNSTTENNNGLGNWRNVSGQDRIGPGSGFS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD NFNPNSNPSAWPALVQEGTSRKGALETDNSNSSAQVSTVGQTSREQQSKMENAGVNFVVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 NFNPNSNPSAWPALVQEGTSRKGALETDNSNSSAQVSTVGQTSREQQSKMENAGVNFVVS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD GREQAQIHNTDGPKNGNTNSLNLSSPNPMENKGMPFGMGLGNTSRSTDAPSQSTGDRKTG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 GREQAQIHNTDGPKNGNTNSLNLSSPNPMENKGMPFGMGLGNTSRSTDAPSQSTGDRKTG 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD SVGSWGAARGPSGTDTVSGQSNSGNNGNNGKEREDSWKGASVQKSTGSKNDSWDNNNRST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 SVGSWGAARGPSGTDTVSGQSNSGNNGNNGKEREDSWKGASVQKSTGSKNDSWDNNNRST 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD GGSWNFGPQDSNDNKWGEGNKMTSGVSQGEWKQPTGSDELKIGEWSGPNQPNSSTGAWDN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 GGSWNFGPQDSNDNKWGEGNKMTSGVSQGEWKQPTGSDELKIGEWSGPNQPNSSTGAWDN 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD QKGHPLPENQGNAQAPCWGRSSSSTGSEVGGQSTGSNHKAGSSDSHNSGRRSYRPTHPDC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 QKGHPLPENQGNAQAPCWGRSSSSTGSEVGGQSTGSNHKAGSSDSHNSGRRSYRPTHPDC 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD QAVLQTLLSRTDLDPRVLSNTGWGQTQIKQDTVWDIEEVPRPEGKSDKGTEGWESAATQT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 QAVLQTLLSRTDLDPRVLSNTGWGQTQIKQDTVWDIEEVPRPEGKSDKGTEGWESAATQT 610 620 630 640 650 660 670 680 690 700 710 720 pF1KSD KNSGGWGDAPSQSNQMKSGWGELSASTEWKDPKNTGGWNDYKNNNSSNWGGGRPDEKTPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 KNSGGWGDAPSQSNQMKSGWGELSASTEWKDPKNTGGWNDYKNNNSSNWGGGRPDEKTPS 670 680 690 700 710 720 730 740 750 760 770 780 pF1KSD SWNENPSKDQGWGGGRQPNQGWSSGKNGWGEEVDQTKNSNWESSASKPVSGWGEGGQNEI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 SWNENPSKDQGWGGGRQPNQGWSSGKNGWGEEVDQTKNSNWESSASKPVSGWGEGGQNEI 730 740 750 760 770 780 790 800 810 820 830 840 pF1KSD GTWGNGGNASLASKGGWEDCKRSPAWNETGRQPNSWNKQHQQQQPPQQPPPPQPEASGSW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 GTWGNGGNASLASKGGWEDCKRSPAWNETGRQPNSWNKQHQQQQPPQQPPPPQPEASGSW 790 800 810 820 830 840 850 860 870 880 890 900 pF1KSD GGPPPPPPGNVRPSNSSWSSGPQPATPKDEEPSGWEEPSPQSISRKMDIDDGTSAWGDPN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 GGPPPPPPGNVRPSNSSWSSGPQPATPKDEEPSGWEEPSPQSISRKMDIDDGTSAWGDPN 850 860 870 880 890 900 910 920 930 pF1KSD SYNYKNVNLWDKNSQGGPAPREPNLPTPMTSKSAS------------------------- ::::::::::::::::::::::::::::::::::: NP_001 SYNYKNVNLWDKNSQGGPAPREPNLPTPMTSKSASVWSKSTPPAPDNGTSAWGEPNESSP 910 920 930 940 950 960 940 950 960 pF1KSD ----------------------------DSKSMQDGWGESDGPVTGARHPSWEEEEDGGV .::::::::::::::::::::::::::::::: NP_001 GWGEMDDTGASTTGWGNTPANAPNAMKPNSKSMQDGWGESDGPVTGARHPSWEEEEDGGV 970 980 990 1000 1010 1020 970 980 990 1000 1010 1020 pF1KSD WNTTGSQGSASSHNSASWGQGGKKQMKCSLKGGNNDSWMNPLAKQFSNMGLLSQTEDNPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 WNTTGSQGSASSHNSASWGQGGKKQMKCSLKGGNNDSWMNPLAKQFSNMGLLSQTEDNPS 1030 1040 1050 1060 1070 1080 1030 1040 1050 1060 1070 1080 pF1KSD SKMDLSVGSLSDKKFDVDKRAMNLGDFNDIMRKDRSGFRPPNSKDMGTTDSGPYFEK--- ::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 SKMDLSVGSLSDKKFDVDKRAMNLGDFNDIMRKDRSGFRPPNSKDMGTTDSGPYFEKLTL 1090 1100 1110 1120 1130 1140 1090 pF1KSD ------------------------------------------------------GGSHGL :::::: NP_001 PFSNQDGCLGDEAPCSPFSPSPSYKLSPSGSTLPNVSLGAIGTGLNPQNFAARQGGSHGL 1150 1160 1170 1180 1190 1200 1100 1110 1120 1130 1140 1150 pF1KSD FGNSTAQSRGLHTPVQPLNSSPSLRAQVPPQFISPQVSASMLKQFPNSGLSPGLFNVGPQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 FGNSTAQSRGLHTPVQPLNSSPSLRAQVPPQFISPQVSASMLKQFPNSGLSPGLFNVGPQ 1210 1220 1230 1240 1250 1260 1160 1170 1180 1190 1200 1210 pF1KSD LSPQQIAMLSQLPQIPQFQLACQLLLQQQQQQQLLQNQRKISQAVRQQQEQQLARMVSAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 LSPQQIAMLSQLPQIPQFQLACQLLLQQQQQQQLLQNQRKISQAVRQQQEQQLARMVSAL 1270 1280 1290 1300 1310 1320 1220 1230 1240 1250 1260 pF1KSD QQQQQQQ-RQPGMKHSPSHPVGPKPHLDNMVPNALNVGLPDLQTKGPIPGYGSGFSSGGM ::::::: :::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 QQQQQQQQRQPGMKHSPSHPVGPKPHLDNMVPNALNVGLPDLQTKGPIPGYGSGFSSGGM 1330 1340 1350 1360 1370 1380 1270 1280 1290 1300 1310 1320 pF1KSD DYGMVGGKEAGTESRFKQWTSMMEGLPSVATQEANMHKNGAIVAPGKTRGGSPYNQFDII :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 DYGMVGGKEAGTESRFKQWTSMMEGLPSVATQEANMHKNGAIVAPGKTRGGSPYNQFDII 1390 1400 1410 1420 1430 1440 1330 1340 1350 1360 1370 1380 pF1KSD PGDTLGGHTGPAGDSWLPAKSPPTNKIGSKSSNASWPPEFQPGVPWKGIQNIDPESDPYV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 PGDTLGGHTGPAGDSWLPAKSPPTNKIGSKSSNASWPPEFQPGVPWKGIQNIDPESDPYV 1450 1460 1470 1480 1490 1500 1390 1400 1410 1420 1430 1440 pF1KSD TPGSVLGGTATSPIVDTDHQLLRDNTTGSNSSLNTSLPSPGAWPYSASDNSFTNVHSTSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 TPGSVLGGTATSPIVDTDHQLLRDNTTGSNSSLNTSLPSPGAWPYSASDNSFTNVHSTSA 1510 1520 1530 1540 1550 1560 1450 1460 1470 1480 1490 1500 pF1KSD KFPDYKSTWSPDPIGHNPTHLSNKMWKNHISSRNTTPLPRPPPGLTNPKPSSPWSSTAPR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 KFPDYKSTWSPDPIGHNPTHLSNKMWKNHISSRNTTPLPRPPPGLTNPKPSSPWSSTAPR 1570 1580 1590 1600 1610 1620 1510 1520 1530 1540 1550 1560 pF1KSD SVRGWGTQDSRLASASTWSDGGSVRPSYWLVLHNLTPQIDGSTLRTICMQHGPLLTFHLN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 SVRGWGTQDSRLASASTWSDGGSVRPSYWLVLHNLTPQIDGSTLRTICMQHGPLLTFHLN 1630 1640 1650 1660 1670 1680 1570 1580 1590 1600 1610 1620 pF1KSD LTQGTALIRYSTKQEAAKAQTALHMCVLGNTTILAEFATDDEVSRFLAQAQPPTPAATPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 LTQGTALIRYSTKQEAAKAQTALHMCVLGNTTILAEFATDDEVSRFLAQAQPPTPAATPS 1690 1700 1710 1720 1730 1740 1630 1640 1650 1660 1670 1680 pF1KSD APAAGWQSLETGQNQSDPVGPALNLFGGSTGLGQWSSSAGGSSGADLAGASLWGPPNYSS :::::::::::::: NP_001 APAAGWQSLETGQNQSDPVGPALNLFGGSTGLGQWSSSAGGSSGADLAGASLWGPPNYSS 1750 1760 1770 1780 1790 1800 >-- initn: 557 init1: 557 opt: 557 Z-score: 275.6 bits: 64.2 E(85289): 1.3e-08 Smith-Waterman score: 557; 100.0% identity (100.0% similar) in 79 aa overlap (1644-1722:1755-1833) 1620 1630 1640 1650 1660 1670 pF1KSD RFLAQAQPPTPAATPSAPAAGWQSLETGQNQSDPVGPALNLFGGSTGLGQWSSSAGGSSG :::::::::::::::::::::::::::::: NP_001 RFLAQAQPPTPAATPSAPAAGWQSLETGQNQSDPVGPALNLFGGSTGLGQWSSSAGGSSG 1730 1740 1750 1760 1770 1780 1680 1690 1700 1710 1720 pF1KSD ADLAGASLWGPPNYSSSLWGVPTVEDPHRMGSPAPLLPGDLLGGGSDSI ::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 ADLAGASLWGPPNYSSSLWGVPTVEDPHRMGSPAPLLPGDLLGGGSDSI 1790 1800 1810 1820 1830 >>NP_001020014 (OMIM: 610740) trinucleotide repeat-conta (1029 aa) initn: 4683 init1: 3639 opt: 5546 Z-score: 2611.4 bits: 495.5 E(85289): 1e-138 Smith-Waterman score: 5580; 86.9% identity (90.7% similar) in 953 aa overlap (786-1722:93-1029) 760 770 780 790 800 810 pF1KSD TKNSNWESSASKPVSGWGEGGQNEIGTWGNGGNASLASKGGWEDCKRSPAWNETGRQPNS :.. : .:: .. :: . : : :: : NP_001 EATQKVTEQKTKVPEVTKPSLSQPTAASPIGSSPSPPVNGG-NNAKRVAVPN--G-QPPS 70 80 90 100 110 820 830 840 850 860 pF1KSD WNKQHQQQQPPQ--------------QPPPPQPEASGSWGGPPPPPPGNVRPSNSSWSSG . .. ::. :::::. :. .:::: .. :.:.. .: NP_001 AARYMPREVPPRFRCQQDHKVLLKRGQPPPPSCMLLGGGAGPPPCTAPGANPNNAQ-VTG 120 130 140 150 160 170 870 880 890 900 910 920 pF1KSD PQPATPKDEEPSGWEEPSPQSISRKMDIDDGTSAWGDPNSYNYKNVNLWDK-NSQGGPAP . . : : . .: . :.::::::.:: .. : . .. :. . NP_001 ALLQSESGTAPV-WSKSTPPAP------DNGTSAWGEPN----ESSPGWGEMDDTGASTT 180 190 200 210 220 930 940 950 960 970 980 pF1KSD REPNLPTPMTSKSASDSKSMQDGWGESDGPVTGARHPSWEEEEDGGVWNTTGSQGSASSH : :. . .:::::::::::::::::::::::::::::::::::::::::::: NP_001 GWGNTPANAPNAMKPNSKSMQDGWGESDGPVTGARHPSWEEEEDGGVWNTTGSQGSASSH 230 240 250 260 270 280 990 1000 1010 1020 1030 1040 pF1KSD NSASWGQGGKKQMKCSLKGGNNDSWMNPLAKQFSNMGLLSQTEDNPSSKMDLSVGSLSDK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 NSASWGQGGKKQMKCSLKGGNNDSWMNPLAKQFSNMGLLSQTEDNPSSKMDLSVGSLSDK 290 300 310 320 330 340 1050 1060 1070 1080 1090 1100 pF1KSD KFDVDKRAMNLGDFNDIMRKDRSGFRPPNSKDMGTTDSGPYFEKGGSHGLFGNSTAQSRG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 KFDVDKRAMNLGDFNDIMRKDRSGFRPPNSKDMGTTDSGPYFEKGGSHGLFGNSTAQSRG 350 360 370 380 390 400 1110 1120 1130 1140 1150 1160 pF1KSD LHTPVQPLNSSPSLRAQVPPQFISPQVSASMLKQFPNSGLSPGLFNVGPQLSPQQIAMLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 LHTPVQPLNSSPSLRAQVPPQFISPQVSASMLKQFPNSGLSPGLFNVGPQLSPQQIAMLS 410 420 430 440 450 460 1170 1180 1190 1200 1210 pF1KSD QLPQIPQFQLACQLLLQQQQQQQLLQNQRKISQAVRQQQEQQLARMVSALQQQQQQQ-RQ ::::::::::::::::::::::::::::::::::::::::::::::::::::::::: :: NP_001 QLPQIPQFQLACQLLLQQQQQQQLLQNQRKISQAVRQQQEQQLARMVSALQQQQQQQQRQ 470 480 490 500 510 520 1220 1230 1240 1250 1260 1270 pF1KSD PGMKHSPSHPVGPKPHLDNMVPNALNVGLPDLQTKGPIPGYGSGFSSGGMDYGMVGGKEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 PGMKHSPSHPVGPKPHLDNMVPNALNVGLPDLQTKGPIPGYGSGFSSGGMDYGMVGGKEA 530 540 550 560 570 580 1280 1290 1300 1310 1320 1330 pF1KSD GTESRFKQWTSMMEGLPSVATQEANMHKNGAIVAPGKTRGGSPYNQFDIIPGDTLGGHTG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 GTESRFKQWTSMMEGLPSVATQEANMHKNGAIVAPGKTRGGSPYNQFDIIPGDTLGGHTG 590 600 610 620 630 640 1340 1350 1360 1370 1380 1390 pF1KSD PAGDSWLPAKSPPTNKIGSKSSNASWPPEFQPGVPWKGIQNIDPESDPYVTPGSVLGGTA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 PAGDSWLPAKSPPTNKIGSKSSNASWPPEFQPGVPWKGIQNIDPESDPYVTPGSVLGGTA 650 660 670 680 690 700 1400 1410 1420 1430 1440 1450 pF1KSD TSPIVDTDHQLLRDNTTGSNSSLNTSLPSPGAWPYSASDNSFTNVHSTSAKFPDYKSTWS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 TSPIVDTDHQLLRDNTTGSNSSLNTSLPSPGAWPYSASDNSFTNVHSTSAKFPDYKSTWS 710 720 730 740 750 760 1460 1470 1480 1490 1500 1510 pF1KSD PDPIGHNPTHLSNKMWKNHISSRNTTPLPRPPPGLTNPKPSSPWSSTAPRSVRGWGTQDS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 PDPIGHNPTHLSNKMWKNHISSRNTTPLPRPPPGLTNPKPSSPWSSTAPRSVRGWGTQDS 770 780 790 800 810 820 1520 1530 1540 1550 1560 1570 pF1KSD RLASASTWSDGGSVRPSYWLVLHNLTPQIDGSTLRTICMQHGPLLTFHLNLTQGTALIRY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 RLASASTWSDGGSVRPSYWLVLHNLTPQIDGSTLRTICMQHGPLLTFHLNLTQGTALIRY 830 840 850 860 870 880 1580 1590 1600 1610 1620 1630 pF1KSD STKQEAAKAQTALHMCVLGNTTILAEFATDDEVSRFLAQAQPPTPAATPSAPAAGWQSLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 STKQEAAKAQTALHMCVLGNTTILAEFATDDEVSRFLAQAQPPTPAATPSAPAAGWQSLE 890 900 910 920 930 940 1640 1650 1660 1670 1680 1690 pF1KSD TGQNQSDPVGPALNLFGGSTGLGQWSSSAGGSSGADLAGASLWGPPNYSSSLWGVPTVED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 TGQNQSDPVGPALNLFGGSTGLGQWSSSAGGSSGADLAGASLWGPPNYSSSLWGVPTVED 950 960 970 980 990 1000 1700 1710 1720 pF1KSD PHRMGSPAPLLPGDLLGGGSDSI ::::::::::::::::::::::: NP_001 PHRMGSPAPLLPGDLLGGGSDSI 1010 1020 >>XP_016878638 (OMIM: 610739) PREDICTED: trinucleotide r (1911 aa) initn: 1972 init1: 568 opt: 2476 Z-score: 1172.6 bits: 230.2 E(85289): 1.4e-58 Smith-Waterman score: 3361; 37.7% identity (62.9% similar) in 1798 aa overlap (138-1722:193-1911) 110 120 130 140 150 160 pF1KSD GQPPPPSCMLLGGGAGPPPCTAPGANPNNAQVTGALLQSESGTAPDSTLGGAAASNYANS : .: . .:.. . . . .: :.: :: XP_016 HFPVIAANLGSAVKVLNSQSESSALTNQQPQNNGEVQNSKNQSDINHSTSG---SHYENS 170 180 190 200 210 170 180 190 200 210 220 pF1KSD TWGSGASSNNGTSPNPIHIWDKVIVDGSDMEEWPCIASKDTESSSENTTDNNSASNPGSE : .::.. .: : . :. : :. : :: ..: : .:: : .:::. :: XP_016 QRGP-VSSTSDSSTN---CKNAVVSDLSEKEAWPSAPGSDPELASE-CMDADSASSSESE 220 230 240 250 260 270 230 240 250 260 pF1KSD KSTL---PGSTTSNK-------GKGSQCQ------SASSGNECNLGVWKSDPKAK----- .. :.: ..: : ::: . : . :. . : : . : XP_016 RNITIMASGNTGGEKDGLRNSTGLGSQNKFVVGSSSNNVGHGSSTGPWGFSHGAIISTCQ 280 290 300 310 320 330 270 280 290 300 310 320 pF1KSD -SVQSSNSTTEN-NNGLGNWRNVSGQDRIGPGSGFSNFNPNSNPSAWPALVQEGTSRKGA ::.. .: .:. :: .. : .::... . : . :..: :: .:::.: ..: . :: XP_016 VSVDAPESKSESSNNRMNAWGTVSSSS--NGGLNPSTLNSASNHGAWPVLENNGLALKGP 340 350 360 370 380 390 330 340 350 360 pF1KSD LETDNSNSSAQVSTVGQTSREQQ--SKM------------------ENAGVNFV-VSGRE . . .:. . : ::.:: .:. ::. : .:.. : ::. XP_016 VGSGSSGINIQCSTIGQMPNNQSINSKVSGGSTHGTWGSLQETCESEVSGTQKVSFSGQP 400 410 420 430 440 450 370 380 390 400 410 pF1KSD QAQIHNTDGPKNGNTNSLNLSSPNP--MENKGMPFGMGLGNTSRST------DAPSQ--- : . :: :..:: .. : :: ..:. .: . . : :: .::: XP_016 QNITTEMTGP-NNTTNFMTSSLPNSGSVQNNELP-SSNTGAWRVSTMNHPQMQAPSGMNG 460 470 480 490 500 510 420 430 440 450 460 pF1KSD ------STGDRKTGSVGSWGAARGPSGTDTVSGQSNSGNNGN-NGKEREDSWKGASVQKS :.:. :.: ::.:.. : :.. ::.. :: ::. :: :. ... .: . XP_016 TSLSHLSNGESKSG--GSYGTTWGAYGSN-YSGDKCSGPNGQANG----DTVNATLMQPG 520 530 540 550 560 470 480 490 500 510 520 pF1KSD T-GSKNDSWDNNNRSTGGSWNFGPQDSNDNKWGEGNKMTSGVSQGEWKQP---TGSDELK . : . ... :. . :: :. : .:....:: :: .:: :. : : ::.. : XP_016 VNGPMGTNFQVNTNKGGGVWESGAANSQSTSWGSGNGANSGGSRRGWGTPAQNTGTN-LP 570 580 590 600 610 620 530 540 550 560 pF1KSD IGEWSG-PNQPNSSTGAWDNQKGHP------LPENQGNA------QAPCWGRSSSSTGSE ::. :.. .:. .: : : :.::.: :. :....... :. XP_016 SVEWNKLPSNQHSNDSANGNGKTFTNGWKSTEEEDQGSATSQTNEQSSVWAKTGGTVESD 630 640 650 660 670 680 570 580 590 600 610 620 pF1KSD VGGQSTGSNHKAGSSDSHNSGRRSYRPTHPDCQAVLQTLLSRTDLDPRVLSNTGWGQTQI . .::: .. :...:.. ::. : ...::....:::::::::::.::::: : XP_016 GSTESTGRLEEKGTGESQSRDRRKI-----DQHTLLQSIVNRTDLDPRVLSNSGWGQTPI 690 700 710 720 730 630 640 650 660 670 680 pF1KSD KQDTVWDIEEVPRPEGKSDKGTEGWESAATQTKNSGGWGD--APSQSNQMK-SGWGELSA ::.:.:: : :: : :.:.:::.: :.:::: :::. : .:. .. . ::::. . XP_016 KQNTAWDTETSPRGERKTDNGTEAWGSSATQTFNSGACIDKTSPNGNDTSSVSGWGDPKP 740 750 760 770 780 790 690 700 710 720 730 pF1KSD STEWKDPKNT---GGWNDYKNNN----SSNWGGGRPDEKTPSSWNENPSKDQGWGGGRQP . .: : :.. :::.: . . :..::. . .:: ..::.. .. :::: :.. XP_016 ALRWGDSKGSNCQGGWEDDSAATGMVKSNQWGNCK-EEK--AAWNDSQKNKQGWGDGQKS 800 810 820 830 840 850 740 750 760 770 780 pF1KSD NQGWS-SGKNGWGE--------EVDQTKNSNWESSASKPVSGWGEGGQNEIGTWGNGGNA .:::: :....::: :... :.:. :.... ::::.: :.. ::::. : XP_016 SQGWSVSASDNWGETSRNNHWGEANK-KSSSGGSDSDRSVSGWNELGKTSSFTWGNNINP 860 870 880 890 900 910 790 800 810 820 830 840 pF1KSD SLASKGGW-EDCKRSPA--WNETGRQPNS--WNKQHQQQQPPQQPPPPQPEASGSWGGPP . .: :: :. : .:. :.. .. .: :. . . . :. : . :::: XP_016 NNSS--GWDESSKPTPSQGWGDPPKSNQSLGWGDSSKPVSSPDWNK--QQDIVGSWG--- 920 930 940 950 960 850 860 870 880 890 900 pF1KSD PPPPGNVRPSNSSWSSGPQPATPKDEEPSGWEEPSPQSISRKMDIDDGTSAWGDPNSYNY ::.. .: ...: .:: :: :.:::.:::::::.:: :::.:::::::::::..::: XP_016 -IPPATGKPPGTGWLGGPIPAPAKEEEPTGWEEPSPESIRRKMEIDDGTSAWGDPSKYNY 970 980 990 1000 1010 1020 910 920 pF1KSD KNVNLWDKNSQGG---------------PAPR-----------------EPNLPT----- ::::.:.:: .: :: ::. :. XP_016 KNVNMWNKNVPNGNSRSDQQAQVHQLLTPASAISNKEASSGSGWGEPWGEPSTPATTVDN 1030 1040 1050 1060 1070 1080 930 940 950 pF1KSD -----------------PMTSKSASDS----------------KSMQDGWGESDGPVTGA :... :.... ::::::: .: :. : XP_016 GTSAWGKPIDSGPSWGEPIAAASSTSTWGSSSVGPQALSKSGPKSMQDGWCGDDMPLPGN 1090 1100 1110 1120 1130 1140 960 970 980 990 1000 pF1KSD RHPSWEEEEDG--GVWNTTGSQGSASSHNSASWGQGGKKQM-KCSLKGGNN--DSWMNPL : .:::::: :.::...:: :: : : ::. : .::::. ..:.::. XP_016 RPTGWEEEEDVEIGMWNSNSSQELNSSLN---WPPYTKKMSSKGMMKGGNKQEEAWINPF 1150 1160 1170 1180 1190 1200 1010 1020 1030 1040 1050 1060 pF1KSD AKQFSNMGLL--SQTEDNPSSKMDLSVGSLSDKKFDVDKRAMNLGDFNDIMRKDRSGFRP .:::::... : :. :.::::: : :.::....::...:.::.: . : : :: XP_016 VKQFSNISFSRDSPEENVQSNKMDLSGGMLQDKRMEIDKHSLNIGDYNRTVGKG-PGSRP 1210 1220 1230 1240 1250 1260 1070 1080 1090 1100 1110 1120 pF1KSD PNSKDMGTTDSGPYFEKGGSHGLFG--NSTAQSRGLHTP-VQPLNSS-PSLRAQVPPQFI ::. .. . .:::.:.:. ..:: :..:: ::.. : .:::.:: :.::::::: .. XP_016 QISKE-SSMERNPYFDKNGNPSMFGVGNTAAQPRGMQQPPAQPLSSSQPNLRAQVPPPLL 1270 1280 1290 1300 1310 1320 1130 1140 1150 1160 1170 1180 pF1KSD SPQVSASMLKQFPNSGLSPGLFNVGPQLSPQQIAMLSQLPQIPQFQLACQL--LLQQQQQ :::: .:.:: ::.: :: .: ..:::.:::.:: :. :.. :: :: :::. XP_016 SPQVPVSLLKYAPNNG---GL---NPLFGPQQVAMLNQLSQLNQLSQISQLQRLLAQQQR 1330 1340 1350 1360 1370 1190 1200 1210 1220 1230 pF1KSD QQLLQNQRKISQAVRQQQEQQLARMVSALQQQQQQQRQ-----------PGMKHSPSHPV :.::.. .. : ::.:: .: .:. ::..::.:: : ...: : XP_016 A---QSQRSVPSGNRPQQDQQ-GRPLSVQQQMMQQSRQLDPNLLVKQQTPPSQQQPLHQP 1380 1390 1400 1410 1420 1430 1240 1250 1260 1270 1280 pF1KSD GPKPHLDNMVPNALNVGLPDLQTKGPIP-----GYGSGFSSG-GMDYGMVGGKEAGTESR . : :::..:.. :.:: ::: : .. :..:. .... : . :: .:: XP_016 AMKSFLDNVMPHTT----PELQ-KGPSPINAFSNFPIGLNSNLNVNMDMNSIKEP--QSR 1440 1450 1460 1470 1480 1290 1300 1310 1320 1330 1340 pF1KSD FKQWTSMMEGLPSVATQEANMHKNGAIVAPGKTRGGSPYNQFDIIPGDTL-GGHTGPAGD ...::.. ... .. . : :.::: . : ::. .:.. ..: .. : :: XP_016 LRKWTTV-DSISVNTSLDQNSSKHGAI-SSGFRLEESPFVPYDFMNSSTSPASPPGSIGD 1490 1500 1510 1520 1530 1540 1350 1360 1370 1380 1390 1400 pF1KSD SWLPAKSPPTNKIGSKSSNASWPPEFQPGVPWKGIQNIDPESDPYVTPGSVLGGTATSPI .: :::: . ::...:::::.:: :::: :::::.:::::::::... . . . XP_016 GWPRAKSP------NGSSSVNWPPEFRPGEPWKGYPNIDPETDPYVTPGSVINNLSINTV 1550 1560 1570 1580 1590 1410 1420 1430 1440 1450 pF1KSD VDTDHQLLRDNTTGSNSSLNTSLPSPGAWP-YSASDNSF---TNVHSTSAKFPDYKSTWS ..:: ::: ..::.:::::.::: .:: ::. . ....::::. : : ::: XP_016 REVDH--LRDRNSGSSSSLNTTLPSTSAWSSIRASNYNVPLSSTAQSTSARNSDSKLTWS 1600 1610 1620 1630 1640 1650 1460 1470 1480 1490 1500 1510 pF1KSD PDPIGHNPTHLSNKMWKNHISSRNTTPLPRPPPGLTNPKPS-SPWSSTAPRSVRGWGTQD : . . : :....:: . .: : :::::::. :: : :... : :::..: XP_016 PGSVTN--TSLAHELWKVPLPPKNITAPSRPPPGLTGQKPPLSTWDNSPLRIGGGWGNSD 1660 1670 1680 1690 1700 1710 1520 1530 1540 1550 1560 1570 pF1KSD SRLASASTWSDGGSVRPSYWLVLHNLTPQIDGSTLRTICMQHGPLLTFHLNLTQGTALIR .: . .:.:....: : . ::::.:::::::::::::.:::::::.:::::: .:.::.: XP_016 ARYTPGSSWGESSSGRITNWLVLKNLTPQIDGSTLRTLCMQHGPLITFHLNLPHGNALVR 1720 1730 1740 1750 1760 1770 1580 1590 1600 1610 1620 1630 pF1KSD YSTKQEAAKAQTALHMCVLGNTTILAEFATDDEVSRFLAQAQPPTPAATPSAPAAGWQSL ::.:.:..::: .::::::::::::::::...:.:::.::.: :: .: ::::: XP_016 YSSKEEVVKAQKSLHMCVLGNTTILAEFASEEEISRFFAQSQSLTP--SP-----GWQSL 1780 1790 1800 1810 1820 1640 1650 1660 1670 1680 1690 pF1KSD ETGQNQSDPVGPALNLFGGSTGLGQWSSSA-GGSSGADLAGASLWGPPNYSSSLWGVPTV ..:.. . . . :.. : :..:.... .:.. .:: :.:::: :.::.:::: :. XP_016 GSSQSRLGSLDCSHS-FSSRTDLNHWNGAGLSGTNCGDLHGTSLWGTPHYSTSLWGPPSS 1830 1840 1850 1860 1870 1880 1700 1710 1720 pF1KSD EDPHRMGSPAPL---LPGDLLGGGSDSI ::. ..::.:. : : ::::..:. XP_016 SDPRGISSPSPINAFLSVDHLGGGGESM 1890 1900 1910 >>NP_001317449 (OMIM: 610739) trinucleotide repeat-conta (1913 aa) initn: 1945 init1: 568 opt: 2343 Z-score: 1110.4 bits: 218.7 E(85289): 4.1e-55 Smith-Waterman score: 3358; 37.6% identity (62.8% similar) in 1806 aa overlap (138-1722:184-1913) 110 120 130 140 150 160 pF1KSD GQPPPPSCMLLGGGAGPPPCTAPGANPNNAQVTGALLQSESGTAPDSTLGGAAASNYANS : .: . .:.. . . . .: :.: :: NP_001 HFPVIAANLGSAVKVLNSQSESSALTNQQPQNNGEVQNSKNQSDINHSTSG---SHYENS 160 170 180 190 200 210 170 180 190 200 210 220 pF1KSD TWGSGASSNNGTSPNPIHIWDKVIVDGSDMEEWPCIASKDTESSSENTTDNNSASNPGSE : .::.. .: : . :. : :. : :: ..: : .:: : .:::. :: NP_001 QRGP-VSSTSDSSTN---CKNAVVSDLSEKEAWPSAPGSDPELASE-CMDADSASSSESE 220 230 240 250 260 230 240 250 260 pF1KSD KSTL---PGSTTSNK-------GKGSQCQ------SASSGNECNLGVWKSDPKAK----- .. :.: ..: : ::: . : . :. . : : . : NP_001 RNITIMASGNTGGEKDGLRNSTGLGSQNKFVVGSSSNNVGHGSSTGPWGFSHGAIISTCQ 270 280 290 300 310 320 270 280 290 300 310 320 pF1KSD -SVQSSNSTTEN-NNGLGNWRNVSGQDRIGPGSGFSNFNPNSNPSAWPALVQEGTSRKGA ::.. .: .:. :: .. : .::... . : . :..: :: .:::.: ..: . :: NP_001 VSVDAPESKSESSNNRMNAWGTVSSSS--NGGLNPSTLNSASNHGAWPVLENNGLALKGP 330 340 350 360 370 380 330 340 350 360 pF1KSD LETDNSNSSAQVSTVGQTSREQQ--SKM------------------ENAGVNFV-VSGRE . . .:. . : ::.:: .:. ::. : .:.. : ::. NP_001 VGSGSSGINIQCSTIGQMPNNQSINSKVSGGSTHGTWGSLQETCESEVSGTQKVSFSGQP 390 400 410 420 430 440 370 380 390 400 410 pF1KSD QAQIHNTDGPKNGNTNSLNLSSPNP--MENKGMPFGMGLGNTSRST------DAPSQ--- : . :: :..:: .. : :: ..:. .: . . : :: .::: NP_001 QNITTEMTGP-NNTTNFMTSSLPNSGSVQNNELP-SSNTGAWRVSTMNHPQMQAPSGMNG 450 460 470 480 490 500 420 430 440 450 460 pF1KSD ------STGDRKTGSVGSWGAARGPSGTDTVSGQSNSGNNGN-NGKEREDSWKGASVQKS :.:. :.: ::.:.. : :.. ::.. :: ::. :: :. ... .: . NP_001 TSLSHLSNGESKSG--GSYGTTWGAYGSN-YSGDKCSGPNGQANG----DTVNATLMQPG 510 520 530 540 550 470 480 490 500 510 520 pF1KSD T-GSKNDSWDNNNRSTGGSWNFGPQDSNDNKWGEGNKMTSGVSQGEWKQP---TGSDELK . : . ... :. . :: :. : .:....:: :: .:: :. : : ::.. : NP_001 VNGPMGTNFQVNTNKGGGVWESGAANSQSTSWGSGNGANSGGSRRGWGTPAQNTGTN-LP 560 570 580 590 600 610 530 540 550 560 pF1KSD IGEWSG-PNQPNSSTGAWDNQKGHP------LPENQGNA------QAPCWGRSSSSTGSE ::. :.. .:. .: : : :.::.: :. :....... :. NP_001 SVEWNKLPSNQHSNDSANGNGKTFTNGWKSTEEEDQGSATSQTNEQSSVWAKTGGTVESD 620 630 640 650 660 670 570 580 590 600 610 620 pF1KSD VGGQSTGSNHKAGSSDSHNSGRRSYRPTHPDCQAVLQTLLSRTDLDPRVLSNTGWGQTQI . .::: .. :...:.. ::. : ...::....:::::::::::.::::: : NP_001 GSTESTGRLEEKGTGESQSRDRRKI-----DQHTLLQSIVNRTDLDPRVLSNSGWGQTPI 680 690 700 710 720 630 640 650 660 670 680 pF1KSD KQDTVWDIEEVPRPEGKSDKGTEGWESAATQTKNSGGWGD--APSQSNQMK-SGWGELSA ::.:.:: : :: : :.:.:::.: :.:::: :::. : .:. .. . ::::. . NP_001 KQNTAWDTETSPRGERKTDNGTEAWGSSATQTFNSGACIDKTSPNGNDTSSVSGWGDPKP 730 740 750 760 770 780 690 700 710 720 730 pF1KSD STEWKDPKNT---GGWNDYKNNN----SSNWGGGRPDEKTPSSWNENPSKDQGWGGGRQP . .: : :.. :::.: . . :..::. . .:: ..::.. .. :::: :.. NP_001 ALRWGDSKGSNCQGGWEDDSAATGMVKSNQWGNCK-EEK--AAWNDSQKNKQGWGDGQKS 790 800 810 820 830 840 740 750 760 770 780 pF1KSD NQGWS-SGKNGWGE--------EVDQTKNSNWESSASKPVSGWGEGGQNEIGTWGNGGNA .:::: :....::: :... :.:. :.... ::::.: :.. ::::. : NP_001 SQGWSVSASDNWGETSRNNHWGEANK-KSSSGGSDSDRSVSGWNELGKTSSFTWGNNINP 850 860 870 880 890 900 790 800 810 820 830 840 pF1KSD SLASKGGW-EDCKRSPA--WNETGRQPNS--WNKQHQQQQPPQQPPPPQPEASGSWGGPP . .: :: :. : .:. :.. .. .: :. . . . :. : . :::: NP_001 NNSS--GWDESSKPTPSQGWGDPPKSNQSLGWGDSSKPVSSPDWNK--QQDIVGSWG--- 910 920 930 940 950 850 860 870 880 890 900 pF1KSD PPPPGNVRPSNSSWSSGPQPATPKDEEPSGWEEPSPQSISRKMDIDDGTSAWGDPNSYNY ::.. .: ...: .:: :: :.:::.:::::::.:: :::.:::::::::::..::: NP_001 -IPPATGKPPGTGWLGGPIPAPAKEEEPTGWEEPSPESIRRKMEIDDGTSAWGDPSKYNY 960 970 980 990 1000 1010 910 920 pF1KSD KNVNLWDKNSQGG---------------PAPR-----------------EPNLPT----- ::::.:.:: .: :: ::. :. NP_001 KNVNMWNKNVPNGNSRSDQQAQVHQLLTPASAISNKEASSGSGWGEPWGEPSTPATTVDN 1020 1030 1040 1050 1060 1070 930 940 950 pF1KSD -----------------PMTSKSASDS----------------KSMQDGWGESDGPVTGA :... :.... ::::::: .: :. : NP_001 GTSAWGKPIDSGPSWGEPIAAASSTSTWGSSSVGPQALSKSGPKSMQDGWCGDDMPLPGN 1080 1090 1100 1110 1120 1130 960 970 980 990 1000 pF1KSD RHPSWEEEEDG--GVWNTTGSQGSASSHN-------SASWGQGGKKQMKCS--LKGGNN- : .:::::: :.::...:: :: : .: : .:::. . .::::. NP_001 RPTGWEEEEDVEIGMWNSNSSQELNSSLNWPPYTKKMSSKGLSGKKRRRERGMMKGGNKQ 1140 1150 1160 1170 1180 1190 1010 1020 1030 1040 1050 pF1KSD -DSWMNPLAKQFSNMGLL--SQTEDNPSSKMDLSVGSLSDKKFDVDKRAMNLGDFNDIMR ..:.::..:::::... : :. :.::::: : :.::....::...:.::.: . NP_001 EEAWINPFVKQFSNISFSRDSPEENVQSNKMDLSGGMLQDKRMEIDKHSLNIGDYNRTVG 1200 1210 1220 1230 1240 1250 1060 1070 1080 1090 1100 1110 pF1KSD KDRSGFRPPNSKDMGTTDSGPYFEKGGSHGLFG--NSTAQSRGLHTP-VQPLNSS-PSLR : : :: ::. .. . .:::.:.:. ..:: :..:: ::.. : .:::.:: :.:: NP_001 KG-PGSRPQISKE-SSMERNPYFDKNGNPSMFGVGNTAAQPRGMQQPPAQPLSSSQPNLR 1260 1270 1280 1290 1300 1310 1120 1130 1140 1150 1160 1170 pF1KSD AQVPPQFISPQVSASMLKQFPNSGLSPGLFNVGPQLSPQQIAMLSQLPQIPQFQLACQL- ::::: ..:::: .:.:: ::.: :: .: ..:::.:::.:: :. :.. :: NP_001 AQVPPPLLSPQVPVSLLKYAPNNG---GL---NPLFGPQQVAMLNQLSQLNQLSQISQLQ 1320 1330 1340 1350 1360 1180 1190 1200 1210 1220 pF1KSD -LLQQQQQQQLLQNQRKISQAVRQQQEQQLARMVSALQQQQQQQRQ-----------PGM :: :::. :.::.. .. : ::.:: .: .:. ::..::.:: : NP_001 RLLAQQQRA---QSQRSVPSGNRPQQDQQ-GRPLSVQQQMMQQSRQLDPNLLVKQQTPPS 1370 1380 1390 1400 1410 1420 1230 1240 1250 1260 1270 pF1KSD KHSPSHPVGPKPHLDNMVPNALNVGLPDLQTKGPIP-----GYGSGFSSG-GMDYGMVGG ...: : . : :::..:.. :.:: ::: : .. :..:. .... : . NP_001 QQQPLHQPAMKSFLDNVMPHTT----PELQ-KGPSPINAFSNFPIGLNSNLNVNMDMNSI 1430 1440 1450 1460 1470 1280 1290 1300 1310 1320 1330 pF1KSD KEAGTESRFKQWTSMMEGLPSVATQEANMHKNGAIVAPGKTRGGSPYNQFDIIPGDTL-G :: .::...::.. ... .. . : :.::: . : ::. .:.. ..: . NP_001 KEP--QSRLRKWTTV-DSISVNTSLDQNSSKHGAI-SSGFRLEESPFVPYDFMNSSTSPA 1480 1490 1500 1510 1520 1530 1340 1350 1360 1370 1380 1390 pF1KSD GHTGPAGDSWLPAKSPPTNKIGSKSSNASWPPEFQPGVPWKGIQNIDPESDPYVTPGSVL . : ::.: :::: . ::...:::::.:: :::: :::::.:::::::::. NP_001 SPPGSIGDGWPRAKSP------NGSSSVNWPPEFRPGEPWKGYPNIDPETDPYVTPGSVI 1540 1550 1560 1570 1580 1400 1410 1420 1430 1440 1450 pF1KSD GGTATSPIVDTDHQLLRDNTTGSNSSLNTSLPSPGAWP-YSASDNSF---TNVHSTSAKF .. . . . ..:: ::: ..::.:::::.::: .:: ::. . ....::::. NP_001 NNLSINTVREVDH--LRDRNSGSSSSLNTTLPSTSAWSSIRASNYNVPLSSTAQSTSARN 1590 1600 1610 1620 1630 1640 1460 1470 1480 1490 1500 1510 pF1KSD PDYKSTWSPDPIGHNPTHLSNKMWKNHISSRNTTPLPRPPPGLTNPKPS-SPWSSTAPRS : : :::: . . : :....:: . .: : :::::::. :: : :... : NP_001 SDSKLTWSPGSVTN--TSLAHELWKVPLPPKNITAPSRPPPGLTGQKPPLSTWDNSPLRI 1650 1660 1670 1680 1690 1700 1520 1530 1540 1550 1560 1570 pF1KSD VRGWGTQDSRLASASTWSDGGSVRPSYWLVLHNLTPQIDGSTLRTICMQHGPLLTFHLNL :::..:.: . .:.:....: : . ::::.:::::::::::::.:::::::.:::::: NP_001 GGGWGNSDARYTPGSSWGESSSGRITNWLVLKNLTPQIDGSTLRTLCMQHGPLITFHLNL 1710 1720 1730 1740 1750 1760 1580 1590 1600 1610 1620 1630 pF1KSD TQGTALIRYSTKQEAAKAQTALHMCVLGNTTILAEFATDDEVSRFLAQAQPPTPAATPSA .:.::.:::.:.:..::: .::::::::::::::::...:.:::.::.: :: .: NP_001 PHGNALVRYSSKEEVVKAQKSLHMCVLGNTTILAEFASEEEISRFFAQSQSLTP--SP-- 1770 1780 1790 1800 1810 1820 1640 1650 1660 1670 1680 pF1KSD PAAGWQSLETGQNQSDPVGPALNLFGGSTGLGQWSSSA-GGSSGADLAGASLWGPPNYSS ::::: ..:.. . . . :.. : :..:.... .:.. .:: :.:::: :.::. NP_001 ---GWQSLGSSQSRLGSLDCSHS-FSSRTDLNHWNGAGLSGTNCGDLHGTSLWGTPHYST 1830 1840 1850 1860 1870 1690 1700 1710 1720 pF1KSD SLWGVPTVEDPHRMGSPAPL---LPGDLLGGGSDSI :::: :. ::. ..::.:. : : ::::..:. NP_001 SLWGPPSSSDPRGISSPSPINAFLSVDHLGGGGESM 1880 1890 1900 1910 >>XP_016878636 (OMIM: 610739) PREDICTED: trinucleotide r (1922 aa) initn: 1945 init1: 568 opt: 2343 Z-score: 1110.4 bits: 218.7 E(85289): 4.1e-55 Smith-Waterman score: 3358; 37.6% identity (62.8% similar) in 1806 aa overlap (138-1722:193-1922) 110 120 130 140 150 160 pF1KSD GQPPPPSCMLLGGGAGPPPCTAPGANPNNAQVTGALLQSESGTAPDSTLGGAAASNYANS : .: . .:.. . . . .: :.: :: XP_016 HFPVIAANLGSAVKVLNSQSESSALTNQQPQNNGEVQNSKNQSDINHSTSG---SHYENS 170 180 190 200 210 170 180 190 200 210 220 pF1KSD TWGSGASSNNGTSPNPIHIWDKVIVDGSDMEEWPCIASKDTESSSENTTDNNSASNPGSE : .::.. .: : . :. : :. : :: ..: : .:: : .:::. :: XP_016 QRGP-VSSTSDSSTN---CKNAVVSDLSEKEAWPSAPGSDPELASE-CMDADSASSSESE 220 230 240 250 260 270 230 240 250 260 pF1KSD KSTL---PGSTTSNK-------GKGSQCQ------SASSGNECNLGVWKSDPKAK----- .. :.: ..: : ::: . : . :. . : : . : XP_016 RNITIMASGNTGGEKDGLRNSTGLGSQNKFVVGSSSNNVGHGSSTGPWGFSHGAIISTCQ 280 290 300 310 320 330 270 280 290 300 310 320 pF1KSD -SVQSSNSTTEN-NNGLGNWRNVSGQDRIGPGSGFSNFNPNSNPSAWPALVQEGTSRKGA ::.. .: .:. :: .. : .::... . : . :..: :: .:::.: ..: . :: XP_016 VSVDAPESKSESSNNRMNAWGTVSSSS--NGGLNPSTLNSASNHGAWPVLENNGLALKGP 340 350 360 370 380 390 330 340 350 360 pF1KSD LETDNSNSSAQVSTVGQTSREQQ--SKM------------------ENAGVNFV-VSGRE . . .:. . : ::.:: .:. ::. : .:.. : ::. XP_016 VGSGSSGINIQCSTIGQMPNNQSINSKVSGGSTHGTWGSLQETCESEVSGTQKVSFSGQP 400 410 420 430 440 450 370 380 390 400 410 pF1KSD QAQIHNTDGPKNGNTNSLNLSSPNP--MENKGMPFGMGLGNTSRST------DAPSQ--- : . :: :..:: .. : :: ..:. .: . . : :: .::: XP_016 QNITTEMTGP-NNTTNFMTSSLPNSGSVQNNELP-SSNTGAWRVSTMNHPQMQAPSGMNG 460 470 480 490 500 510 420 430 440 450 460 pF1KSD ------STGDRKTGSVGSWGAARGPSGTDTVSGQSNSGNNGN-NGKEREDSWKGASVQKS :.:. :.: ::.:.. : :.. ::.. :: ::. :: :. ... .: . XP_016 TSLSHLSNGESKSG--GSYGTTWGAYGSN-YSGDKCSGPNGQANG----DTVNATLMQPG 520 530 540 550 560 470 480 490 500 510 520 pF1KSD T-GSKNDSWDNNNRSTGGSWNFGPQDSNDNKWGEGNKMTSGVSQGEWKQP---TGSDELK . : . ... :. . :: :. : .:....:: :: .:: :. : : ::.. : XP_016 VNGPMGTNFQVNTNKGGGVWESGAANSQSTSWGSGNGANSGGSRRGWGTPAQNTGTN-LP 570 580 590 600 610 620 530 540 550 560 pF1KSD IGEWSG-PNQPNSSTGAWDNQKGHP------LPENQGNA------QAPCWGRSSSSTGSE ::. :.. .:. .: : : :.::.: :. :....... :. XP_016 SVEWNKLPSNQHSNDSANGNGKTFTNGWKSTEEEDQGSATSQTNEQSSVWAKTGGTVESD 630 640 650 660 670 680 570 580 590 600 610 620 pF1KSD VGGQSTGSNHKAGSSDSHNSGRRSYRPTHPDCQAVLQTLLSRTDLDPRVLSNTGWGQTQI . .::: .. :...:.. ::. : ...::....:::::::::::.::::: : XP_016 GSTESTGRLEEKGTGESQSRDRRKI-----DQHTLLQSIVNRTDLDPRVLSNSGWGQTPI 690 700 710 720 730 630 640 650 660 670 680 pF1KSD KQDTVWDIEEVPRPEGKSDKGTEGWESAATQTKNSGGWGD--APSQSNQMK-SGWGELSA ::.:.:: : :: : :.:.:::.: :.:::: :::. : .:. .. . ::::. . XP_016 KQNTAWDTETSPRGERKTDNGTEAWGSSATQTFNSGACIDKTSPNGNDTSSVSGWGDPKP 740 750 760 770 780 790 690 700 710 720 730 pF1KSD STEWKDPKNT---GGWNDYKNNN----SSNWGGGRPDEKTPSSWNENPSKDQGWGGGRQP . .: : :.. :::.: . . :..::. . .:: ..::.. .. :::: :.. XP_016 ALRWGDSKGSNCQGGWEDDSAATGMVKSNQWGNCK-EEK--AAWNDSQKNKQGWGDGQKS 800 810 820 830 840 850 740 750 760 770 780 pF1KSD NQGWS-SGKNGWGE--------EVDQTKNSNWESSASKPVSGWGEGGQNEIGTWGNGGNA .:::: :....::: :... :.:. :.... ::::.: :.. ::::. : XP_016 SQGWSVSASDNWGETSRNNHWGEANK-KSSSGGSDSDRSVSGWNELGKTSSFTWGNNINP 860 870 880 890 900 910 790 800 810 820 830 840 pF1KSD SLASKGGW-EDCKRSPA--WNETGRQPNS--WNKQHQQQQPPQQPPPPQPEASGSWGGPP . .: :: :. : .:. :.. .. .: :. . . . :. : . :::: XP_016 NNSS--GWDESSKPTPSQGWGDPPKSNQSLGWGDSSKPVSSPDWNK--QQDIVGSWG--- 920 930 940 950 960 850 860 870 880 890 900 pF1KSD PPPPGNVRPSNSSWSSGPQPATPKDEEPSGWEEPSPQSISRKMDIDDGTSAWGDPNSYNY ::.. .: ...: .:: :: :.:::.:::::::.:: :::.:::::::::::..::: XP_016 -IPPATGKPPGTGWLGGPIPAPAKEEEPTGWEEPSPESIRRKMEIDDGTSAWGDPSKYNY 970 980 990 1000 1010 1020 910 920 pF1KSD KNVNLWDKNSQGG---------------PAPR-----------------EPNLPT----- ::::.:.:: .: :: ::. :. XP_016 KNVNMWNKNVPNGNSRSDQQAQVHQLLTPASAISNKEASSGSGWGEPWGEPSTPATTVDN 1030 1040 1050 1060 1070 1080 930 940 950 pF1KSD -----------------PMTSKSASDS----------------KSMQDGWGESDGPVTGA :... :.... ::::::: .: :. : XP_016 GTSAWGKPIDSGPSWGEPIAAASSTSTWGSSSVGPQALSKSGPKSMQDGWCGDDMPLPGN 1090 1100 1110 1120 1130 1140 960 970 980 990 1000 pF1KSD RHPSWEEEEDG--GVWNTTGSQGSASSHN-------SASWGQGGKKQMKCS--LKGGNN- : .:::::: :.::...:: :: : .: : .:::. . .::::. XP_016 RPTGWEEEEDVEIGMWNSNSSQELNSSLNWPPYTKKMSSKGLSGKKRRRERGMMKGGNKQ 1150 1160 1170 1180 1190 1200 1010 1020 1030 1040 1050 pF1KSD -DSWMNPLAKQFSNMGLL--SQTEDNPSSKMDLSVGSLSDKKFDVDKRAMNLGDFNDIMR ..:.::..:::::... : :. :.::::: : :.::....::...:.::.: . XP_016 EEAWINPFVKQFSNISFSRDSPEENVQSNKMDLSGGMLQDKRMEIDKHSLNIGDYNRTVG 1210 1220 1230 1240 1250 1260 1060 1070 1080 1090 1100 1110 pF1KSD KDRSGFRPPNSKDMGTTDSGPYFEKGGSHGLFG--NSTAQSRGLHTP-VQPLNSS-PSLR : : :: ::. .. . .:::.:.:. ..:: :..:: ::.. : .:::.:: :.:: XP_016 KG-PGSRPQISKE-SSMERNPYFDKNGNPSMFGVGNTAAQPRGMQQPPAQPLSSSQPNLR 1270 1280 1290 1300 1310 1320 1120 1130 1140 1150 1160 1170 pF1KSD AQVPPQFISPQVSASMLKQFPNSGLSPGLFNVGPQLSPQQIAMLSQLPQIPQFQLACQL- ::::: ..:::: .:.:: ::.: :: .: ..:::.:::.:: :. :.. :: XP_016 AQVPPPLLSPQVPVSLLKYAPNNG---GL---NPLFGPQQVAMLNQLSQLNQLSQISQLQ 1330 1340 1350 1360 1370 1180 1190 1200 1210 1220 pF1KSD -LLQQQQQQQLLQNQRKISQAVRQQQEQQLARMVSALQQQQQQQRQ-----------PGM :: :::. :.::.. .. : ::.:: .: .:. ::..::.:: : XP_016 RLLAQQQRA---QSQRSVPSGNRPQQDQQ-GRPLSVQQQMMQQSRQLDPNLLVKQQTPPS 1380 1390 1400 1410 1420 1430 1230 1240 1250 1260 1270 pF1KSD KHSPSHPVGPKPHLDNMVPNALNVGLPDLQTKGPIP-----GYGSGFSSG-GMDYGMVGG ...: : . : :::..:.. :.:: ::: : .. :..:. .... : . XP_016 QQQPLHQPAMKSFLDNVMPHTT----PELQ-KGPSPINAFSNFPIGLNSNLNVNMDMNSI 1440 1450 1460 1470 1480 1280 1290 1300 1310 1320 1330 pF1KSD KEAGTESRFKQWTSMMEGLPSVATQEANMHKNGAIVAPGKTRGGSPYNQFDIIPGDTL-G :: .::...::.. ... .. . : :.::: . : ::. .:.. ..: . XP_016 KEP--QSRLRKWTTV-DSISVNTSLDQNSSKHGAI-SSGFRLEESPFVPYDFMNSSTSPA 1490 1500 1510 1520 1530 1540 1340 1350 1360 1370 1380 1390 pF1KSD GHTGPAGDSWLPAKSPPTNKIGSKSSNASWPPEFQPGVPWKGIQNIDPESDPYVTPGSVL . : ::.: :::: . ::...:::::.:: :::: :::::.:::::::::. XP_016 SPPGSIGDGWPRAKSP------NGSSSVNWPPEFRPGEPWKGYPNIDPETDPYVTPGSVI 1550 1560 1570 1580 1590 1400 1410 1420 1430 1440 1450 pF1KSD GGTATSPIVDTDHQLLRDNTTGSNSSLNTSLPSPGAWP-YSASDNSF---TNVHSTSAKF .. . . . ..:: ::: ..::.:::::.::: .:: ::. . ....::::. XP_016 NNLSINTVREVDH--LRDRNSGSSSSLNTTLPSTSAWSSIRASNYNVPLSSTAQSTSARN 1600 1610 1620 1630 1640 1650 1460 1470 1480 1490 1500 1510 pF1KSD PDYKSTWSPDPIGHNPTHLSNKMWKNHISSRNTTPLPRPPPGLTNPKPS-SPWSSTAPRS : : :::: . . : :....:: . .: : :::::::. :: : :... : XP_016 SDSKLTWSPGSVTN--TSLAHELWKVPLPPKNITAPSRPPPGLTGQKPPLSTWDNSPLRI 1660 1670 1680 1690 1700 1710 1520 1530 1540 1550 1560 1570 pF1KSD VRGWGTQDSRLASASTWSDGGSVRPSYWLVLHNLTPQIDGSTLRTICMQHGPLLTFHLNL :::..:.: . .:.:....: : . ::::.:::::::::::::.:::::::.:::::: XP_016 GGGWGNSDARYTPGSSWGESSSGRITNWLVLKNLTPQIDGSTLRTLCMQHGPLITFHLNL 1720 1730 1740 1750 1760 1770 1580 1590 1600 1610 1620 1630 pF1KSD TQGTALIRYSTKQEAAKAQTALHMCVLGNTTILAEFATDDEVSRFLAQAQPPTPAATPSA .:.::.:::.:.:..::: .::::::::::::::::...:.:::.::.: :: .: XP_016 PHGNALVRYSSKEEVVKAQKSLHMCVLGNTTILAEFASEEEISRFFAQSQSLTP--SP-- 1780 1790 1800 1810 1820 1830 1640 1650 1660 1670 1680 pF1KSD PAAGWQSLETGQNQSDPVGPALNLFGGSTGLGQWSSSA-GGSSGADLAGASLWGPPNYSS ::::: ..:.. . . . :.. : :..:.... .:.. .:: :.:::: :.::. XP_016 ---GWQSLGSSQSRLGSLDCSHS-FSSRTDLNHWNGAGLSGTNCGDLHGTSLWGTPHYST 1840 1850 1860 1870 1880 1690 1700 1710 1720 pF1KSD SLWGVPTVEDPHRMGSPAPL---LPGDLLGGGSDSI :::: :. ::. ..::.:. : : ::::..:. XP_016 SLWGPPSSSDPRGISSPSPINAFLSVDHLGGGGESM 1890 1900 1910 1920 >>XP_016878640 (OMIM: 610739) PREDICTED: trinucleotide r (1863 aa) initn: 1945 init1: 568 opt: 2308 Z-score: 1094.2 bits: 215.7 E(85289): 3.3e-54 Smith-Waterman score: 3582; 38.9% identity (64.6% similar) in 1814 aa overlap (76-1722:131-1863) 50 60 70 80 90 100 pF1KSD SLSQPTAASPIGSSPSPPVNGGNNAKRVAVPNGQPPSAARYMPREVPPRFRCQQDHKVLL :. :: . :: ::::::::: .:.:: :: XP_016 NQQPQQQQQQQQPQQQQPQQQPQPQPQQQQPQQQPQALPRY-PREVPPRFR-HQEHKQLL 110 120 130 140 150 110 120 130 140 150 160 pF1KSD KRGQPPPPSCMLLGGGAGPPPCTAPGANPNNAQV--TGALLQSESGTAPDSTLGGAAASN :::: : ::... . .. .: : .: . .:.. . . . .: :. XP_016 KRGQHFPVIAANLGSAVKVLNSQSESSALTNQQPQNNGEVQNSKNQSDINHSTSG---SH 160 170 180 190 200 210 170 180 190 200 210 220 pF1KSD YANSTWGSGASSNNGTSPNPIHIWDKVIVDGSDMEEWPCIASKDTESSSENTTDNNSASN : :: : .::.. .: : . :. : :. : :: ..: : .:: : .:::. XP_016 YENSQRGP-VSSTSDSSTN---CKNAVVSDLSEKEAWPSAPGSDPELASE-CMDADSASS 220 230 240 250 260 270 230 240 250 260 pF1KSD PGSEKSTL---PGSTTSNK-------GKGSQCQ------SASSGNECNLGVWKSDPKAK- ::.. :.: ..: : ::: . : . :. . : : . : XP_016 SESERNITIMASGNTGGEKDGLRNSTGLGSQNKFVVGSSSNNVGHGSSTGPWGFSHGAII 280 290 300 310 320 330 270 280 290 300 310 320 pF1KSD -----SVQSSNSTTEN-NNGLGNWRNVSGQDRIGPGSGFSNFNPNSNPSAWPALVQEGTS ::.. .: .:. :: .. : .::... . : . :..: :: .:::.: ..: . XP_016 STCQVSVDAPESKSESSNNRMNAWGTVSSSS--NGGLNPSTLNSASNHGAWPVLENNGLA 340 350 360 370 380 330 340 350 pF1KSD RKGALETDNSNSSAQVSTVGQTSREQQ--SKM------------------ENAGVNFV-V :: . . .:. . : ::.:: .:. ::. : .:.. : XP_016 LKGPVGSGSSGINIQCSTIGQMPNNQSINSKVSGGSTHGTWGSLQETCESEVSGTQKVSF 390 400 410 420 430 440 360 370 380 390 400 410 pF1KSD SGREQAQIHNTDGPKNGNTNSLNLSSPNP--MENKGMPFGMGLGNTSRST------DAPS ::. : . :: :..:: .. : :: ..:. .: . . : :: .::: XP_016 SGQPQNITTEMTGP-NNTTNFMTSSLPNSGSVQNNELP-SSNTGAWRVSTMNHPQMQAPS 450 460 470 480 490 500 420 430 440 450 460 pF1KSD Q---------STGDRKTGSVGSWGAARGPSGTDTVSGQSNSGNNGN-NGKEREDSWKGAS :.:. :.: ::.:.. : :.. ::.. :: ::. :: :. ... XP_016 GMNGTSLSHLSNGESKSG--GSYGTTWGAYGSN-YSGDKCSGPNGQANG----DTVNATL 510 520 530 540 550 470 480 490 500 510 pF1KSD VQKST-GSKNDSWDNNNRSTGGSWNFGPQDSNDNKWGEGNKMTSGVSQGEWKQP---TGS .: .. : . ... :. . :: :. : .:....:: :: .:: :. : : ::. XP_016 MQPGVNGPMGTNFQVNTNKGGGVWESGAANSQSTSWGSGNGANSGGSRRGWGTPAQNTGT 560 570 580 590 600 610 520 530 540 550 560 pF1KSD DELKIGEWSG-PNQPNSSTGAWDNQKGHP------LPENQGNA------QAPCWGRSSSS . : ::. :.. .:. .: : : :.::.: :. :...... XP_016 N-LPSVEWNKLPSNQHSNDSANGNGKTFTNGWKSTEEEDQGSATSQTNEQSSVWAKTGGT 620 630 640 650 660 670 570 580 590 600 610 620 pF1KSD TGSEVGGQSTGSNHKAGSSDSHNSGRRSYRPTHPDCQAVLQTLLSRTDLDPRVLSNTGWG . :. . .::: .. :...:.. ::. : ...::....:::::::::::.::: XP_016 VESDGSTESTGRLEEKGTGESQSRDRRKI-----DQHTLLQSIVNRTDLDPRVLSNSGWG 680 690 700 710 720 730 630 640 650 660 670 680 pF1KSD QTQIKQDTVWDIEEVPRPEGKSDKGTEGWESAATQTKNSGGWGD--APSQSNQMK-SGWG :: :::.:.:: : :: : :.:.:::.: :.:::: :::. : .:. .. . :::: XP_016 QTPIKQNTAWDTETSPRGERKTDNGTEAWGSSATQTFNSGACIDKTSPNGNDTSSVSGWG 740 750 760 770 780 790 690 700 710 720 730 pF1KSD ELSASTEWKDPKNT---GGWNDYKNNN----SSNWGGGRPDEKTPSSWNENPSKDQGWGG . . . .: : :.. :::.: . . :..::. . .:: ..::.. .. :::: XP_016 DPKPALRWGDSKGSNCQGGWEDDSAATGMVKSNQWGNCK-EEK--AAWNDSQKNKQGWGD 800 810 820 830 840 850 740 750 760 770 780 pF1KSD GRQPNQGWS-SGKNGWGEEVDQTKNSNWE----------SSASKPVSGWGEGGQNEIGTW :.. .:::: :....::: ..:..: :.... ::::.: :.. :: XP_016 GQKSSQGWSVSASDNWGET---SRNNHWGEANKKSSSGGSDSDRSVSGWNELGKTSSFTW 860 870 880 890 900 790 800 810 820 830 pF1KSD GNGGNASLASKGGW-EDCKRSPA--WNETGRQPNS--WNKQHQQQQPPQQPP-PPQPEAS ::. : . .: :: :. : .:. :.. .. .: :. ....: ..: : . XP_016 GNNINPNNSS--GWDESSKPTPSQGWGDPPKSNQSLGWG---DSSKPVSSPDWNKQQDIV 910 920 930 940 950 960 840 850 860 870 880 890 pF1KSD GSWGGPPPPPPGNVRPSNSSWSSGPQPATPKDEEPSGWEEPSPQSISRKMDIDDGTSAWG :::: ::.. .: ...: .:: :: :.:::.:::::::.:: :::.::::::::: XP_016 GSWG----IPPATGKPPGTGWLGGPIPAPAKEEEPTGWEEPSPESIRRKMEIDDGTSAWG 970 980 990 1000 1010 900 910 920 930 940 pF1KSD DPNSYNYKNVNLWDKNSQGGPAPREPN-----LPTP---MTSKSASDS---KSMQDGWGE ::..:::::::.:.:: .: . . . : :: ...: ::.. ::::::: XP_016 DPSKYNYKNVNMWNKNVPNGNSRSDQQAQVHQLLTPASAISNKEASSGSGPKSMQDGWCG 1020 1030 1040 1050 1060 1070 950 960 970 980 990 pF1KSD SDGPVTGARHPSWEEEEDG--GVWNTTGSQGSASSHN-------SASWGQGGKKQMKCS- .: :. : : .:::::: :.::...:: :: : .: : .:::. . XP_016 DDMPLPGNRPTGWEEEEDVEIGMWNSNSSQELNSSLNWPPYTKKMSSKGLSGKKRRRERG 1080 1090 1100 1110 1120 1130 1000 1010 1020 1030 1040 1050 pF1KSD -LKGGNN--DSWMNPLAKQFSNMGLL--SQTEDNPSSKMDLSVGSLSDKKFDVDKRAMNL .::::. ..:.::..:::::... : :. :.::::: : :.::....::...:. XP_016 MMKGGNKQEEAWINPFVKQFSNISFSRDSPEENVQSNKMDLSGGMLQDKRMEIDKHSLNI 1140 1150 1160 1170 1180 1190 1060 1070 1080 1090 1100 pF1KSD GDFNDIMRKDRSGFRPPNSKDMGTTDSGPYFEKGGSHGLFG--NSTAQSRGLHTP-VQPL ::.: . : : :: ::. .. . .:::.:.:. ..:: :..:: ::.. : .::: XP_016 GDYNRTVGKG-PGSRPQISKE-SSMERNPYFDKNGNPSMFGVGNTAAQPRGMQQPPAQPL 1200 1210 1220 1230 1240 1250 1110 1120 1130 1140 1150 1160 pF1KSD NSS-PSLRAQVPPQFISPQVSASMLKQFPNSGLSPGLFNVGPQLSPQQIAMLSQLPQIPQ .:: :.::::::: ..:::: .:.:: ::.: :: .: ..:::.:::.:: :. : XP_016 SSSQPNLRAQVPPPLLSPQVPVSLLKYAPNNG---GL---NPLFGPQQVAMLNQLSQLNQ 1260 1270 1280 1290 1300 1310 1170 1180 1190 1200 1210 pF1KSD FQLACQL--LLQQQQQQQLLQNQRKISQAVRQQQEQQLARMVSALQQQQQQQRQ------ .. :: :: :::. : .::.. .. : ::.:: .: .:. ::..::.:: XP_016 LSQISQLQRLLAQQQRAQ---SQRSVPSGNRPQQDQQ-GRPLSVQQQMMQQSRQLDPNLL 1320 1330 1340 1350 1360 1220 1230 1240 1250 1260 pF1KSD -----PGMKHSPSHPVGPKPHLDNMVPNALNVGLPDLQTKGPIP-----GYGSGFSSG-G : ...: : . : :::..:.. :.:: ::: : .. :..:. . XP_016 VKQQTPPSQQQPLHQPAMKSFLDNVMPHTT----PELQ-KGPSPINAFSNFPIGLNSNLN 1370 1380 1390 1400 1410 1420 1270 1280 1290 1300 1310 1320 pF1KSD MDYGMVGGKEAGTESRFKQWTSMMEGLPSVATQEANMHKNGAIVAPGKTRGGSPYNQFDI ... : . :: .::...::.. ... .. . : :.::: . : ::. .:. XP_016 VNMDMNSIKE--PQSRLRKWTTV-DSISVNTSLDQNSSKHGAI-SSGFRLEESPFVPYDF 1430 1440 1450 1460 1470 1330 1340 1350 1360 1370 1380 pF1KSD IPGDTL-GGHTGPAGDSWLPAKSPPTNKIGSKSSNASWPPEFQPGVPWKGIQNIDPESDP . ..: .. : ::.: :::: . ::...:::::.:: :::: :::::.:: XP_016 MNSSTSPASPPGSIGDGWPRAKSP------NGSSSVNWPPEFRPGEPWKGYPNIDPETDP 1480 1490 1500 1510 1520 1530 1390 1400 1410 1420 1430 1440 pF1KSD YVTPGSVLGGTATSPIVDTDHQLLRDNTTGSNSSLNTSLPSPGAWP-YSASDNSF---TN :::::::... . . . ..:: ::: ..::.:::::.::: .:: ::. . .. XP_016 YVTPGSVINNLSINTVREVDH--LRDRNSGSSSSLNTTLPSTSAWSSIRASNYNVPLSST 1540 1550 1560 1570 1580 1450 1460 1470 1480 1490 1500 pF1KSD VHSTSAKFPDYKSTWSPDPIGHNPTHLSNKMWKNHISSRNTTPLPRPPPGLTNPKPS-SP ..::::. : : :::: . . : :....:: . .: : :::::::. :: : XP_016 AQSTSARNSDSKLTWSPGSVTN--TSLAHELWKVPLPPKNITAPSRPPPGLTGQKPPLST 1590 1600 1610 1620 1630 1640 1510 1520 1530 1540 1550 1560 pF1KSD WSSTAPRSVRGWGTQDSRLASASTWSDGGSVRPSYWLVLHNLTPQIDGSTLRTICMQHGP :... : :::..:.: . .:.:....: : . ::::.:::::::::::::.:::::: XP_016 WDNSPLRIGGGWGNSDARYTPGSSWGESSSGRITNWLVLKNLTPQIDGSTLRTLCMQHGP 1650 1660 1670 1680 1690 1700 1570 1580 1590 1600 1610 1620 pF1KSD LLTFHLNLTQGTALIRYSTKQEAAKAQTALHMCVLGNTTILAEFATDDEVSRFLAQAQPP :.:::::: .:.::.:::.:.:..::: .::::::::::::::::...:.:::.::.: XP_016 LITFHLNLPHGNALVRYSSKEEVVKAQKSLHMCVLGNTTILAEFASEEEISRFFAQSQSL 1710 1720 1730 1740 1750 1760 1630 1640 1650 1660 1670 1680 pF1KSD TPAATPSAPAAGWQSLETGQNQSDPVGPALNLFGGSTGLGQWSSSA-GGSSGADLAGASL :: .: ::::: ..:.. . . . :.. : :..:.... .:.. .:: :.:: XP_016 TP--SP-----GWQSLGSSQSRLGSLDCSHS-FSSRTDLNHWNGAGLSGTNCGDLHGTSL 1770 1780 1790 1800 1810 1690 1700 1710 1720 pF1KSD WGPPNYSSSLWGVPTVEDPHRMGSPAPL---LPGDLLGGGSDSI :: :.::.:::: :. ::. ..::.:. : : ::::..:. XP_016 WGTPHYSTSLWGPPSSSDPRGISSPSPINAFLSVDHLGGGGESM 1820 1830 1840 1850 1860 >>XP_016878643 (OMIM: 610739) PREDICTED: trinucleotide r (1698 aa) initn: 1961 init1: 568 opt: 2024 Z-score: 961.9 bits: 191.1 E(85289): 7.7e-47 Smith-Waterman score: 3200; 37.2% identity (61.7% similar) in 1773 aa overlap (207-1722:4-1698) 180 190 200 210 220 230 pF1KSD NGTSPNPIHIWDKVIVDGSDMEEWPCIASKDTESSSENTTDNN--SASNPGSEKSTLPGS :. ::::. . . ...: :.::. : .: XP_016 MDADSASSSESERNITIMASGNTGGEKDGLRNS 10 20 30 240 250 260 270 280 pF1KSD TTSNKGKGSQCQ------SASSGNECNLGVWKSDPKAK------SVQSSNSTTEN-NNGL : : ::: . : . :. . : : . : ::.. .: .:. :: . XP_016 T----GLGSQNKFVVGSSSNNVGHGSSTGPWGFSHGAIISTCQVSVDAPESKSESSNNRM 40 50 60 70 80 290 300 310 320 330 340 pF1KSD GNWRNVSGQDRIGPGSGFSNFNPNSNPSAWPALVQEGTSRKGALETDNSNSSAQVSTVGQ . : .::... . : . :..: :: .:::.: ..: . :: . . .:. . : ::.:: XP_016 NAWGTVSSSS--NGGLNPSTLNSASNHGAWPVLENNGLALKGPVGSGSSGINIQCSTIGQ 90 100 110 120 130 140 350 360 370 380 pF1KSD TSREQQ--SKM------------------ENAGVNFV-VSGREQAQIHNTDGPKNGNTNS .:. ::. : .:.. : ::. : . :: :..:: XP_016 MPNNQSINSKVSGGSTHGTWGSLQETCESEVSGTQKVSFSGQPQNITTEMTGP-NNTTNF 150 160 170 180 190 200 390 400 410 420 pF1KSD LNLSSPNP--MENKGMPFGMGLGNTSRST------DAPSQ---------STGDRKTGSVG .. : :: ..:. .: . . : :: .::: :.:. :.: : XP_016 MTSSLPNSGSVQNNELP-SSNTGAWRVSTMNHPQMQAPSGMNGTSLSHLSNGESKSG--G 210 220 230 240 250 260 430 440 450 460 470 480 pF1KSD SWGAARGPSGTDTVSGQSNSGNNGN-NGKEREDSWKGASVQKST-GSKNDSWDNNNRSTG :.:.. : :.. ::.. :: ::. :: :. ... .: .. : . ... :. . : XP_016 SYGTTWGAYGSN-YSGDKCSGPNGQANG----DTVNATLMQPGVNGPMGTNFQVNTNKGG 270 280 290 300 310 490 500 510 520 530 pF1KSD GSWNFGPQDSNDNKWGEGNKMTSGVSQGEWKQP---TGSDELKIGEWSG-PNQPNSSTGA : :. : .:....:: :: .:: :. : : ::.. : ::. :.. .:. .: XP_016 GVWESGAANSQSTSWGSGNGANSGGSRRGWGTPAQNTGTN-LPSVEWNKLPSNQHSNDSA 320 330 340 350 360 370 540 550 560 570 580 pF1KSD WDNQKGHP------LPENQGNA------QAPCWGRSSSSTGSEVGGQSTGSNHKAGSSDS : : :.::.: :. :....... :. . .::: .. :...: XP_016 NGNGKTFTNGWKSTEEEDQGSATSQTNEQSSVWAKTGGTVESDGSTESTGRLEEKGTGES 380 390 400 410 420 430 590 600 610 620 630 640 pF1KSD HNSGRRSYRPTHPDCQAVLQTLLSRTDLDPRVLSNTGWGQTQIKQDTVWDIEEVPRPEGK .. ::. : ...::....:::::::::::.::::: :::.:.:: : :: : : XP_016 QSRDRRKI-----DQHTLLQSIVNRTDLDPRVLSNSGWGQTPIKQNTAWDTETSPRGERK 440 450 460 470 480 490 650 660 670 680 690 pF1KSD SDKGTEGWESAATQTKNSGGWGD--APSQSNQMK-SGWGELSASTEWKDPKNT---GGWN .:.:::.: :.:::: :::. : .:. .. . ::::. . . .: : :.. :::. XP_016 TDNGTEAWGSSATQTFNSGACIDKTSPNGNDTSSVSGWGDPKPALRWGDSKGSNCQGGWE 500 510 520 530 540 550 700 710 720 730 740 750 pF1KSD DYKNNN----SSNWGGGRPDEKTPSSWNENPSKDQGWGGGRQPNQGWS-SGKNGWGEEVD : . . :..::. . .:: ..::.. .. :::: :.. .:::: :....::: XP_016 DDSAATGMVKSNQWGNCK-EEK--AAWNDSQKNKQGWGDGQKSSQGWSVSASDNWGET-- 560 570 580 590 600 760 770 780 790 800 pF1KSD QTKNSNWE----------SSASKPVSGWGEGGQNEIGTWGNGGNASLASKGGW-EDCKRS ..:..: :.... ::::.: :.. ::::. : . .: :: :. : . XP_016 -SRNNHWGEANKKSSSGGSDSDRSVSGWNELGKTSSFTWGNNINPNNSS--GWDESSKPT 610 620 630 640 650 660 810 820 830 840 850 pF1KSD PA--WNETGRQPNS--WNKQHQQQQPPQQPP-PPQPEASGSWGGPPPPPPGNVRPSNSSW :. :.. .. .: :. ....: ..: : . :::: ::.. .: ...: XP_016 PSQGWGDPPKSNQSLGWG---DSSKPVSSPDWNKQQDIVGSWG----IPPATGKPPGTGW 670 680 690 700 710 860 870 880 890 900 910 pF1KSD SSGPQPATPKDEEPSGWEEPSPQSISRKMDIDDGTSAWGDPNSYNYKNVNLWDKNSQGG- .:: :: :.:::.:::::::.:: :::.:::::::::::..:::::::.:.:: .: XP_016 LGGPIPAPAKEEEPTGWEEPSPESIRRKMEIDDGTSAWGDPSKYNYKNVNMWNKNVPNGN 720 730 740 750 760 770 920 pF1KSD --------------PAPR-----------------EPNLPT------------------- :: ::. :. XP_016 SRSDQQAQVHQLLTPASAISNKEASSGSGWGEPWGEPSTPATTVDNGTSAWGKPIDSGPS 780 790 800 810 820 830 930 940 950 960 pF1KSD ---PMTSKSASDS----------------KSMQDGWGESDGPVTGARHPSWEEEEDG--G :... :.... ::::::: .: :. : : .:::::: : XP_016 WGEPIAAASSTSTWGSSSVGPQALSKSGPKSMQDGWCGDDMPLPGNRPTGWEEEEDVEIG 840 850 860 870 880 890 970 980 990 1000 1010 1020 pF1KSD VWNTTGSQGSASSHNSASWGQGGKKQM-KCSLKGGNN--DSWMNPLAKQFSNMGLL--SQ .::...:: :: : : ::. : .::::. ..:.::..:::::... : XP_016 MWNSNSSQELNSSLN---WPPYTKKMSSKGMMKGGNKQEEAWINPFVKQFSNISFSRDSP 900 910 920 930 940 950 1030 1040 1050 1060 1070 1080 pF1KSD TEDNPSSKMDLSVGSLSDKKFDVDKRAMNLGDFNDIMRKDRSGFRPPNSKDMGTTDSGPY :. :.::::: : :.::....::...:.::.: . : : :: ::. .. . .:: XP_016 EENVQSNKMDLSGGMLQDKRMEIDKHSLNIGDYNRTVGKG-PGSRPQISKE-SSMERNPY 960 970 980 990 1000 1010 1090 pF1KSD FEK-------------------------------------------------GGSHGLFG :.: .:. ..:: XP_016 FDKDGIVADESQNMQFMSSQSMKLPPSNSALPNQALGSIAGLGMQNLNSVRQNGNPSMFG 1020 1030 1040 1050 1060 1070 1100 1110 1120 1130 1140 pF1KSD --NSTAQSRGLHTP-VQPLNSS-PSLRAQVPPQFISPQVSASMLKQFPNSGLSPGLFNVG :..:: ::.. : .:::.:: :.::::::: ..:::: .:.:: ::.: :: . XP_016 VGNTAAQPRGMQQPPAQPLSSSQPNLRAQVPPPLLSPQVPVSLLKYAPNNG---GL---N 1080 1090 1100 1110 1120 1150 1160 1170 1180 1190 1200 pF1KSD PQLSPQQIAMLSQLPQIPQFQLACQL--LLQQQQQQQLLQNQRKISQAVRQQQEQQLARM : ..:::.:::.:: :. :.. :: :: :::. :.::.. .. : ::.:: .: XP_016 PLFGPQQVAMLNQLSQLNQLSQISQLQRLLAQQQRA---QSQRSVPSGNRPQQDQQ-GRP 1130 1140 1150 1160 1170 1180 1210 1220 1230 1240 1250 pF1KSD VSALQQQQQQQRQ-----------PGMKHSPSHPVGPKPHLDNMVPNALNVGLPDLQTKG .:. ::..::.:: : ...: : . : :::..:.. :.:: :: XP_016 LSVQQQMMQQSRQLDPNLLVKQQTPPSQQQPLHQPAMKSFLDNVMPHTT----PELQ-KG 1190 1200 1210 1220 1230 1260 1270 1280 1290 1300 pF1KSD PIP-----GYGSGFSSG-GMDYGMVGGKEAGTESRFKQWTSMMEGLPSVATQEANMHKNG : : .. :..:. .... : . :: .::...::.. ... .. . : :.: XP_016 PSPINAFSNFPIGLNSNLNVNMDMNSIKE--PQSRLRKWTTV-DSISVNTSLDQNSSKHG 1240 1250 1260 1270 1280 1290 1310 1320 1330 1340 1350 1360 pF1KSD AIVAPGKTRGGSPYNQFDIIPGDTL-GGHTGPAGDSWLPAKSPPTNKIGSKSSNASWPPE :: . : ::. .:.. ..: .. : ::.: :::: ::.: : :::: XP_016 AI-SSGFRLEESPFVPYDFMNSSTSPASPPGSIGDGWPRAKSPN----GSSSVN--WPPE 1300 1310 1320 1330 1340 1370 1380 1390 1400 1410 1420 pF1KSD FQPGVPWKGIQNIDPESDPYVTPGSVLGGTATSPIVDTDHQLLRDNTTGSNSSLNTSLPS :.:: :::: :::::.:::::::::... . . . ..:: ::: ..::.:::::.::: XP_016 FRPGEPWKGYPNIDPETDPYVTPGSVINNLSINTVREVDH--LRDRNSGSSSSLNTTLPS 1350 1360 1370 1380 1390 1400 1430 1440 1450 1460 1470 1480 pF1KSD PGAWP-YSASDNSF---TNVHSTSAKFPDYKSTWSPDPIGHNPTHLSNKMWKNHISSRNT .:: ::. . ....::::. : : :::: . . : :....:: . .: XP_016 TSAWSSIRASNYNVPLSSTAQSTSARNSDSKLTWSPGSVTN--TSLAHELWKVPLPPKNI 1410 1420 1430 1440 1450 1460 1490 1500 1510 1520 1530 1540 pF1KSD TPLPRPPPGLTNPKPS-SPWSSTAPRSVRGWGTQDSRLASASTWSDGGSVRPSYWLVLHN : :::::::. :: : :... : :::..:.: . .:.:....: : . ::::.: XP_016 TAPSRPPPGLTGQKPPLSTWDNSPLRIGGGWGNSDARYTPGSSWGESSSGRITNWLVLKN 1470 1480 1490 1500 1510 1520 1550 1560 1570 1580 1590 1600 pF1KSD LTPQIDGSTLRTICMQHGPLLTFHLNLTQGTALIRYSTKQEAAKAQTALHMCVLGNTTIL ::::::::::::.:::::::.:::::: .:.::.:::.:.:..::: .:::::::::::: XP_016 LTPQIDGSTLRTLCMQHGPLITFHLNLPHGNALVRYSSKEEVVKAQKSLHMCVLGNTTIL 1530 1540 1550 1560 1570 1580 1610 1620 1630 1640 1650 1660 pF1KSD AEFATDDEVSRFLAQAQPPTPAATPSAPAAGWQSLETGQNQSDPVGPALNLFGGSTGLGQ ::::...:.:::.::.: :: .: ::::: ..:.. . . . :.. : :.. XP_016 AEFASEEEISRFFAQSQSLTP--SP-----GWQSLGSSQSRLGSLDCSHS-FSSRTDLNH 1590 1600 1610 1620 1630 1670 1680 1690 1700 1710 pF1KSD WSSSA-GGSSGADLAGASLWGPPNYSSSLWGVPTVEDPHRMGSPAPL---LPGDLLGGGS :.... .:.. .:: :.:::: :.::.:::: :. ::. ..::.:. : : ::::. XP_016 WNGAGLSGTNCGDLHGTSLWGTPHYSTSLWGPPSSSDPRGISSPSPINAFLSVDHLGGGG 1640 1650 1660 1670 1680 1690 1720 pF1KSD DSI .:. XP_016 ESM >>XP_016878633 (OMIM: 610739) PREDICTED: trinucleotide r (1960 aa) initn: 1934 init1: 568 opt: 2024 Z-score: 961.1 bits: 191.1 E(85289): 8.5e-47 Smith-Waterman score: 3248; 37.0% identity (61.1% similar) in 1827 aa overlap (160-1722:212-1960) 130 140 150 160 170 180 pF1KSD PGANPNNAQVTGALLQSESGTAPDSTLGGAAASNYANSTWGSGASSNNGTSPNPIHIWDK ..:.: :: : .::.. .: : . XP_016 SESSALTNQQPQNNGEVQNSKNQSDINHSTSGSHYENSQRGP-VSSTSDSSTN---CKNA 190 200 210 220 230 190 200 210 220 230 pF1KSD VIVDGSDMEEWPCIASKDTESSSENTTDNNSASNPGSEKSTL---PGSTTSNK------- :. : :. : :: ..: : .:: : .:::. ::.. :.: ..: XP_016 VVSDLSEKEAWPSAPGSDPELASE-CMDADSASSSESERNITIMASGNTGGEKDGLRNST 240 250 260 270 280 290 240 250 260 270 280 pF1KSD GKGSQCQ------SASSGNECNLGVWKSDPKAK------SVQSSNSTTEN-NNGLGNWRN : ::: . : . :. . : : . : ::.. .: .:. :: .. : . XP_016 GLGSQNKFVVGSSSNNVGHGSSTGPWGFSHGAIISTCQVSVDAPESKSESSNNRMNAWGT 300 310 320 330 340 350 290 300 310 320 330 340 pF1KSD VSGQDRIGPGSGFSNFNPNSNPSAWPALVQEGTSRKGALETDNSNSSAQVSTVGQTSREQ ::... . : . :..: :: .:::.: ..: . :: . . .:. . : ::.:: .: XP_016 VSSSS--NGGLNPSTLNSASNHGAWPVLENNGLALKGPVGSGSSGINIQCSTIGQMPNNQ 360 370 380 390 400 410 350 360 370 380 pF1KSD Q--SKM------------------ENAGVNFV-VSGREQAQIHNTDGPKNGNTNSLNLSS . ::. : .:.. : ::. : . ::.: .:: .. : XP_016 SINSKVSGGSTHGTWGSLQETCESEVSGTQKVSFSGQPQNITTEMTGPNN-TTNFMTSSL 420 430 440 450 460 470 390 400 410 420 pF1KSD PNP--MENKGMPFGMGLGNTSRST------DAPSQ---------STGDRKTGSVGSWGAA :: ..:. .: . . : :: .::: :.:. :.: ::.:.. XP_016 PNSGSVQNNELP-SSNTGAWRVSTMNHPQMQAPSGMNGTSLSHLSNGESKSG--GSYGTT 480 490 500 510 520 530 430 440 450 460 470 480 pF1KSD RGPSGTDTVSGQSNSGNNGN-NGKEREDSWKGASVQKST-GSKNDSWDNNNRSTGGSWNF : :.. ::.. :: ::. :: :. ... .: .. : . ... :. . :: :. XP_016 WGAYGSN-YSGDKCSGPNGQANG----DTVNATLMQPGVNGPMGTNFQVNTNKGGGVWES 540 550 560 570 580 490 500 510 520 530 540 pF1KSD GPQDSNDNKWGEGNKMTSGVSQGEWKQP---TGSDELKIGEWSG-PNQPNSSTGAWDNQK : .:....:: :: .:: :. : : ::.. : ::. :.. .:. .: : : XP_016 GAANSQSTSWGSGNGANSGGSRRGWGTPAQNTGTN-LPSVEWNKLPSNQHSNDSANGNGK 590 600 610 620 630 640 550 560 570 580 590 pF1KSD GHP------LPENQGNA------QAPCWGRSSSSTGSEVGGQSTGSNHKAGSSDSHNSGR :.::.: :. :....... :. . .::: .. :...:.. : XP_016 TFTNGWKSTEEEDQGSATSQTNEQSSVWAKTGGTVESDGSTESTGRLEEKGTGESQSRDR 650 660 670 680 690 700 600 610 620 630 640 650 pF1KSD RSYRPTHPDCQAVLQTLLSRTDLDPRVLSNTGWGQTQIKQDTVWDIEEVPRPEGKSDKGT :. : ...::....:::::::::::.::::: :::.:.:: : :: : :.:.:: XP_016 RKI-----DQHTLLQSIVNRTDLDPRVLSNSGWGQTPIKQNTAWDTETSPRGERKTDNGT 710 720 730 740 750 660 670 680 690 700 pF1KSD EGWESAATQTKNSGGWGD--APSQSNQMK-SGWGELSASTEWKDPKNT---GGWNDYKNN :.: :.:::: :::. : .:. .. . ::::. . . .: : :.. :::.: . XP_016 EAWGSSATQTFNSGACIDKTSPNGNDTSSVSGWGDPKPALRWGDSKGSNCQGGWEDDSAA 760 770 780 790 800 810 710 720 730 740 750 pF1KSD N----SSNWGGGRPDEKTPSSWNENPSKDQGWGGGRQPNQGWS-SGKNGWGEEVDQTKNS . :..::. . .:: ..::.. .. :::: :.. .:::: :....::: ..:. XP_016 TGMVKSNQWGNCK-EEK--AAWNDSQKNKQGWGDGQKSSQGWSVSASDNWGET---SRNN 820 830 840 850 860 870 760 770 780 790 800 pF1KSD NWE----------SSASKPVSGWGEGGQNEIGTWGNGGNASLASKGGW-EDCKRSPA--W .: :.... ::::.: :.. ::::. : . .: :: :. : .:. : XP_016 HWGEANKKSSSGGSDSDRSVSGWNELGKTSSFTWGNNINPNNSS--GWDESSKPTPSQGW 880 890 900 910 920 930 810 820 830 840 850 860 pF1KSD NETGRQPNS--WNKQHQQQQPPQQPPPPQPEASGSWGGPPPPPPGNVRPSNSSWSSGPQP .. .. .: :. . . . :. : . :::: :: : .: ...: .:: : XP_016 GDPPKSNQSLGWGDSSKPVSSPDWN--KQQDIVGSWG--IPPATG--KPPGTGWLGGPIP 940 950 960 970 980 870 880 890 900 910 pF1KSD ATPKDEEPSGWEEPSPQSISRKMDIDDGTSAWGDPNSYNYKNVNLWDKNSQGG------- : :.:::.:::::::.:: :::.:::::::::::..:::::::.:.:: .: XP_016 APAKEEEPTGWEEPSPESIRRKMEIDDGTSAWGDPSKYNYKNVNMWNKNVPNGNSRSDQQ 990 1000 1010 1020 1030 1040 920 930 pF1KSD --------PAPR-----------------EPNLPT----------------------PMT :: ::. :. :.. XP_016 AQVHQLLTPASAISNKEASSGSGWGEPWGEPSTPATTVDNGTSAWGKPIDSGPSWGEPIA 1050 1060 1070 1080 1090 1100 940 950 960 970 pF1KSD SKSASDS----------------KSMQDGWGESDGPVTGARHPSWEEEEDG--GVWNTTG . :.... ::::::: .: :. : : .:::::: :.::... XP_016 AASSTSTWGSSSVGPQALSKSGPKSMQDGWCGDDMPLPGNRPTGWEEEEDVEIGMWNSNS 1110 1120 1130 1140 1150 1160 980 990 1000 1010 1020 pF1KSD SQGSASSHNSASWGQGGKKQM-KCSLKGGNN--DSWMNPLAKQFSNMGLL--SQTEDNPS :: :: : : ::. : .::::. ..:.::..:::::... : :. : XP_016 SQELNSSLN---WPPYTKKMSSKGMMKGGNKQEEAWINPFVKQFSNISFSRDSPEENVQS 1170 1180 1190 1200 1210 1220 1030 1040 1050 1060 1070 1080 pF1KSD SKMDLSVGSLSDKKFDVDKRAMNLGDFNDIMRKDRSGFRPPNSKDMGTTDSGPYFEK--- .::::: : :.::....::...:.::.: . : : :: ::. .. . .:::.: XP_016 NKMDLSGGMLQDKRMEIDKHSLNIGDYNRTVGKG-PGSRPQISKE-SSMERNPYFDKDGI 1230 1240 1250 1260 1270 1280 1090 pF1KSD ----------------------------------------------GGSHGLFG--NSTA .:. ..:: :..: XP_016 VADESQNMQFMSSQSMKLPPSNSALPNQALGSIAGLGMQNLNSVRQNGNPSMFGVGNTAA 1290 1300 1310 1320 1330 1340 1100 1110 1120 1130 1140 1150 pF1KSD QSRGLHTP-VQPLNSS-PSLRAQVPPQFISPQVSASMLKQFPNSGLSPGLFNVGPQLSPQ : ::.. : .:::.:: :.::::::: ..:::: .:.:: ::.: :: .: ..:: XP_016 QPRGMQQPPAQPLSSSQPNLRAQVPPPLLSPQVPVSLLKYAPNNG---GL---NPLFGPQ 1350 1360 1370 1380 1390 1160 1170 1180 1190 1200 1210 pF1KSD QIAMLSQLPQIPQFQLACQL--LLQQQQQQQLLQNQRKISQAVRQQQEQQLARMVSALQQ :.:::.:: :. :.. :: :: :::. : .::.. .. : ::.:: .: .:. :: XP_016 QVAMLNQLSQLNQLSQISQLQRLLAQQQRAQ---SQRSVPSGNRPQQDQQ-GRPLSVQQQ 1400 1410 1420 1430 1440 1450 1220 1230 1240 1250 pF1KSD QQQQQRQ-----------PGMKHSPSHPVGPKPHLDNMVPNALNVGLPDLQTKGPIP--- ..::.:: : ...: : . : :::..:.. :.:: ::: : XP_016 MMQQSRQLDPNLLVKQQTPPSQQQPLHQPAMKSFLDNVMPHTT----PELQ-KGPSPINA 1460 1470 1480 1490 1500 1260 1270 1280 1290 1300 1310 pF1KSD --GYGSGFSSG-GMDYGMVGGKEAGTESRFKQWTSMMEGLPSVATQEANMHKNGAIVAPG .. :..:. .... : . :: .::...::.. ... .. . : :.::: . : XP_016 FSNFPIGLNSNLNVNMDMNSIKE--PQSRLRKWTTV-DSISVNTSLDQNSSKHGAI-SSG 1510 1520 1530 1540 1550 1560 1320 1330 1340 1350 1360 1370 pF1KSD KTRGGSPYNQFDIIPGDTL-GGHTGPAGDSWLPAKSPPTNKIGSKSSNASWPPEFQPGVP ::. .:.. ..: .. : ::.: :::: ::.: : :::::.:: : XP_016 FRLEESPFVPYDFMNSSTSPASPPGSIGDGWPRAKSPN----GSSSVN--WPPEFRPGEP 1570 1580 1590 1600 1610 1380 1390 1400 1410 1420 1430 pF1KSD WKGIQNIDPESDPYVTPGSVLGGTATSPIVDTDHQLLRDNTTGSNSSLNTSLPSPGAWP- ::: :::::.:::::::::... . . . ..:: ::: ..::.:::::.::: .:: XP_016 WKGYPNIDPETDPYVTPGSVINNLSINTVREVDH--LRDRNSGSSSSLNTTLPSTSAWSS 1620 1630 1640 1650 1660 1670 1440 1450 1460 1470 1480 1490 pF1KSD YSASDNSF---TNVHSTSAKFPDYKSTWSPDPIGHNPTHLSNKMWKNHISSRNTTPLPRP ::. . ....::::. : : :::: . . : :....:: . .: : :: XP_016 IRASNYNVPLSSTAQSTSARNSDSKLTWSPGSVTN--TSLAHELWKVPLPPKNITAPSRP 1680 1690 1700 1710 1720 1730 1500 1510 1520 1530 1540 pF1KSD PPGLTNPKPS-SPWSSTAPRSVRGWGTQDSRLASASTWSDGGSVRPSYWLVLHNLTPQID :::::. :: : :... : :::..:.: . .:.:....: : . ::::.::::::: XP_016 PPGLTGQKPPLSTWDNSPLRIGGGWGNSDARYTPGSSWGESSSGRITNWLVLKNLTPQID 1740 1750 1760 1770 1780 1790 1550 1560 1570 1580 1590 1600 pF1KSD GSTLRTICMQHGPLLTFHLNLTQGTALIRYSTKQEAAKAQTALHMCVLGNTTILAEFATD ::::::.:::::::.:::::: .:.::.:::.:.:..::: .::::::::::::::::.. XP_016 GSTLRTLCMQHGPLITFHLNLPHGNALVRYSSKEEVVKAQKSLHMCVLGNTTILAEFASE 1800 1810 1820 1830 1840 1850 1610 1620 1630 1640 1650 1660 pF1KSD DEVSRFLAQAQPPTPAATPSAPAAGWQSLETGQNQSDPVGPALNLFGGSTGLGQWSSSA- .:.:::.::.: :: .: ::::: ..:.. . . . :.. : :..:.... XP_016 EEISRFFAQSQSLTP--SP-----GWQSLGSSQSRLGSLDCS-HSFSSRTDLNHWNGAGL 1860 1870 1880 1890 1900 1670 1680 1690 1700 1710 1720 pF1KSD GGSSGADLAGASLWGPPNYSSSLWGVPTVEDPHRMGSPAPL---LPGDLLGGGSDSI .:.. .:: :.:::: :.::.:::: :. ::. ..::.:. : : ::::..:. XP_016 SGTNCGDLHGTSLWGTPHYSTSLWGPPSSSDPRGISSPSPINAFLSVDHLGGGGESM 1910 1920 1930 1940 1950 1960 >>XP_016878637 (OMIM: 610739) PREDICTED: trinucleotide r (1912 aa) initn: 1933 init1: 568 opt: 2020 Z-score: 959.4 bits: 190.7 E(85289): 1.1e-46 Smith-Waterman score: 3350; 37.7% identity (63.0% similar) in 1796 aa overlap (138-1722:193-1912) 110 120 130 140 150 160 pF1KSD GQPPPPSCMLLGGGAGPPPCTAPGANPNNAQVTGALLQSESGTAPDSTLGGAAASNYANS : .: . .:.. . . . .: :.: :: XP_016 HFPVIAANLGSAVKVLNSQSESSALTNQQPQNNGEVQNSKNQSDINHSTSG---SHYENS 170 180 190 200 210 170 180 190 200 210 220 pF1KSD TWGSGASSNNGTSPNPIHIWDKVIVDGSDMEEWPCIASKDTESSSENTTDNNSASNPGSE : .::.. .: : . :. : :. : :: ..: : .:: : .:::. :: XP_016 QRGP-VSSTSDSSTN---CKNAVVSDLSEKEAWPSAPGSDPELASE-CMDADSASSSESE 220 230 240 250 260 270 230 240 250 260 pF1KSD KSTL---PGSTTSNK-------GKGSQCQ------SASSGNECNLGVWKSDPKAK----- .. :.: ..: : ::: . : . :. . : : . : XP_016 RNITIMASGNTGGEKDGLRNSTGLGSQNKFVVGSSSNNVGHGSSTGPWGFSHGAIISTCQ 280 290 300 310 320 330 270 280 290 300 310 320 pF1KSD -SVQSSNSTTEN-NNGLGNWRNVSGQDRIGPGSGFSNFNPNSNPSAWPALVQEGTSRKGA ::.. .: .:. :: .. : .::... . : . :..: :: .:::.: ..: . :: XP_016 VSVDAPESKSESSNNRMNAWGTVSSSS--NGGLNPSTLNSASNHGAWPVLENNGLALKGP 340 350 360 370 380 390 330 340 350 360 pF1KSD LETDNSNSSAQVSTVGQTSREQQ--SKM------------------ENAGVNFV-VSGRE . . .:. . : ::.:: .:. ::. : .:.. : ::. XP_016 VGSGSSGINIQCSTIGQMPNNQSINSKVSGGSTHGTWGSLQETCESEVSGTQKVSFSGQP 400 410 420 430 440 450 370 380 390 400 410 pF1KSD QAQIHNTDGPKNGNTNSLNLSSPNP--MENKGMPFGMGLGNTSRST------DAPSQ--- : . :: :..:: .. : :: ..:. .: . . : :: .::: XP_016 QNITTEMTGP-NNTTNFMTSSLPNSGSVQNNELP-SSNTGAWRVSTMNHPQMQAPSGMNG 460 470 480 490 500 510 420 430 440 450 460 pF1KSD ------STGDRKTGSVGSWGAARGPSGTDTVSGQSNSGNNGN-NGKEREDSWKGASVQKS :.:. :.: ::.:.. : :.. ::.. :: ::. :: :. ... .: . XP_016 TSLSHLSNGESKSG--GSYGTTWGAYGSN-YSGDKCSGPNGQANG----DTVNATLMQPG 520 530 540 550 560 470 480 490 500 510 520 pF1KSD T-GSKNDSWDNNNRSTGGSWNFGPQDSNDNKWGEGNKMTSGVSQGEWKQP---TGSDELK . : . ... :. . :: :. : .:....:: :: .:: :. : : ::.. : XP_016 VNGPMGTNFQVNTNKGGGVWESGAANSQSTSWGSGNGANSGGSRRGWGTPAQNTGTN-LP 570 580 590 600 610 620 530 540 550 560 pF1KSD IGEWSG-PNQPNSSTGAWDNQKGHP------LPENQGNA------QAPCWGRSSSSTGSE ::. :.. .:. .: : : :.::.: :. :....... :. XP_016 SVEWNKLPSNQHSNDSANGNGKTFTNGWKSTEEEDQGSATSQTNEQSSVWAKTGGTVESD 630 640 650 660 670 680 570 580 590 600 610 620 pF1KSD VGGQSTGSNHKAGSSDSHNSGRRSYRPTHPDCQAVLQTLLSRTDLDPRVLSNTGWGQTQI . .::: .. :...:.. ::. : ...::....:::::::::::.::::: : XP_016 GSTESTGRLEEKGTGESQSRDRRKI-----DQHTLLQSIVNRTDLDPRVLSNSGWGQTPI 690 700 710 720 730 630 640 650 660 670 680 pF1KSD KQDTVWDIEEVPRPEGKSDKGTEGWESAATQTKNSGGWGD--APSQSNQMK-SGWGELSA ::.:.:: : :: : :.:.:::.: :.:::: :::. : .:. .. . ::::. . XP_016 KQNTAWDTETSPRGERKTDNGTEAWGSSATQTFNSGACIDKTSPNGNDTSSVSGWGDPKP 740 750 760 770 780 790 690 700 710 720 730 pF1KSD STEWKDPKNT---GGWNDYKNNN----SSNWGGGRPDEKTPSSWNENPSKDQGWGGGRQP . .: : :.. :::.: . . :..::. . .:: ..::.. .. :::: :.. XP_016 ALRWGDSKGSNCQGGWEDDSAATGMVKSNQWGNCK-EEK--AAWNDSQKNKQGWGDGQKS 800 810 820 830 840 850 740 750 760 770 780 pF1KSD NQGWS-SGKNGWGE--------EVDQTKNSNWESSASKPVSGWGEGGQNEIGTWGNGGNA .:::: :....::: :... :.:. :.... ::::.: :.. ::::. : XP_016 SQGWSVSASDNWGETSRNNHWGEANK-KSSSGGSDSDRSVSGWNELGKTSSFTWGNNINP 860 870 880 890 900 910 790 800 810 820 830 840 pF1KSD SLASKGGW-EDCKRSPA--WNETGRQPNS--WNKQHQQQQPPQQPPPPQPEASGSWGGPP . .: :: :. : .:. :.. .. .: :. . . . :. : . :::: XP_016 NNSS--GWDESSKPTPSQGWGDPPKSNQSLGWGDSSKPVSSPDWNK--QQDIVGSWG--- 920 930 940 950 960 850 860 870 880 890 900 pF1KSD PPPPGNVRPSNSSWSSGPQPATPKDEEPSGWEEPSPQSISRKMDIDDGTSAWGDPNSYNY ::.. .: ...: .:: :: :.:::.:::::::.:: :::.:::::::::::..::: XP_016 -IPPATGKPPGTGWLGGPIPAPAKEEEPTGWEEPSPESIRRKMEIDDGTSAWGDPSKYNY 970 980 990 1000 1010 1020 910 920 930 940 950 pF1KSD KNVNLWDKNSQGGPAPREPN-----LPTPMTS------KSASDSKSMQDGWGESDGPVTG ::::.:.:: .: . . . : :: .. .:.: ::::::: .: :. : XP_016 KNVNMWNKNVPNGNSRSDQQAQVHQLLTPASAISNKEASSGSGPKSMQDGWCGDDMPLPG 1030 1040 1050 1060 1070 1080 960 970 980 990 1000 pF1KSD ARHPSWEEEEDG--GVWNTTGSQGSASSHN-------SASWGQGGKKQMKCS--LKGGNN : .:::::: :.::...:: :: : .: : .:::. . .::::. XP_016 NRPTGWEEEEDVEIGMWNSNSSQELNSSLNWPPYTKKMSSKGLSGKKRRRERGMMKGGNK 1090 1100 1110 1120 1130 1140 1010 1020 1030 1040 1050 pF1KSD --DSWMNPLAKQFSNMGLL--SQTEDNPSSKMDLSVGSLSDKKFDVDKRAMNLGDFNDIM ..:.::..:::::... : :. :.::::: : :.::....::...:.::.: . XP_016 QEEAWINPFVKQFSNISFSRDSPEENVQSNKMDLSGGMLQDKRMEIDKHSLNIGDYNRTV 1150 1160 1170 1180 1190 1200 1060 1070 1080 pF1KSD RKDRSGFRPPNSKDMGTTDSGPYFEK---------------------------------- : : :: ::. .. . .:::.: XP_016 GKG-PGSRPQISKE-SSMERNPYFDKDGIVADESQNMQFMSSQSMKLPPSNSALPNQALG 1210 1220 1230 1240 1250 1260 1090 1100 1110 1120 pF1KSD ---------------GGSHGLFG--NSTAQSRGLHTP-VQPLNSS-PSLRAQVPPQFISP .:. ..:: :..:: ::.. : .:::.:: :.::::::: ..:: XP_016 SIAGLGMQNLNSVRQNGNPSMFGVGNTAAQPRGMQQPPAQPLSSSQPNLRAQVPPPLLSP 1270 1280 1290 1300 1310 1320 1130 1140 1150 1160 1170 1180 pF1KSD QVSASMLKQFPNSGLSPGLFNVGPQLSPQQIAMLSQLPQIPQFQLACQL--LLQQQQQQQ :: .:.:: ::.: :: .: ..:::.:::.:: :. :.. :: :: :::. XP_016 QVPVSLLKYAPNNG---GL---NPLFGPQQVAMLNQLSQLNQLSQISQLQRLLAQQQRA- 1330 1340 1350 1360 1370 1190 1200 1210 1220 1230 pF1KSD LLQNQRKISQAVRQQQEQQLARMVSALQQQQQQQRQ-----------PGMKHSPSHPVGP :.::.. .. : ::.:: .: .:. ::..::.:: : ...: : . XP_016 --QSQRSVPSGNRPQQDQQ-GRPLSVQQQMMQQSRQLDPNLLVKQQTPPSQQQPLHQPAM 1380 1390 1400 1410 1420 1430 1240 1250 1260 1270 1280 pF1KSD KPHLDNMVPNALNVGLPDLQTKGPIP-----GYGSGFSSG-GMDYGMVGGKEAGTESRFK : :::..:.. :.:: ::: : .. :..:. .... : . :: .::.. XP_016 KSFLDNVMPHTT----PELQ-KGPSPINAFSNFPIGLNSNLNVNMDMNSIKEP--QSRLR 1440 1450 1460 1470 1480 1290 1300 1310 1320 1330 1340 pF1KSD QWTSMMEGLPSVATQEANMHKNGAIVAPGKTRGGSPYNQFDIIPGDTL-GGHTGPAGDSW .::.. ... .. . : :.::: . : ::. .:.. ..: .. : ::.: XP_016 KWTTV-DSISVNTSLDQNSSKHGAI-SSGFRLEESPFVPYDFMNSSTSPASPPGSIGDGW 1490 1500 1510 1520 1530 1540 1350 1360 1370 1380 1390 1400 pF1KSD LPAKSPPTNKIGSKSSNASWPPEFQPGVPWKGIQNIDPESDPYVTPGSVLGGTATSPIVD :::: . ::...:::::.:: :::: :::::.:::::::::... . . . . XP_016 PRAKSP------NGSSSVNWPPEFRPGEPWKGYPNIDPETDPYVTPGSVINNLSINTVRE 1550 1560 1570 1580 1590 1410 1420 1430 1440 1450 1460 pF1KSD TDHQLLRDNTTGSNSSLNTSLPSPGAWP-YSASDNSF---TNVHSTSAKFPDYKSTWSPD .:: ::: ..::.:::::.::: .:: ::. . ....::::. : : :::: XP_016 VDH--LRDRNSGSSSSLNTTLPSTSAWSSIRASNYNVPLSSTAQSTSARNSDSKLTWSPG 1600 1610 1620 1630 1640 1650 1470 1480 1490 1500 1510 1520 pF1KSD PIGHNPTHLSNKMWKNHISSRNTTPLPRPPPGLTNPKPS-SPWSSTAPRSVRGWGTQDSR . . : :....:: . .: : :::::::. :: : :... : :::..:.: XP_016 SVTN--TSLAHELWKVPLPPKNITAPSRPPPGLTGQKPPLSTWDNSPLRIGGGWGNSDAR 1660 1670 1680 1690 1700 1710 1530 1540 1550 1560 1570 1580 pF1KSD LASASTWSDGGSVRPSYWLVLHNLTPQIDGSTLRTICMQHGPLLTFHLNLTQGTALIRYS . .:.:....: : . ::::.:::::::::::::.:::::::.:::::: .:.::.::: XP_016 YTPGSSWGESSSGRITNWLVLKNLTPQIDGSTLRTLCMQHGPLITFHLNLPHGNALVRYS 1720 1730 1740 1750 1760 1770 1590 1600 1610 1620 1630 1640 pF1KSD TKQEAAKAQTALHMCVLGNTTILAEFATDDEVSRFLAQAQPPTPAATPSAPAAGWQSLET .:.:..::: .::::::::::::::::...:.:::.::.: :: .: ::::: . XP_016 SKEEVVKAQKSLHMCVLGNTTILAEFASEEEISRFFAQSQSLTP--SP-----GWQSLGS 1780 1790 1800 1810 1820 1650 1660 1670 1680 1690 pF1KSD GQNQSDPVGPALNLFGGSTGLGQWSSSA-GGSSGADLAGASLWGPPNYSSSLWGVPTVED .:.. . . . :.. : :..:.... .:.. .:: :.:::: :.::.:::: :. : XP_016 SQSRLGSLDCSHS-FSSRTDLNHWNGAGLSGTNCGDLHGTSLWGTPHYSTSLWGPPSSSD 1830 1840 1850 1860 1870 1880 1700 1710 1720 pF1KSD PHRMGSPAPL---LPGDLLGGGSDSI :. ..::.:. : : ::::..:. XP_016 PRGISSPSPINAFLSVDHLGGGGESM 1890 1900 1910 1722 residues in 1 query sequences 60827320 residues in 85289 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 04:58:55 2016 done: Thu Nov 3 04:58:58 2016 Total Scan time: 22.010 Total Display time: 0.760 Function used was FASTA [36.3.4 Apr, 2011]