FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4271, 1137 aa 1>>>pF1KE4271 1137 - 1137 aa - 1137 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.6200+/-0.00107; mu= 9.2120+/- 0.066 mean_var=177.9129+/-35.929, 0's: 0 Z-trim(109.8): 10 B-trim: 6 in 1/52 Lambda= 0.096155 statistics sampled from 11152 (11162) to 11152 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.65), E-opt: 0.2 (0.343), width: 16 Scan time: 4.630 The best scores are: opt bits E(32554) CCDS34195.1 MSH3 gene_id:4437|Hs108|chr5 (1137) 7323 1028.8 0 CCDS58709.1 MSH2 gene_id:4436|Hs108|chr2 ( 868) 778 120.8 1.3e-26 CCDS1834.1 MSH2 gene_id:4436|Hs108|chr2 ( 934) 778 120.9 1.4e-26 CCDS670.1 MSH4 gene_id:4438|Hs108|chr1 ( 936) 611 97.7 1.3e-19 CCDS62907.1 MSH6 gene_id:2956|Hs108|chr2 (1058) 599 96.1 4.7e-19 CCDS62906.1 MSH6 gene_id:2956|Hs108|chr2 (1230) 599 96.1 5.4e-19 CCDS1836.1 MSH6 gene_id:2956|Hs108|chr2 (1360) 599 96.1 5.8e-19 CCDS4720.1 MSH5 gene_id:4439|Hs108|chr6 ( 834) 587 94.3 1.2e-18 CCDS34409.2 MSH5 gene_id:4439|Hs108|chr6 ( 822) 575 92.7 3.9e-18 CCDS34410.1 MSH5 gene_id:4439|Hs108|chr6 ( 835) 575 92.7 3.9e-18 >>CCDS34195.1 MSH3 gene_id:4437|Hs108|chr5 (1137 aa) initn: 7323 init1: 7323 opt: 7323 Z-score: 5496.1 bits: 1028.8 E(32554): 0 Smith-Waterman score: 7323; 99.7% identity (100.0% similar) in 1137 aa overlap (1-1137:1-1137) 10 20 30 40 50 60 pF1KE4 MSRRKPASGGLAASSSAPARQAVLSRFFQSTGSLKSTSSSTGAADQVDPGAAAAAAAAAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 MSRRKPASGGLAASSSAPARQAVLSRFFQSTGSLKSTSSSTGAADQVDPGAAAAAAAAAA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 AAPPAPPAPAFPPQLPPHVATEIDRRKKRPLENDGPVKKKVKKVQQKEGGSDLGMSGNSE ::::::::::::::::::.::::::::::::::::::::::::::::::::::::::::: CCDS34 AAPPAPPAPAFPPQLPPHIATEIDRRKKRPLENDGPVKKKVKKVQQKEGGSDLGMSGNSE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 PKKCLRTRNVSKSLEKLKEFCCDSALPQSRVQTESLQERFAVLPKCTDFDDISLLHAKNA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 PKKCLRTRNVSKSLEKLKEFCCDSALPQSRVQTESLQERFAVLPKCTDFDDISLLHAKNA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 VSSEDSKRQINQKDTTLFDLSQFGSSNTSHENLQKTASKSANKRSKSIYTPLELQYIEMK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 VSSEDSKRQINQKDTTLFDLSQFGSSNTSHENLQKTASKSANKRSKSIYTPLELQYIEMK 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 QQHKDAVLCVECGYKYRFFGEDAEIAARELNIYCHLDHNFMTASIPTHRLFVHVRRLVAK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 QQHKDAVLCVECGYKYRFFGEDAEIAARELNIYCHLDHNFMTASIPTHRLFVHVRRLVAK 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 GYKVGVVKQTETAALKAIGDNRSSLFSRKLTALYTKSTLIGEDVNPLIKLDDAVNVDEIM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 GYKVGVVKQTETAALKAIGDNRSSLFSRKLTALYTKSTLIGEDVNPLIKLDDAVNVDEIM 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 TDTSTSYLLCISENKENVRDKKKGNIFIGIVGVQPATGEVVFDSFQDSASRSELETRMSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 TDTSTSYLLCISENKENVRDKKKGNIFIGIVGVQPATGEVVFDSFQDSASRSELETRMSS 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 LQPVELLLPSALSEQTEALIHRATSVSVQDDRIRVERMDNIYFEYSHAFQAVTEFYAKDT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 LQPVELLLPSALSEQTEALIHRATSVSVQDDRIRVERMDNIYFEYSHAFQAVTEFYAKDT 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE4 VDIKGSQIISGIVNLEKPVICSLAAIIKYLKEFNLEKMLSKPENFKQLSSKMEFMTINGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 VDIKGSQIISGIVNLEKPVICSLAAIIKYLKEFNLEKMLSKPENFKQLSSKMEFMTINGT 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE4 TLRNLEILQNQTDMKTKGSLLWVLDHTKTSFGRRKLKKWVTQPLLKLREINARLDAVSEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 TLRNLEILQNQTDMKTKGSLLWVLDHTKTSFGRRKLKKWVTQPLLKLREINARLDAVSEV 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE4 LHSESSVFGQIENHLRKLPDIERGLCSIYHKKCSTQEFFLIVKTLYHLKSEFQAIIPAVN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 LHSESSVFGQIENHLRKLPDIERGLCSIYHKKCSTQEFFLIVKTLYHLKSEFQAIIPAVN 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE4 SHIQSDLLRTVILEIPELLSPVEHYLKILNEQAAKVGDKTELFKDLSDFPLIKKRKDEIQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 SHIQSDLLRTVILEIPELLSPVEHYLKILNEQAAKVGDKTELFKDLSDFPLIKKRKDEIQ 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE4 GVIDEIRMHLQEIRKILKNPSAQYVTVSGQEFMIEIKNSAVSCIPTDWVKVGSTKAVSRF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 GVIDEIRMHLQEIRKILKNPSAQYVTVSGQEFMIEIKNSAVSCIPTDWVKVGSTKAVSRF 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE4 HSPFIVENYRHLNQLREQLVLDCSAEWLDFLEKFSEHYHSLCKAVHHLATVDCIFSLAKV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 HSPFIVENYRHLNQLREQLVLDCSAEWLDFLEKFSEHYHSLCKAVHHLATVDCIFSLAKV 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE4 AKQGDYCRPTVQEERKIVIKNGRHPVIDVLLGEQDQYVPNNTDLSEDSERVMIITGPNMG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 AKQGDYCRPTVQEERKIVIKNGRHPVIDVLLGEQDQYVPNNTDLSEDSERVMIITGPNMG 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE4 GKSSYIKQVALITIMAQIGSYVPAEEATIGIVDGIFTRMGAADNIYKGRSTFMEELTDTA ::::::::::::::::::::::::::::::::::::::::::::::::.::::::::::: CCDS34 GKSSYIKQVALITIMAQIGSYVPAEEATIGIVDGIFTRMGAADNIYKGQSTFMEELTDTA 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE4 EIIRKATSQSLVILDELGRGTSTHDGIAIAYATLEYFIRDVKSLTLFVTHYPPVCELEKN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 EIIRKATSQSLVILDELGRGTSTHDGIAIAYATLEYFIRDVKSLTLFVTHYPPVCELEKN 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE4 YSHQVGNYHMGFLVSEDESKLDPGTAEQVPDFVTFLYQITRGIAARSYGLNVAKLADVPG ::::::::::::::::::::::::.::::::::::::::::::::::::::::::::::: CCDS34 YSHQVGNYHMGFLVSEDESKLDPGAAEQVPDFVTFLYQITRGIAARSYGLNVAKLADVPG 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 pF1KE4 EILKKAAHKSKELEGLINTKRKRLKYFAKLWTMHNAQDLQKWTEEFNMEETQTSLLH ::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 EILKKAAHKSKELEGLINTKRKRLKYFAKLWTMHNAQDLQKWTEEFNMEETQTSLLH 1090 1100 1110 1120 1130 >>CCDS58709.1 MSH2 gene_id:4436|Hs108|chr2 (868 aa) initn: 711 init1: 476 opt: 778 Z-score: 591.0 bits: 120.8 E(32554): 1.3e-26 Smith-Waterman score: 871; 28.0% identity (61.0% similar) in 735 aa overlap (388-1094:95-786) 360 370 380 390 400 410 pF1KE4 EIMTDTSTSYLLCISENKENVRDKKKGNIFIGIVGVQPATGEVVFDSFQDSASRSELETR .:. :. .. . : :. . :.::. CCDS58 FEDILFGNNDMSASIGVVGVKMSAVDGQRQVGVGYVDSIQRKLGLCEFPDNDQFSNLEAL 70 80 90 100 110 120 420 430 440 450 460 470 pF1KE4 MSSLQPVELLLPSALSEQTEALIHRATSVSVQDDRIRVERMDNIYFEYSHAFQAVTEFYA . .. : : .::.. .: . . . .. .: : . . . : . .: .... CCDS58 LIQIGPKECVLPGG---ETAGDMGKLRQI-IQRGGILITERKKADFSTKDIYQDLNRLLK 130 140 150 160 170 180 480 490 500 510 520 530 pF1KE4 KDTVDIKGSQIISGIV-NLEKPV-ICSLAAIIKYLKEFNLEKMLSKPENFKQLSSKM--- :: :. :... ..:. : . ::.:.::.:. .:: :: :. CCDS58 GK----KGEQMNSAVLPEMENQVAVSSLSAVIKFLE------LLSDDSNFGQFELTTFDF 190 200 210 220 230 540 550 560 570 580 590 pF1KE4 -EFMTINGTTLRNLEILQNQT-DMKTKGSLLWVLDHTKTSFGRRKLKKWVTQPLLKLREI ..: .. ...: :...:... : . :: .:.. :: :.: ...:. :::. .: CCDS58 SQYMKLDIAAVRALNLFQGSVEDTTGSQSLAALLNKCKTPQGQRLVNQWIKQPLMDKNRI 240 250 260 270 280 290 600 610 620 630 640 650 pF1KE4 NARLDAVSEVLHSESSVFGQIENHLRKLPDIERGLCSIYHKKCSTQEFFLIVKTLYHLKS . ::. : ... :. ::..::..: .. .. . :. . . . . .: . CCDS58 EERLNLVEAFVEDAELRQTLQEDLLRRFPDLNRLAKKFQRQAANLQDCYRLYQGINQLPN 300 310 320 330 340 350 660 670 680 690 700 pF1KE4 EFQAIIPAVNSHIQSDLLRTVILEIPELLSPVEHYLKILNE--QAAKVGDKTELFK---- .::. ..: :. :: . . . .: : .. .... . .: .. : : CCDS58 VIQALEKHEGKH-QKLLLAVFVTPLTDLRSDFSKFQEMIETTLDMDQVENHEFLVKPSFD 360 370 380 390 400 710 720 730 740 750 pF1KE4 -DLSDF-PLIKKRKDEIQG-VIDEIR-MHLQEIRKILKNPSAQY-----VTVSGQEFMIE .::.. ... . ..:. .:. : . :. ..: . :::. :: . .. . . CCDS58 PNLSELREIMNDLEKKMQSTLISAARDLGLDPGKQIKLDSSAQFGYYFRVTCKEEKVLRN 410 420 430 440 450 460 760 770 780 790 800 810 pF1KE4 IKNSAVSCIPTDWVKVGSTKAVSRFHSPFIVENYRHLNQLREQLVLDCSAEWLDFLEKFS :: .. : . :: ..: .: .. . ..: . .. .. .: : ... . CCDS58 NKNFSTVDIQKNGVKFTNSKLTS-LNEEY-TKNKTEYEEAQDAIV----KEIVNISSGYV 470 480 490 500 510 520 820 830 840 850 860 870 pF1KE4 EHYHSLCKAVHHLATVDCIFSLAKVAKQGD--YCRPTVQE--ERKIVIKNGRHPVIDVLL : ...: . :: .: . :.:.:.. . : ::.. : . .:..: .:: ..: CCDS58 EPMQTLNDV---LAQLDAVVSFAHVSNGAPVPYVRPAILEKGQGRIILKASRHACVEV-- 530 540 550 560 570 880 890 900 910 920 pF1KE4 GEQDQ--YVPNNTDLSEDSERVMIITGPNMGGKSSYIKQVALITIMAQIGSYVPAEEATI ::. ..::.. . .:.. :::::::::::.::.:...:..::::: .:: : : . CCDS58 --QDEIAFIPNDVYFEKDKQMFHIITGPNMGGKSTYIRQTGVIVLMAQIGCFVPCESAEV 580 590 600 610 620 630 930 940 950 960 970 980 pF1KE4 GIVDGIFTRMGAADNIYKGRSTFMEELTDTAEIIRKATSQSLVILDELGRGTSTHDGIAI .::: :..:.::.:. :: :::: :. .:: :.:.::..::.:.:::::::::.::... CCDS58 SIVDCILARVGAGDSQLKGVSTFMAEMLETASILRSATKDSLIIIDELGRGTSTYDGFGL 640 650 660 670 680 690 990 1000 1010 1020 1030 1040 pF1KE4 AYATLEYFIRDVKSLTLFVTHYPPVCELEKNYSHQVGNYHMGFLVSEDESKLDPGTAEQV :.: ::. . .. .:.::. . : : :.: :. :..:. CCDS58 AWAISEYIATKIGAFCMFATHFHELTALA-NQIPTVNNLHVTALTTEET----------- 700 710 720 730 740 1050 1060 1070 1080 1090 1100 pF1KE4 PDFVTFLYQITRGIAARSYGLNVAKLADVPGEILKKAAHKSKELEGLINTKRKRLKYFAK .:.:::. .:. .:.:..::.::. : .... : .:. ::: CCDS58 ---LTMLYQVKKGVCDQSFGIHVAELANFPKHVIECAKQKALELEEFQYIGESQGYDIME 750 760 770 780 790 800 1110 1120 1130 pF1KE4 LWTMHNAQDLQKWTEEFNMEETQTSLLH CCDS58 PAAKKCYLEREQGEKIIQEFLSKVKQMPFTEMSEENITIKLKQLKAEVIAKNNSFVNEII 810 820 830 840 850 860 >>CCDS1834.1 MSH2 gene_id:4436|Hs108|chr2 (934 aa) initn: 747 init1: 476 opt: 778 Z-score: 590.5 bits: 120.9 E(32554): 1.4e-26 Smith-Waterman score: 871; 28.0% identity (61.0% similar) in 735 aa overlap (388-1094:161-852) 360 370 380 390 400 410 pF1KE4 EIMTDTSTSYLLCISENKENVRDKKKGNIFIGIVGVQPATGEVVFDSFQDSASRSELETR .:. :. .. . : :. . :.::. CCDS18 FEDILFGNNDMSASIGVVGVKMSAVDGQRQVGVGYVDSIQRKLGLCEFPDNDQFSNLEAL 140 150 160 170 180 190 420 430 440 450 460 470 pF1KE4 MSSLQPVELLLPSALSEQTEALIHRATSVSVQDDRIRVERMDNIYFEYSHAFQAVTEFYA . .. : : .::.. .: . . . .. .: : . . . : . .: .... CCDS18 LIQIGPKECVLPGG---ETAGDMGKLRQI-IQRGGILITERKKADFSTKDIYQDLNRLLK 200 210 220 230 240 480 490 500 510 520 530 pF1KE4 KDTVDIKGSQIISGIV-NLEKPV-ICSLAAIIKYLKEFNLEKMLSKPENFKQLSSKM--- :: :. :... ..:. : . ::.:.::.:. .:: :: :. CCDS18 GK----KGEQMNSAVLPEMENQVAVSSLSAVIKFLE------LLSDDSNFGQFELTTFDF 250 260 270 280 290 540 550 560 570 580 590 pF1KE4 -EFMTINGTTLRNLEILQNQT-DMKTKGSLLWVLDHTKTSFGRRKLKKWVTQPLLKLREI ..: .. ...: :...:... : . :: .:.. :: :.: ...:. :::. .: CCDS18 SQYMKLDIAAVRALNLFQGSVEDTTGSQSLAALLNKCKTPQGQRLVNQWIKQPLMDKNRI 300 310 320 330 340 350 600 610 620 630 640 650 pF1KE4 NARLDAVSEVLHSESSVFGQIENHLRKLPDIERGLCSIYHKKCSTQEFFLIVKTLYHLKS . ::. : ... :. ::..::..: .. .. . :. . . . . .: . CCDS18 EERLNLVEAFVEDAELRQTLQEDLLRRFPDLNRLAKKFQRQAANLQDCYRLYQGINQLPN 360 370 380 390 400 410 660 670 680 690 700 pF1KE4 EFQAIIPAVNSHIQSDLLRTVILEIPELLSPVEHYLKILNE--QAAKVGDKTELFK---- .::. ..: :. :: . . . .: : .. .... . .: .. : : CCDS18 VIQALEKHEGKH-QKLLLAVFVTPLTDLRSDFSKFQEMIETTLDMDQVENHEFLVKPSFD 420 430 440 450 460 470 710 720 730 740 750 pF1KE4 -DLSDF-PLIKKRKDEIQG-VIDEIR-MHLQEIRKILKNPSAQY-----VTVSGQEFMIE .::.. ... . ..:. .:. : . :. ..: . :::. :: . .. . . CCDS18 PNLSELREIMNDLEKKMQSTLISAARDLGLDPGKQIKLDSSAQFGYYFRVTCKEEKVLRN 480 490 500 510 520 530 760 770 780 790 800 810 pF1KE4 IKNSAVSCIPTDWVKVGSTKAVSRFHSPFIVENYRHLNQLREQLVLDCSAEWLDFLEKFS :: .. : . :: ..: .: .. . ..: . .. .. .: : ... . CCDS18 NKNFSTVDIQKNGVKFTNSKLTS-LNEEY-TKNKTEYEEAQDAIV----KEIVNISSGYV 540 550 560 570 580 820 830 840 850 860 870 pF1KE4 EHYHSLCKAVHHLATVDCIFSLAKVAKQGD--YCRPTVQE--ERKIVIKNGRHPVIDVLL : ...: . :: .: . :.:.:.. . : ::.. : . .:..: .:: ..: CCDS18 EPMQTLNDV---LAQLDAVVSFAHVSNGAPVPYVRPAILEKGQGRIILKASRHACVEV-- 590 600 610 620 630 640 880 890 900 910 920 pF1KE4 GEQDQ--YVPNNTDLSEDSERVMIITGPNMGGKSSYIKQVALITIMAQIGSYVPAEEATI ::. ..::.. . .:.. :::::::::::.::.:...:..::::: .:: : : . CCDS18 --QDEIAFIPNDVYFEKDKQMFHIITGPNMGGKSTYIRQTGVIVLMAQIGCFVPCESAEV 650 660 670 680 690 700 930 940 950 960 970 980 pF1KE4 GIVDGIFTRMGAADNIYKGRSTFMEELTDTAEIIRKATSQSLVILDELGRGTSTHDGIAI .::: :..:.::.:. :: :::: :. .:: :.:.::..::.:.:::::::::.::... CCDS18 SIVDCILARVGAGDSQLKGVSTFMAEMLETASILRSATKDSLIIIDELGRGTSTYDGFGL 710 720 730 740 750 760 990 1000 1010 1020 1030 1040 pF1KE4 AYATLEYFIRDVKSLTLFVTHYPPVCELEKNYSHQVGNYHMGFLVSEDESKLDPGTAEQV :.: ::. . .. .:.::. . : : :.: :. :..:. CCDS18 AWAISEYIATKIGAFCMFATHFHELTALA-NQIPTVNNLHVTALTTEET----------- 770 780 790 800 810 1050 1060 1070 1080 1090 1100 pF1KE4 PDFVTFLYQITRGIAARSYGLNVAKLADVPGEILKKAAHKSKELEGLINTKRKRLKYFAK .:.:::. .:. .:.:..::.::. : .... : .:. ::: CCDS18 ---LTMLYQVKKGVCDQSFGIHVAELANFPKHVIECAKQKALELEEFQYIGESQGYDIME 820 830 840 850 860 1110 1120 1130 pF1KE4 LWTMHNAQDLQKWTEEFNMEETQTSLLH CCDS18 PAAKKCYLEREQGEKIIQEFLSKVKQMPFTEMSEENITIKLKQLKAEVIAKNNSFVNEII 870 880 890 900 910 920 >>CCDS670.1 MSH4 gene_id:4438|Hs108|chr1 (936 aa) initn: 619 init1: 384 opt: 611 Z-score: 465.3 bits: 97.7 E(32554): 1.3e-19 Smith-Waterman score: 869; 26.5% identity (63.9% similar) in 739 aa overlap (388-1093:171-868) 360 370 380 390 400 410 pF1KE4 EIMTDTSTSYLLCISENKENVRDKKKGNIFIGIVGVQPATGEVVFDSFQDSASRSELETR ::..... . ......: :... ... :. CCDS67 YSASSSSAISAHSPSVIVAVVEGRGLARGEIGMASIDLKNPQIILSQFADNTTYAKVITK 150 160 170 180 190 200 420 430 440 450 460 470 pF1KE4 MSSLQPVELLLPS---ALSEQTEALIHRATSVSVQDDRIRVERMDNIYFEYSHAFQAVTE .. :.:.:... . :....:. . : .. . . .. ::. ..... . . CCDS67 LKILSPLEIIMSNTACAVGNSTKLF----TLITENFKNVNFTTIQRKYFNETKGLEYIEQ 210 220 230 240 250 480 490 500 510 520 530 pF1KE4 FYAKDTVDIKGSQIISGIVNLEKPVIC--SLAAIIKYLKEFNLEKMLSKPENFKQ-LSSK . . . ...... : ..::..::. :: ... . :...: .... CCDS67 LCIAEFSTV--------LMEVQSKYYCLAAVAALLKYV-EF-IQNSVYAPKSLKICFQGS 260 270 280 290 300 540 550 560 570 580 590 pF1KE4 MEFMTINGTTLRNLEILQNQTDMKTKGSLLWVLDHTKTSFGRRKLKKWVTQPLLKLREIN . :.... .:::.: :. :.... .:. ::..::: : :.:.. . .::. .. :: CCDS67 EQTAMIDSSSAQNLELLINNQDYRNNHTLFGVLNYTKTPGGSRRLRSNILEPLVDIETIN 310 320 330 340 350 360 600 610 620 630 640 pF1KE4 ARLDAVSEVLHSESSVFGQIENHLRKLPDIERGLCSIYH--KKCSTQEFFLIVKTLYHLK ::: :.:.:..: :: ... . .. : :. : . . :. ... . .: .:: CCDS67 MRLDCVQELLQDEELFFG-LQSVISRFLDTEQLLSVLVQIPKQDTVNAAESKITNLIYLK 370 380 390 400 410 420 650 660 670 680 690 pF1KE4 SEFQAIIP--AVNSHIQSDLLRT-----------VILE-IPELLSPVEHYLK-ILNEQAA .. . : . .. .. :::. .::: : ... .:.: :: .. CCDS67 HTLELVDPLKIAMKNCNTPLLRAYYGSLEDKRFGIILEKIKTVINDDARYMKGCLNMRTQ 430 440 450 460 470 480 700 710 720 730 740 750 pF1KE4 KVGDKTELFKDLSDFPLIKKRKDEIQGVIDEIRMHLQEIRKILKNPSAQYVTVSGQEFMI : . .....: : .: ..:.: .... . . : . :.. :.: CCDS67 KC---YAVRSNINEFLDIARR--TYTEIVDDIAGMISQLGEKYSLPLRTSFS-SARGFFI 490 500 510 520 530 760 770 780 790 800 pF1KE4 EIKNSAVSC----IPTDWVKVGSTKAVSRFHSPFIVE-NYRHLNQLRE----QLVLDCSA .. .. .. .:....:....: : : ... : : ..::: .. :. CCDS67 QMTTDCIALPSDQLPSEFIKISKVKNSYSFTSADLIKMNERCQESLREIYHMTYMIVCK- 540 550 560 570 580 590 810 820 830 840 850 860 pF1KE4 EWLDFLEKFSEHYHSLCKAVHHLATVDCIFSLAKVAKQGDYCRPTVQEERKIVIKNGRHP .: .. :: : : : .. .: ..:.:.. .:: :: . ..::.: :: CCDS67 ----LLSEIYEHIHCLYKLSDTVSMLDMLLSFAHACTLSDYVRPEFTD--TLAIKQGWHP 600 610 620 630 640 650 870 880 890 900 910 920 pF1KE4 VIDVLLGEQDQYVPNNTDLSEDSERVMIITGPNMGGKSSYIKQVALITIMAQIGSYVPAE ... . .:. . ::: ..: :. .:::::::.:::.:.::.:: :::::::::::: CCDS67 ILEKISAEKP--IANNTYVTEGSN-FLIITGPNMSGKSTYLKQIALCQIMAQIGSYVPAE 660 670 680 690 700 930 940 950 960 970 980 pF1KE4 EATIGIVDGIFTRMGAADNIYKGRSTFMEELTDTAEIIRKATSQSLVILDELGRGTSTHD ... :. ::::... :.: . ::::.:. . : :...:...::...:::::::.:.. CCDS67 YSSFRIAKQIFTRISTDDDIETNSSTFMKEMKEIAYILHNANDKSLILIDELGRGTNTEE 710 720 730 740 750 760 990 1000 1010 1020 1030 1040 pF1KE4 GIAIAYATLEYFIRDVKSLTLFVTHYPPVCELEKNYSHQVGNYHMGFLVSEDESKLDPGT ::.: ::. ::.. ..:..:::.::. .:... : . : :.: : :.. .. CCDS67 GIGICYAVCEYLL-SLKAFTLFATHFLELCHIDALYPN-VENMH--FEVQHVKN------ 770 780 790 800 810 1050 1060 1070 1080 1090 1100 pF1KE4 AEQVPDFVTFLYQITRGIAA-RSYGLNVAKLADVPGEILKKAAHKSKELEGLINTKRKRL . . . . . :....:.. ..:::..:.....: :. : . . .. CCDS67 TSRNKEAILYTYKLSKGLTEEKNYGLKAAEVSSLPPSIVLDAKEITTQITRQILQNQRST 820 830 840 850 860 870 1110 1120 1130 pF1KE4 KYFAKLWTMHNAQDLQKWTEEFNMEETQTSLLH CCDS67 PEMERQRAVYHLATRLVQTARNSQLDPDSLRIYLSNLKKKYKEDFPRTEQVPEKTEE 880 890 900 910 920 930 >>CCDS62907.1 MSH6 gene_id:2956|Hs108|chr2 (1058 aa) initn: 814 init1: 425 opt: 599 Z-score: 455.5 bits: 96.1 E(32554): 4.7e-19 Smith-Waterman score: 1047; 27.8% identity (61.1% similar) in 960 aa overlap (230-1101:105-1029) 200 210 220 230 240 250 pF1KE4 LSQFGSSNTSHENLQKTASKSANKRSKSIYTPLELQYIEMKQQHKDAVLCVECGYKYRFF :: .. ..:.:. : :.: . : :... CCDS62 KRRDEHRRRPDHPDFDASTLYVPEDFLNSCTPGMRKWWQIKSQNFDLVICYKVGKFYELY 80 90 100 110 120 130 260 270 280 290 300 310 pF1KE4 GEDAEIAARELNIYCHLDHNFMTASIPTHRLFVHVRRLVAKGYKVGVVKQTETAALKAIG :: :.. ::.. . :. ...: . . :: :::::. :.:::: . CCDS62 HMDALIGVSELGLV-FMKGNWAHSGFPEIAFGRYSDSLVQKGYKVARVEQTETPEMM--- 140 150 160 170 180 190 320 330 340 350 360 370 pF1KE4 DNRSSLFSRKLTALYTKSTLIGEDVNPLI-KLDDAVNVDEI-MTDTSTSYLLCISENKEN . : ::.. . . .. ... .: : .. .: : ... ..::: ..:..:. CCDS62 EARC----RKMAHISKYDRVVRREICRIITKGTQTYSVLEGDPSENYSKYLLSLKEKEED 200 210 220 230 240 380 390 400 410 420 430 pF1KE4 VRDKKKGNIFIGIVGVQPATGEVVFDSFQDSASRSELETRMSSLQPVELLLPSA-LSEQT . .. :. :. . :. . .:.:. :...: .. ::..:. .. ::..: CCDS62 SSGHTRA---YGVCFVDTSLGKFFIGQFSDDRHCSRFRTLVAHYPPVQVLFEKGNLSKET 250 260 270 280 290 300 440 450 460 470 480 490 pF1KE4 EALIHRATSVSVQDDRIRVERMDNIYFEYSHAFQAVTE---FYAK--DTVDIKGSQIISG ..... . : :.:. : . ... :...... : : : : . . :...: CCDS62 KTILKSSLSCSLQEGLIP----GSQFWDASKTLRTLLEEEYFREKLSDGIGVMLPQVLKG 310 320 330 340 350 500 510 520 pF1KE4 I------VNL---EKP--VICSLAAIIKYLKEFNLEKMLSKPENFKQ------------- . ..: :: .. .:.. . :::. ... : . ::.. CCDS62 MTSESDSIGLTPGEKSELALSALGGCVFYLKKCLIDQELLSMANFEEYIPLDSDTVSTTR 360 370 380 390 400 410 530 540 550 560 570 580 pF1KE4 ----LSSKMEFMTINGTTLRNLEILQNQTDMKTKGSLLWVLDHTKTSFGRRKLKKWVTQP ... .. :.....:: ::::. : :. .:.:.:: .: .: ::.: ::.:. : CCDS62 SGAIFTKAYQRMVLDAVTLNNLEIFLNGTNGSTEGTLLERVDTCHTPFGKRLLKQWLCAP 420 430 440 450 460 470 590 600 610 620 630 pF1KE4 LLKLREINARLDAVSEVLHSESSVFGQIENHLRKLPDIERGLCSIYH--KKCSTQEF--- : . :: ::::. ... ... ... . :.::::.:: : .:.. . ..:. CCDS62 LCNHYAINDRLDAIEDLMVVPDKI-SEVVELLKKLPDLERLLSKIHNVGSPLKSQNHPDS 480 490 500 510 520 530 640 650 660 670 pF1KE4 --FLIVKTLYHLKS--EFQA-------------IIPAVNSHIQSDLLRTVI-LE------ .. .: : :. .: . :. : . ..: .:. :: :. CCDS62 RAIMYEETTYSKKKIIDFLSALEGFKVMCKIIGIMEEVADGFKSKILKQVISLQTKNPEG 540 550 560 570 580 590 680 690 700 710 720 730 pF1KE4 -IPELLSPVEHYLKILN-EQAAKVGDKTEL--FKDLSDFPLIKKRKDEIQGVIDEIRMHL .:.: .... .. :.: :.: : : . : : :..: :.... .: CCDS62 RFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQALADIRENE-QSLLE----YL 600 610 620 630 640 650 740 750 760 770 780 pF1KE4 QEIRKILKNPSAQYVTVSGQEFMIEI-KNSAVSCIPTDWVKVGSTKAVSRFHSPFIVENY .. :. . . : .. .....:: .: .. .: .. .. :. .:. . : .. CCDS62 EKQRNRIGCRTIVYWGIGRNRYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKL 660 670 680 690 700 710 790 800 810 820 830 840 pF1KE4 RHL---NQLREQLVLDCSAEWLDFLEKFSEHYHSLCKAVHHLATVDCIFSLAKVAKQGD- .: .. :. . :: . .. .:...:.. .::. .:..: .. ::. .. :: CCDS62 ANLINAEERRDVSLKDCMRR---LFYNFDKNYKDWQSAVECIAVLDVLLCLANYSRGGDG 720 730 740 750 760 770 850 860 870 880 890 pF1KE4 -YCRPTV--QEERK--IVIKNGRHPVID-VLLGEQDQYVPNNTDLSEDSER-------VM .:::.. :. . .:..::: : ...: :...::. .. . :. . CCDS62 PMCRPVILLPEDTPPFLELKGSRHPCITKTFFG--DDFIPNDILIGCEEEEQENGKAYCV 780 790 800 810 820 900 910 920 930 940 950 pF1KE4 IITGPNMGGKSSYIKQVALITIMAQIGSYVPAEEATIGIVDGIFTRMGAADNIYKGRSTF ..:::::::::. ..:..:...:::.: ::::: . .: .:::.::.: :..:.::: CCDS62 LVTGPNMGGKSTLMRQAGLLAVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTF 830 840 850 860 870 880 960 970 980 990 1000 1010 pF1KE4 MEELTDTAEIIRKATSQSLVILDELGRGTSTHDGIAIAYATLEYFIRDVKSLTLFVTHYP . ::..:: :. .::..:::..:::::::.: :: ::: :... . . .: ::: ::: CCDS62 FVELSETASILMHATAHSLVLVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYH 890 900 910 920 930 940 1020 1030 1040 1050 1060 1070 pF1KE4 PVCE-LEKNYSHQVGNYHMGFLVSEDESKLDPGTAEQVPDFVTFLYQITRGIAARSYGLN . : .: . ..: ::. .: :.: . ::. . .::::.. .: .:::.: CCDS62 SLVEDYSQNVAVRLG--HMACMV-ENECE-DPSQ-----ETITFLYKFIKGACPKSYGFN 950 960 970 980 990 1080 1090 1100 1110 1120 1130 pF1KE4 VAKLADVPGEILKKAAHKSKELEGLINTKRKRLKYFAKLWTMHNAQDLQKWTEEFNMEET .:.::..: :...:. .:..:.: . .. : CCDS62 AARLANLPEEVIQKGHRKAREFEKMNQSLRLFREVCLASERSTVDAEAVHKLLTLIKEL 1000 1010 1020 1030 1040 1050 >>CCDS62906.1 MSH6 gene_id:2956|Hs108|chr2 (1230 aa) initn: 814 init1: 425 opt: 599 Z-score: 454.5 bits: 96.1 E(32554): 5.4e-19 Smith-Waterman score: 1051; 26.8% identity (58.8% similar) in 1121 aa overlap (85-1101:118-1201) 60 70 80 90 100 110 pF1KE4 AAAAAAAAPPAPPAPAFPPQLPPHVATEIDRRKKRPLEND-GPVKKKVKKVQQKEGGSDL :: :.: : . : ..::.:: CCDS62 KSEEDNEIESEEEVQPKTQGSRRSSRQIKKRRVISDSESDIGGSDVEFKPDTKEEGSSDE 90 100 110 120 130 140 120 130 140 150 160 pF1KE4 GMSG--NSE------PKKCLRTRN-VSKSLEKLKEFCCDSALPQSRVQTESLQERFAVLP :: .:: : : : :. . . .::. . :.. :. :.. . CCDS62 ISSGVGDSESEGLNSPVKVARKRKRMVTGNGSLKRKSSRKETPSATKQATSISSETKNTL 150 160 170 180 190 200 170 180 190 200 210 pF1KE4 KCTDFDDISLLHAKNAVSSEDSKRQINQKDTTLFDLSQFGSSNT-----SHENLQKTASK . . . : .:. . ...::.: :: :.. . .: ... .. CCDS62 RAFSAPQNSESQAHVSGGGDDSSRPTVWYHETLEWLKEEKRRDEHRRRPDHPDFDASTLY 210 220 230 240 250 260 220 230 240 250 260 270 pF1KE4 SANKRSKSIYTPLELQYIEMKQQHKDAVLCVECGYKYRFFGEDAEIAARELNIYCHLDHN . .: :: .. ..:.:. : :.: . : :... :: :.. ::.. . : CCDS62 VPEDFLNSC-TPGMRKWWQIKSQNFDLVICYKVGKFYELYHMDALIGVSELGLV-FMKGN 270 280 290 300 310 320 280 290 300 310 320 330 pF1KE4 FMTASIPTHRLFVHVRRLVAKGYKVGVVKQTETAALKAIGDNRSSLFSRKLTALYTKSTL . ...: . . :: :::::. :.:::: . . : ::.. . . . CCDS62 WAHSGFPEIAFGRYSDSLVQKGYKVARVEQTETPEMM---EAR----CRKMAHISKYDRV 330 340 350 360 370 340 350 360 370 380 390 pF1KE4 IGEDVNPLI-KLDDAVNVDEI-MTDTSTSYLLCISENKENVRDKKKGNIFIGIVGVQPAT . ... .: : .. .: : ... ..::: ..:..:. . .. :. :. . CCDS62 VRREICRIITKGTQTYSVLEGDPSENYSKYLLSLKEKEEDSSGHTRA---YGVCFVDTSL 380 390 400 410 420 430 400 410 420 430 440 450 pF1KE4 GEVVFDSFQDSASRSELETRMSSLQPVELLLPSA-LSEQTEALIHRATSVSVQDDRIRVE :. . .:.:. :...: .. ::..:. .. ::..:..... . : :.:. : CCDS62 GKFFIGQFSDDRHCSRFRTLVAHYPPVQVLFEKGNLSKETKTILKSSLSCSLQEGLI--- 440 450 460 470 480 490 460 470 480 490 500 pF1KE4 RMDNIYFEYSHAFQAVTE---FYAK--DTVDIKGSQIISGI------VNL---EKP--VI . ... :...... : : : : . . :...:. ..: :: .. CCDS62 -PGSQFWDASKTLRTLLEEEYFREKLSDGIGVMLPQVLKGMTSESDSIGLTPGEKSELAL 500 510 520 530 540 550 510 520 530 540 pF1KE4 CSLAAIIKYLKEFNLEKMLSKPENFKQ-----------------LSSKMEFMTINGTTLR .:.. . :::. ... : . ::.. ... .. :.....:: CCDS62 SALGGCVFYLKKCLIDQELLSMANFEEYIPLDSDTVSTTRSGAIFTKAYQRMVLDAVTLN 560 570 580 590 600 610 550 560 570 580 590 600 pF1KE4 NLEILQNQTDMKTKGSLLWVLDHTKTSFGRRKLKKWVTQPLLKLREINARLDAVSEVLHS ::::. : :. .:.:.:: .: .: ::.: ::.:. :: . :: ::::. ... CCDS62 NLEIFLNGTNGSTEGTLLERVDTCHTPFGKRLLKQWLCAPLCNHYAINDRLDAIEDLMVV 620 630 640 650 660 670 610 620 630 640 650 pF1KE4 ESSVFGQIENHLRKLPDIERGLCSIYH--KKCSTQEF-----FLIVKTLYHLKS--EFQA ... ... . :.::::.:: : .:.. . ..:. .. .: : :. .: . CCDS62 PDKI-SEVVELLKKLPDLERLLSKIHNVGSPLKSQNHPDSRAIMYEETTYSKKKIIDFLS 680 690 700 710 720 730 660 670 680 690 pF1KE4 -------------IIPAVNSHIQSDLLRTVIL--------EIPELLSPVEHYLKILN-EQ :. : . ..: .:. :: ..:.: .... .. :. CCDS62 ALEGFKVMCKIIGIMEEVADGFKSKILKQVISLQTKNPEGRFPDLTVELNRWDTAFDHEK 740 750 760 770 780 790 700 710 720 730 740 750 pF1KE4 AAKVGDKTEL--FKDLSDFPLIKKRKDEIQGVIDEIRMHLQEIRKILKNPSAQYVTVSGQ : :.: : : . : : :..: :.... .:.. :. . . : .. . CCDS62 ARKTGLITPKAGFDSDYDQALADIRENE-QSLLE----YLEKQRNRIGCRTIVYWGIGRN 800 810 820 830 840 760 770 780 790 800 pF1KE4 EFMIEI-KNSAVSCIPTDWVKVGSTKAVSRFHSPFIVENYRHL---NQLREQLVLDCSAE ....:: .: .. .: .. .. :. .:. . : .. .: .. :. . :: . CCDS62 RYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKLANLINAEERRDVSLKDCMRR 850 860 870 880 890 900 810 820 830 840 850 860 pF1KE4 WLDFLEKFSEHYHSLCKAVHHLATVDCIFSLAKVAKQGD--YCRPTV--QEERK--IVIK .. .:...:.. .::. .:..: .. ::. .. :: .:::.. :. . .: CCDS62 ---LFYNFDKNYKDWQSAVECIAVLDVLLCLANYSRGGDGPMCRPVILLPEDTPPFLELK 910 920 930 940 950 960 870 880 890 900 910 pF1KE4 NGRHPVID-VLLGEQDQYVPNNTDLSEDSER-------VMIITGPNMGGKSSYIKQVALI ..::: : ...: :...::. .. . :. ...:::::::::. ..:..:. CCDS62 GSRHPCITKTFFG--DDFIPNDILIGCEEEEQENGKAYCVLVTGPNMGGKSTLMRQAGLL 970 980 990 1000 1010 1020 920 930 940 950 960 970 pF1KE4 TIMAQIGSYVPAEEATIGIVDGIFTRMGAADNIYKGRSTFMEELTDTAEIIRKATSQSLV ..:::.: ::::: . .: .:::.::.: :..:.:::. ::..:: :. .::..::: CCDS62 AVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFFVELSETASILMHATAHSLV 1030 1040 1050 1060 1070 1080 980 990 1000 1010 1020 1030 pF1KE4 ILDELGRGTSTHDGIAIAYATLEYFIRDVKSLTLFVTHYPPVCELEKNYSHQVGNY--HM ..:::::::.: :: ::: :... . . .: ::: ::: . : .::..:. :: CCDS62 LVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHSLVE---DYSQNVAVRLGHM 1090 1100 1110 1120 1130 1040 1050 1060 1070 1080 1090 pF1KE4 GFLVSEDESKLDPGTAEQVPDFVTFLYQITRGIAARSYGLNVAKLADVPGEILKKAAHKS . .: :.: . ::. . .::::.. .: .:::.:.:.::..: :...:. .:. CCDS62 ACMV-ENECE-DPSQ-----ETITFLYKFIKGACPKSYGFNAARLANLPEEVIQKGHRKA 1140 1150 1160 1170 1180 1190 1100 1110 1120 1130 pF1KE4 KELEGLINTKRKRLKYFAKLWTMHNAQDLQKWTEEFNMEETQTSLLH .:.: . .. : CCDS62 REFEKMNQSLRLFREVCLASERSTVDAEAVHKLLTLIKEL 1200 1210 1220 1230 >>CCDS1836.1 MSH6 gene_id:2956|Hs108|chr2 (1360 aa) initn: 814 init1: 425 opt: 599 Z-score: 453.9 bits: 96.1 E(32554): 5.8e-19 Smith-Waterman score: 1051; 26.8% identity (58.8% similar) in 1121 aa overlap (85-1101:248-1331) 60 70 80 90 100 110 pF1KE4 AAAAAAAAPPAPPAPAFPPQLPPHVATEIDRRKKRPLEND-GPVKKKVKKVQQKEGGSDL :: :.: : . : ..::.:: CCDS18 KSEEDNEIESEEEVQPKTQGSRRSSRQIKKRRVISDSESDIGGSDVEFKPDTKEEGSSDE 220 230 240 250 260 270 120 130 140 150 160 pF1KE4 GMSG--NSE------PKKCLRTRN-VSKSLEKLKEFCCDSALPQSRVQTESLQERFAVLP :: .:: : : : :. . . .::. . :.. :. :.. . CCDS18 ISSGVGDSESEGLNSPVKVARKRKRMVTGNGSLKRKSSRKETPSATKQATSISSETKNTL 280 290 300 310 320 330 170 180 190 200 210 pF1KE4 KCTDFDDISLLHAKNAVSSEDSKRQINQKDTTLFDLSQFGSSNT-----SHENLQKTASK . . . : .:. . ...::.: :: :.. . .: ... .. CCDS18 RAFSAPQNSESQAHVSGGGDDSSRPTVWYHETLEWLKEEKRRDEHRRRPDHPDFDASTLY 340 350 360 370 380 390 220 230 240 250 260 270 pF1KE4 SANKRSKSIYTPLELQYIEMKQQHKDAVLCVECGYKYRFFGEDAEIAARELNIYCHLDHN . .: :: .. ..:.:. : :.: . : :... :: :.. ::.. . : CCDS18 VPEDFLNSC-TPGMRKWWQIKSQNFDLVICYKVGKFYELYHMDALIGVSELGLV-FMKGN 400 410 420 430 440 450 280 290 300 310 320 330 pF1KE4 FMTASIPTHRLFVHVRRLVAKGYKVGVVKQTETAALKAIGDNRSSLFSRKLTALYTKSTL . ...: . . :: :::::. :.:::: . . : ::.. . . . CCDS18 WAHSGFPEIAFGRYSDSLVQKGYKVARVEQTETPEMM---EAR----CRKMAHISKYDRV 460 470 480 490 500 340 350 360 370 380 390 pF1KE4 IGEDVNPLI-KLDDAVNVDEI-MTDTSTSYLLCISENKENVRDKKKGNIFIGIVGVQPAT . ... .: : .. .: : ... ..::: ..:..:. . .. :. :. . CCDS18 VRREICRIITKGTQTYSVLEGDPSENYSKYLLSLKEKEEDSSGHTRA---YGVCFVDTSL 510 520 530 540 550 560 400 410 420 430 440 450 pF1KE4 GEVVFDSFQDSASRSELETRMSSLQPVELLLPSA-LSEQTEALIHRATSVSVQDDRIRVE :. . .:.:. :...: .. ::..:. .. ::..:..... . : :.:. : CCDS18 GKFFIGQFSDDRHCSRFRTLVAHYPPVQVLFEKGNLSKETKTILKSSLSCSLQEGLI--- 570 580 590 600 610 620 460 470 480 490 500 pF1KE4 RMDNIYFEYSHAFQAVTE---FYAK--DTVDIKGSQIISGI------VNL---EKP--VI . ... :...... : : : : . . :...:. ..: :: .. CCDS18 -PGSQFWDASKTLRTLLEEEYFREKLSDGIGVMLPQVLKGMTSESDSIGLTPGEKSELAL 630 640 650 660 670 680 510 520 530 540 pF1KE4 CSLAAIIKYLKEFNLEKMLSKPENFKQ-----------------LSSKMEFMTINGTTLR .:.. . :::. ... : . ::.. ... .. :.....:: CCDS18 SALGGCVFYLKKCLIDQELLSMANFEEYIPLDSDTVSTTRSGAIFTKAYQRMVLDAVTLN 690 700 710 720 730 740 550 560 570 580 590 600 pF1KE4 NLEILQNQTDMKTKGSLLWVLDHTKTSFGRRKLKKWVTQPLLKLREINARLDAVSEVLHS ::::. : :. .:.:.:: .: .: ::.: ::.:. :: . :: ::::. ... CCDS18 NLEIFLNGTNGSTEGTLLERVDTCHTPFGKRLLKQWLCAPLCNHYAINDRLDAIEDLMVV 750 760 770 780 790 800 610 620 630 640 650 pF1KE4 ESSVFGQIENHLRKLPDIERGLCSIYH--KKCSTQEF-----FLIVKTLYHLKS--EFQA ... ... . :.::::.:: : .:.. . ..:. .. .: : :. .: . CCDS18 PDKI-SEVVELLKKLPDLERLLSKIHNVGSPLKSQNHPDSRAIMYEETTYSKKKIIDFLS 810 820 830 840 850 860 660 670 680 690 pF1KE4 -------------IIPAVNSHIQSDLLRTVIL--------EIPELLSPVEHYLKILN-EQ :. : . ..: .:. :: ..:.: .... .. :. CCDS18 ALEGFKVMCKIIGIMEEVADGFKSKILKQVISLQTKNPEGRFPDLTVELNRWDTAFDHEK 870 880 890 900 910 920 700 710 720 730 740 750 pF1KE4 AAKVGDKTEL--FKDLSDFPLIKKRKDEIQGVIDEIRMHLQEIRKILKNPSAQYVTVSGQ : :.: : : . : : :..: :.... .:.. :. . . : .. . CCDS18 ARKTGLITPKAGFDSDYDQALADIRENE-QSLLE----YLEKQRNRIGCRTIVYWGIGRN 930 940 950 960 970 760 770 780 790 800 pF1KE4 EFMIEI-KNSAVSCIPTDWVKVGSTKAVSRFHSPFIVENYRHL---NQLREQLVLDCSAE ....:: .: .. .: .. .. :. .:. . : .. .: .. :. . :: . CCDS18 RYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKLANLINAEERRDVSLKDCMRR 980 990 1000 1010 1020 1030 810 820 830 840 850 860 pF1KE4 WLDFLEKFSEHYHSLCKAVHHLATVDCIFSLAKVAKQGD--YCRPTV--QEERK--IVIK .. .:...:.. .::. .:..: .. ::. .. :: .:::.. :. . .: CCDS18 ---LFYNFDKNYKDWQSAVECIAVLDVLLCLANYSRGGDGPMCRPVILLPEDTPPFLELK 1040 1050 1060 1070 1080 1090 870 880 890 900 910 pF1KE4 NGRHPVID-VLLGEQDQYVPNNTDLSEDSER-------VMIITGPNMGGKSSYIKQVALI ..::: : ...: :...::. .. . :. ...:::::::::. ..:..:. CCDS18 GSRHPCITKTFFG--DDFIPNDILIGCEEEEQENGKAYCVLVTGPNMGGKSTLMRQAGLL 1100 1110 1120 1130 1140 1150 920 930 940 950 960 970 pF1KE4 TIMAQIGSYVPAEEATIGIVDGIFTRMGAADNIYKGRSTFMEELTDTAEIIRKATSQSLV ..:::.: ::::: . .: .:::.::.: :..:.:::. ::..:: :. .::..::: CCDS18 AVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFFVELSETASILMHATAHSLV 1160 1170 1180 1190 1200 1210 980 990 1000 1010 1020 1030 pF1KE4 ILDELGRGTSTHDGIAIAYATLEYFIRDVKSLTLFVTHYPPVCELEKNYSHQVGNY--HM ..:::::::.: :: ::: :... . . .: ::: ::: . : .::..:. :: CCDS18 LVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHSLVE---DYSQNVAVRLGHM 1220 1230 1240 1250 1260 1040 1050 1060 1070 1080 1090 pF1KE4 GFLVSEDESKLDPGTAEQVPDFVTFLYQITRGIAARSYGLNVAKLADVPGEILKKAAHKS . .: :.: . ::. . .::::.. .: .:::.:.:.::..: :...:. .:. CCDS18 ACMV-ENECE-DPSQ-----ETITFLYKFIKGACPKSYGFNAARLANLPEEVIQKGHRKA 1270 1280 1290 1300 1310 1320 1100 1110 1120 1130 pF1KE4 KELEGLINTKRKRLKYFAKLWTMHNAQDLQKWTEEFNMEETQTSLLH .:.: . .. : CCDS18 REFEKMNQSLRLFREVCLASERSTVDAEAVHKLLTLIKEL 1330 1340 1350 1360 >>CCDS4720.1 MSH5 gene_id:4439|Hs108|chr6 (834 aa) initn: 484 init1: 415 opt: 587 Z-score: 448.1 bits: 94.3 E(32554): 1.2e-18 Smith-Waterman score: 653; 28.2% identity (60.1% similar) in 616 aa overlap (547-1135:241-818) 520 530 540 550 560 570 pF1KE4 KMLSKPENFKQLSSKMEFMTINGTTLRNLEILQNQTDMKTKGSLLWVLDHTKTSFGRRKL . . . .: ::. .:.. . ..:.. : CCDS47 FKKFMLTHLVNIDQDTYSVLQIFKSESHPSVYKVASGLKEGLSLFGILNRCHCKWGEKLL 220 230 240 250 260 270 580 590 600 610 620 630 pF1KE4 KKWVTQPLLKLREINARLDAVSEVLHSESSVFGQIEN----HLRKLPDIERGLCSIYHKK . : :.: : :...:::... : .. ..:. . :....: : . . .. : : CCDS47 RLWFTRPTHDLGELSSRLDVIQFFLLPQNLDMAQMLHRLLGHIKNVPLILKRM-KLSHTK 280 290 300 310 320 640 650 660 670 680 690 pF1KE4 CSTQEFFLIVKTLYHLKSEFQAIIPAVNSHIQS-DLLRTVILEIPELLSPVEHYL-KILN : . .. ::.: : . .. : : :: .:.: . :. . : . . :... CCDS47 VSDWQ--VLYKTVY---SAL-GLRDACRSLPQSIQLFRDIAQEFSDDLHHIASLIGKVVD 330 340 350 360 370 380 700 710 720 730 740 pF1KE4 EQAAKVGDKTELFKDLSDFPLIKKRKDEIQGV---IDEI-RMHLQEIRKILKNPSAQYVT ... . .. .. ... : : ..: ...:. . :. : .:... . . . :. :. CCDS47 FEGSLAENRFTVLPNID--PEIDEKKRRLMGLPSFLTEVARKELENLDSRIPSCSVIYIP 390 400 410 420 430 440 750 760 770 780 790 800 pF1KE4 VSGQEFMIEIKNSAVSCIPTDWVKVGSTKAVSRFHSPFIVENYRHLNQLREQLV------ . : :.. : .:. :.... . .. . :. :. : . : . . CCDS47 LIG--FLLSIPR-----LPS-MVEASDFE-INGLDFMFLSEEKLHYRSARTKELDALLGD 450 460 470 480 490 810 820 830 840 850 pF1KE4 LDCSAEWLDFLEKFSEHYHSLCKA-----VHHLAT-VDCIFSLAKVAKQGDYCRPTVQEE : : . . : .. . . : .: : ::. .: ...::..:.. : :: . . CCDS47 LHCEIRDQETLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALASAARDYGYSRPRYSPQ 500 510 520 530 540 550 860 870 880 890 900 910 pF1KE4 R-KIVIKNGRHPVIDVLLGEQDQYVPNNTDLSEDSERVMIITGPNMGGKSSYIKQVALIT . :.:::::.... .:::.:. . :. :: .::::: .::: :.:::.::: CCDS47 VLGVRIQNGRHPLMELC---ARTFVPNSTECGGDKGRVKVITGPNSSGKSIYLKQVGLIT 560 570 580 590 600 920 930 940 950 960 970 pF1KE4 IMAQIGSYVPAEEATIGIVDGIFTRMGAADNIYKGRSTFMEELTDTAEIIRKATSQSLVI .:: .::.:::::: :: ::.::::. . ..: : :::: .:...:. . .::.::::. CCDS47 FMALVGSFVPAEEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQVAKAVNNATAQSLVL 610 620 630 640 650 660 980 990 1000 1010 1020 1030 pF1KE4 LDELGRGTSTHDGIAIAYATLEYFI-RDVKSLTLFV-THYPPVCELEKNYSHQVGNYHMG .::.:.::.: ::.:. :.:.... : .:: :.. . .:. .: CCDS47 IDEFGKGTNTVDGLALLAAVLRHWLARGPTCPHIFVATNFLSLVQLQL--------LPQG 670 680 690 700 710 720 1040 1050 1060 1070 1080 1090 pF1KE4 FLVSEDESKLDPGTAEQVPDFVTFLYQITRGIAARSYGLNVAKLADVPGEILKKAAHKSK :: . : : :. :.: :.::. .:.: :.. ..: : .: ... ..: CCDS47 PLV----QYLTMETCEDGNDLV-FFYQVCEGVAKASHASHTAAQAGLPDKLVA----RGK 730 740 750 760 770 1100 1110 1120 1130 pF1KE4 ELEGLINTKR--KRLKYFAKLWTMHNAQDLQKWTEEFNMEETQTSLLH :. :: . . : .: . : :.: : : ....:. . .: CCDS47 EVSDLIRSGKPIKPVKDLLKKNQMENCQTLVDKFMKLDLEDPNLDLNVFMSQEVLPAATS 780 790 800 810 820 830 CCDS47 IL >>CCDS34409.2 MSH5 gene_id:4439|Hs108|chr6 (822 aa) initn: 462 init1: 293 opt: 575 Z-score: 439.2 bits: 92.7 E(32554): 3.9e-18 Smith-Waterman score: 581; 29.2% identity (62.0% similar) in 476 aa overlap (547-998:258-712) 520 530 540 550 560 570 pF1KE4 KMLSKPENFKQLSSKMEFMTINGTTLRNLEILQNQTDMKTKGSLLWVLDHTKTSFGRRKL . . . .: ::. .:.. . ..:.. : CCDS34 FKKFMLTHLVNIDQDTYSVLQIFKSESHPSVYKVASGLKEGLSLFGILNRCHCKWGEKLL 230 240 250 260 270 280 580 590 600 610 620 630 pF1KE4 KKWVTQPLLKLREINARLDAVSEVLHSESSVFGQIEN----HLRKLPDIERGLCSIYHKK . : :.: : :...:::... : .. ..:. . :....: : . . .. : : CCDS34 RLWFTRPTHDLGELSSRLDVIQFFLLPQNLDMAQMLHRLLGHIKNVPLILKRM-KLSHTK 290 300 310 320 330 340 640 650 660 670 680 690 pF1KE4 CSTQEFFLIVKTLYHLKSEFQAIIPAVNSHIQS-DLLRTVILEIPELLSPVEHYL-KILN : . .. ::.: : . .. : : :: .:.: . :. . : . . :... CCDS34 VSDWQ--VLYKTVY---SAL-GLRDACRSLPQSIQLFRDIAQEFSDDLHHIASLIGKVVD 350 360 370 380 390 400 700 710 720 730 740 pF1KE4 EQAAKVGDKTELFKDLSDFPLIKKRKDEIQGV---IDEI-RMHLQEIRKILKNPSAQYVT ... . .. .. ... : : ..: ...:. . :. : .:... . . . :. :. CCDS34 FEGSLAENRFTVLPNID--PEIDEKKRRLMGLPSFLTEVARKELENLDSRIPSCSVIYIP 410 420 430 440 450 750 760 770 780 790 800 pF1KE4 VSGQEFMIEIKNSAVSCIPTDWVKVGSTKAVSRFHSPFIVENYRHLNQLREQLV------ . : :.. : .:. . .: .. . :. :. : . : . . CCDS34 LIG--FLLSIPR-----LPS--MVEASDFEINGLDFMFLSEEKLHYRSARTKELDALLGD 460 470 480 490 500 810 820 830 840 850 pF1KE4 LDCSAEWLDFLEKFSEHYHSLCKA-----VHHLAT-VDCIFSLAKVAKQGDYCRPTVQEE : : . . : .. . . : .: : ::. .: ...::..:.. : :: . . CCDS34 LHCEIRDQETLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALASAARDYGYSRPRYSPQ 510 520 530 540 550 560 860 870 880 890 900 910 pF1KE4 R-KIVIKNGRHPVIDVLLGEQDQYVPNNTDLSEDSERVMIITGPNMGGKSSYIKQVALIT . :.:::::.... .:::.:. . :. :: .::::: .::: :.:::.::: CCDS34 VLGVRIQNGRHPLMELC---ARTFVPNSTECGGDKGRVKVITGPNSSGKSIYLKQVGLIT 570 580 590 600 610 620 920 930 940 950 960 970 pF1KE4 IMAQIGSYVPAEEATIGIVDGIFTRMGAADNIYKGRSTFMEELTD-TAEIIRKATSQSLV .:: .::.:::::: :: ::.::::. . ..: : :::: .:.. .:. . .::.:::: CCDS34 FMALVGSFVPAEEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQQVAKAVNNATAQSLV 630 640 650 660 670 680 980 990 1000 1010 1020 1030 pF1KE4 ILDELGRGTSTHDGIAIAYATLEYFIRDVKSLTLFVTHYPPVCELEKNYSHQVGNYHMGF ..::.:.::.: ::.:. :.:.... CCDS34 LIDEFGKGTNTVDGLALLAAVLRHWLARGPTCPHIFVATNFLSLVQLQLLPQGPLVQYLT 690 700 710 720 730 740 >>CCDS34410.1 MSH5 gene_id:4439|Hs108|chr6 (835 aa) initn: 470 init1: 293 opt: 575 Z-score: 439.0 bits: 92.7 E(32554): 3.9e-18 Smith-Waterman score: 641; 28.2% identity (60.0% similar) in 617 aa overlap (547-1135:241-819) 520 530 540 550 560 570 pF1KE4 KMLSKPENFKQLSSKMEFMTINGTTLRNLEILQNQTDMKTKGSLLWVLDHTKTSFGRRKL . . . .: ::. .:.. . ..:.. : CCDS34 FKKFMLTHLVNIDQDTYSVLQIFKSESHPSVYKVASGLKEGLSLFGILNRCHCKWGEKLL 220 230 240 250 260 270 580 590 600 610 620 630 pF1KE4 KKWVTQPLLKLREINARLDAVSEVLHSESSVFGQIEN----HLRKLPDIERGLCSIYHKK . : :.: : :...:::... : .. ..:. . :....: : . . .. : : CCDS34 RLWFTRPTHDLGELSSRLDVIQFFLLPQNLDMAQMLHRLLGHIKNVPLILKRM-KLSHTK 280 290 300 310 320 640 650 660 670 680 690 pF1KE4 CSTQEFFLIVKTLYHLKSEFQAIIPAVNSHIQS-DLLRTVILEIPELLSPVEHYL-KILN : . .. ::.: : . .. : : :: .:.: . :. . : . . :... CCDS34 VSDWQ--VLYKTVY---SAL-GLRDACRSLPQSIQLFRDIAQEFSDDLHHIASLIGKVVD 330 340 350 360 370 380 700 710 720 730 740 pF1KE4 EQAAKVGDKTELFKDLSDFPLIKKRKDEIQGV---IDEI-RMHLQEIRKILKNPSAQYVT ... . .. .. ... : : ..: ...:. . :. : .:... . . . :. :. CCDS34 FEGSLAENRFTVLPNID--PEIDEKKRRLMGLPSFLTEVARKELENLDSRIPSCSVIYIP 390 400 410 420 430 440 750 760 770 780 790 800 pF1KE4 VSGQEFMIEIKNSAVSCIPTDWVKVGSTKAVSRFHSPFIVENYRHLNQLREQLV------ . : :.. : .:. :.... . .. . :. :. : . : . . CCDS34 LIG--FLLSIPR-----LPS-MVEASDFE-INGLDFMFLSEEKLHYRSARTKELDALLGD 450 460 470 480 490 810 820 830 840 850 pF1KE4 LDCSAEWLDFLEKFSEHYHSLCKA-----VHHLAT-VDCIFSLAKVAKQGDYCRPTVQEE : : . . : .. . . : .: : ::. .: ...::..:.. : :: . . CCDS34 LHCEIRDQETLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALASAARDYGYSRPRYSPQ 500 510 520 530 540 550 860 870 880 890 900 910 pF1KE4 R-KIVIKNGRHPVIDVLLGEQDQYVPNNTDLSEDSERVMIITGPNMGGKSSYIKQVALIT . :.:::::.... .:::.:. . :. :: .::::: .::: :.:::.::: CCDS34 VLGVRIQNGRHPLMELC---ARTFVPNSTECGGDKGRVKVITGPNSSGKSIYLKQVGLIT 560 570 580 590 600 920 930 940 950 960 970 pF1KE4 IMAQIGSYVPAEEATIGIVDGIFTRMGAADNIYKGRSTFMEELTD-TAEIIRKATSQSLV .:: .::.:::::: :: ::.::::. . ..: : :::: .:.. .:. . .::.:::: CCDS34 FMALVGSFVPAEEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQQVAKAVNNATAQSLV 610 620 630 640 650 660 980 990 1000 1010 1020 1030 pF1KE4 ILDELGRGTSTHDGIAIAYATLEYFI-RDVKSLTLFV-THYPPVCELEKNYSHQVGNYHM ..::.:.::.: ::.:. :.:.... : .:: :.. . .:. . CCDS34 LIDEFGKGTNTVDGLALLAAVLRHWLARGPTCPHIFVATNFLSLVQLQL--------LPQ 670 680 690 700 710 720 1040 1050 1060 1070 1080 1090 pF1KE4 GFLVSEDESKLDPGTAEQVPDFVTFLYQITRGIAARSYGLNVAKLADVPGEILKKAAHKS : :: . : : :. :.: :.::. .:.: :.. ..: : .: ... .. CCDS34 GPLV----QYLTMETCEDGNDLV-FFYQVCEGVAKASHASHTAAQAGLPDKLVA----RG 730 740 750 760 770 1100 1110 1120 1130 pF1KE4 KELEGLINTKR--KRLKYFAKLWTMHNAQDLQKWTEEFNMEETQTSLLH ::. :: . . : .: . : :.: : : ....:. . .: CCDS34 KEVSDLIRSGKPIKPVKDLLKKNQMENCQTLVDKFMKLDLEDPNLDLNVFMSQEVLPAAT 780 790 800 810 820 830 CCDS34 SIL 1137 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 18:16:43 2016 done: Mon Nov 7 18:16:43 2016 Total Scan time: 4.630 Total Display time: 0.400 Function used was FASTA [36.3.4 Apr, 2011]