FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB3091, 934 aa 1>>>pF1KB3091 934 - 934 aa - 934 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.2950+/-0.00139; mu= 16.0279+/- 0.083 mean_var=77.0764+/-14.973, 0's: 0 Z-trim(99.3): 40 B-trim: 0 in 0/49 Lambda= 0.146088 statistics sampled from 5652 (5673) to 5652 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.509), E-opt: 0.2 (0.174), width: 16 Scan time: 3.730 The best scores are: opt bits E(32554) CCDS1834.1 MSH2 gene_id:4436|Hs108|chr2 ( 934) 6015 1278.4 0 CCDS58709.1 MSH2 gene_id:4436|Hs108|chr2 ( 868) 5587 1188.1 0 CCDS34195.1 MSH3 gene_id:4437|Hs108|chr5 (1137) 778 174.6 9.3e-43 CCDS670.1 MSH4 gene_id:4438|Hs108|chr1 ( 936) 752 169.1 3.5e-41 CCDS62907.1 MSH6 gene_id:2956|Hs108|chr2 (1058) 590 135.0 7.4e-31 CCDS62906.1 MSH6 gene_id:2956|Hs108|chr2 (1230) 590 135.0 8.5e-31 CCDS1836.1 MSH6 gene_id:2956|Hs108|chr2 (1360) 590 135.0 9.3e-31 CCDS4720.1 MSH5 gene_id:4439|Hs108|chr6 ( 834) 554 127.4 1.1e-28 CCDS34410.1 MSH5 gene_id:4439|Hs108|chr6 ( 835) 544 125.3 4.9e-28 CCDS34409.2 MSH5 gene_id:4439|Hs108|chr6 ( 822) 500 116.0 3e-25 >>CCDS1834.1 MSH2 gene_id:4436|Hs108|chr2 (934 aa) initn: 6015 init1: 6015 opt: 6015 Z-score: 6847.7 bits: 1278.4 E(32554): 0 Smith-Waterman score: 6015; 100.0% identity (100.0% similar) in 934 aa overlap (1-934:1-934) 10 20 30 40 50 60 pF1KB3 MAVQPKETLQLESAAEVGFVRFFQGMPEKPTTTVRLFDRGDFYTAHGEDALLAAREVFKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 MAVQPKETLQLESAAEVGFVRFFQGMPEKPTTTVRLFDRGDFYTAHGEDALLAAREVFKT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB3 QGVIKYMGPAGAKNLQSVVLSKMNFESFVKDLLLVRQYRVEVYKNRAGNKASKENDWYLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 QGVIKYMGPAGAKNLQSVVLSKMNFESFVKDLLLVRQYRVEVYKNRAGNKASKENDWYLA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB3 YKASPGNLSQFEDILFGNNDMSASIGVVGVKMSAVDGQRQVGVGYVDSIQRKLGLCEFPD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 YKASPGNLSQFEDILFGNNDMSASIGVVGVKMSAVDGQRQVGVGYVDSIQRKLGLCEFPD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB3 NDQFSNLEALLIQIGPKECVLPGGETAGDMGKLRQIIQRGGILITERKKADFSTKDIYQD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 NDQFSNLEALLIQIGPKECVLPGGETAGDMGKLRQIIQRGGILITERKKADFSTKDIYQD 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB3 LNRLLKGKKGEQMNSAVLPEMENQVAVSSLSAVIKFLELLSDDSNFGQFELTTFDFSQYM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 LNRLLKGKKGEQMNSAVLPEMENQVAVSSLSAVIKFLELLSDDSNFGQFELTTFDFSQYM 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB3 KLDIAAVRALNLFQGSVEDTTGSQSLAALLNKCKTPQGQRLVNQWIKQPLMDKNRIEERL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 KLDIAAVRALNLFQGSVEDTTGSQSLAALLNKCKTPQGQRLVNQWIKQPLMDKNRIEERL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB3 NLVEAFVEDAELRQTLQEDLLRRFPDLNRLAKKFQRQAANLQDCYRLYQGINQLPNVIQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 NLVEAFVEDAELRQTLQEDLLRRFPDLNRLAKKFQRQAANLQDCYRLYQGINQLPNVIQA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB3 LEKHEGKHQKLLLAVFVTPLTDLRSDFSKFQEMIETTLDMDQVENHEFLVKPSFDPNLSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 LEKHEGKHQKLLLAVFVTPLTDLRSDFSKFQEMIETTLDMDQVENHEFLVKPSFDPNLSE 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB3 LREIMNDLEKKMQSTLISAARDLGLDPGKQIKLDSSAQFGYYFRVTCKEEKVLRNNKNFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 LREIMNDLEKKMQSTLISAARDLGLDPGKQIKLDSSAQFGYYFRVTCKEEKVLRNNKNFS 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB3 TVDIQKNGVKFTNSKLTSLNEEYTKNKTEYEEAQDAIVKEIVNISSGYVEPMQTLNDVLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 TVDIQKNGVKFTNSKLTSLNEEYTKNKTEYEEAQDAIVKEIVNISSGYVEPMQTLNDVLA 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB3 QLDAVVSFAHVSNGAPVPYVRPAILEKGQGRIILKASRHACVEVQDEIAFIPNDVYFEKD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 QLDAVVSFAHVSNGAPVPYVRPAILEKGQGRIILKASRHACVEVQDEIAFIPNDVYFEKD 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB3 KQMFHIITGPNMGGKSTYIRQTGVIVLMAQIGCFVPCESAEVSIVDCILARVGAGDSQLK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 KQMFHIITGPNMGGKSTYIRQTGVIVLMAQIGCFVPCESAEVSIVDCILARVGAGDSQLK 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB3 GVSTFMAEMLETASILRSATKDSLIIIDELGRGTSTYDGFGLAWAISEYIATKIGAFCMF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 GVSTFMAEMLETASILRSATKDSLIIIDELGRGTSTYDGFGLAWAISEYIATKIGAFCMF 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB3 ATHFHELTALANQIPTVNNLHVTALTTEETLTMLYQVKKGVCDQSFGIHVAELANFPKHV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 ATHFHELTALANQIPTVNNLHVTALTTEETLTMLYQVKKGVCDQSFGIHVAELANFPKHV 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB3 IECAKQKALELEEFQYIGESQGYDIMEPAAKKCYLEREQGEKIIQEFLSKVKQMPFTEMS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 IECAKQKALELEEFQYIGESQGYDIMEPAAKKCYLEREQGEKIIQEFLSKVKQMPFTEMS 850 860 870 880 890 900 910 920 930 pF1KB3 EENITIKLKQLKAEVIAKNNSFVNEIISRIKVTT :::::::::::::::::::::::::::::::::: CCDS18 EENITIKLKQLKAEVIAKNNSFVNEIISRIKVTT 910 920 930 >>CCDS58709.1 MSH2 gene_id:4436|Hs108|chr2 (868 aa) initn: 5587 init1: 5587 opt: 5587 Z-score: 6360.7 bits: 1188.1 E(32554): 0 Smith-Waterman score: 5587; 100.0% identity (100.0% similar) in 868 aa overlap (67-934:1-868) 40 50 60 70 80 90 pF1KB3 FDRGDFYTAHGEDALLAAREVFKTQGVIKYMGPAGAKNLQSVVLSKMNFESFVKDLLLVR :::::::::::::::::::::::::::::: CCDS58 MGPAGAKNLQSVVLSKMNFESFVKDLLLVR 10 20 30 100 110 120 130 140 150 pF1KB3 QYRVEVYKNRAGNKASKENDWYLAYKASPGNLSQFEDILFGNNDMSASIGVVGVKMSAVD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 QYRVEVYKNRAGNKASKENDWYLAYKASPGNLSQFEDILFGNNDMSASIGVVGVKMSAVD 40 50 60 70 80 90 160 170 180 190 200 210 pF1KB3 GQRQVGVGYVDSIQRKLGLCEFPDNDQFSNLEALLIQIGPKECVLPGGETAGDMGKLRQI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 GQRQVGVGYVDSIQRKLGLCEFPDNDQFSNLEALLIQIGPKECVLPGGETAGDMGKLRQI 100 110 120 130 140 150 220 230 240 250 260 270 pF1KB3 IQRGGILITERKKADFSTKDIYQDLNRLLKGKKGEQMNSAVLPEMENQVAVSSLSAVIKF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 IQRGGILITERKKADFSTKDIYQDLNRLLKGKKGEQMNSAVLPEMENQVAVSSLSAVIKF 160 170 180 190 200 210 280 290 300 310 320 330 pF1KB3 LELLSDDSNFGQFELTTFDFSQYMKLDIAAVRALNLFQGSVEDTTGSQSLAALLNKCKTP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 LELLSDDSNFGQFELTTFDFSQYMKLDIAAVRALNLFQGSVEDTTGSQSLAALLNKCKTP 220 230 240 250 260 270 340 350 360 370 380 390 pF1KB3 QGQRLVNQWIKQPLMDKNRIEERLNLVEAFVEDAELRQTLQEDLLRRFPDLNRLAKKFQR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 QGQRLVNQWIKQPLMDKNRIEERLNLVEAFVEDAELRQTLQEDLLRRFPDLNRLAKKFQR 280 290 300 310 320 330 400 410 420 430 440 450 pF1KB3 QAANLQDCYRLYQGINQLPNVIQALEKHEGKHQKLLLAVFVTPLTDLRSDFSKFQEMIET :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 QAANLQDCYRLYQGINQLPNVIQALEKHEGKHQKLLLAVFVTPLTDLRSDFSKFQEMIET 340 350 360 370 380 390 460 470 480 490 500 510 pF1KB3 TLDMDQVENHEFLVKPSFDPNLSELREIMNDLEKKMQSTLISAARDLGLDPGKQIKLDSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 TLDMDQVENHEFLVKPSFDPNLSELREIMNDLEKKMQSTLISAARDLGLDPGKQIKLDSS 400 410 420 430 440 450 520 530 540 550 560 570 pF1KB3 AQFGYYFRVTCKEEKVLRNNKNFSTVDIQKNGVKFTNSKLTSLNEEYTKNKTEYEEAQDA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 AQFGYYFRVTCKEEKVLRNNKNFSTVDIQKNGVKFTNSKLTSLNEEYTKNKTEYEEAQDA 460 470 480 490 500 510 580 590 600 610 620 630 pF1KB3 IVKEIVNISSGYVEPMQTLNDVLAQLDAVVSFAHVSNGAPVPYVRPAILEKGQGRIILKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 IVKEIVNISSGYVEPMQTLNDVLAQLDAVVSFAHVSNGAPVPYVRPAILEKGQGRIILKA 520 530 540 550 560 570 640 650 660 670 680 690 pF1KB3 SRHACVEVQDEIAFIPNDVYFEKDKQMFHIITGPNMGGKSTYIRQTGVIVLMAQIGCFVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 SRHACVEVQDEIAFIPNDVYFEKDKQMFHIITGPNMGGKSTYIRQTGVIVLMAQIGCFVP 580 590 600 610 620 630 700 710 720 730 740 750 pF1KB3 CESAEVSIVDCILARVGAGDSQLKGVSTFMAEMLETASILRSATKDSLIIIDELGRGTST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 CESAEVSIVDCILARVGAGDSQLKGVSTFMAEMLETASILRSATKDSLIIIDELGRGTST 640 650 660 670 680 690 760 770 780 790 800 810 pF1KB3 YDGFGLAWAISEYIATKIGAFCMFATHFHELTALANQIPTVNNLHVTALTTEETLTMLYQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 YDGFGLAWAISEYIATKIGAFCMFATHFHELTALANQIPTVNNLHVTALTTEETLTMLYQ 700 710 720 730 740 750 820 830 840 850 860 870 pF1KB3 VKKGVCDQSFGIHVAELANFPKHVIECAKQKALELEEFQYIGESQGYDIMEPAAKKCYLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 VKKGVCDQSFGIHVAELANFPKHVIECAKQKALELEEFQYIGESQGYDIMEPAAKKCYLE 760 770 780 790 800 810 880 890 900 910 920 930 pF1KB3 REQGEKIIQEFLSKVKQMPFTEMSEENITIKLKQLKAEVIAKNNSFVNEIISRIKVTT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 REQGEKIIQEFLSKVKQMPFTEMSEENITIKLKQLKAEVIAKNNSFVNEIISRIKVTT 820 830 840 850 860 >>CCDS34195.1 MSH3 gene_id:4437|Hs108|chr5 (1137 aa) initn: 742 init1: 476 opt: 778 Z-score: 881.1 bits: 174.6 E(32554): 9.3e-43 Smith-Waterman score: 871; 28.2% identity (61.2% similar) in 735 aa overlap (161-852:388-1094) 140 150 160 170 180 190 pF1KB3 FEDILFGNNDMSASIGVVGVKMSAVDGQRQVGVGYVDSIQRKLGLCEFPDNDQFSNLEAL .:. :. .. . : :. . :.::. CCDS34 EIMTDTSTSYLLCISENKENVRDKKKGNIFIGIVGVQPATGEVVFDSFQDSASRSELETR 360 370 380 390 400 410 200 210 220 230 240 pF1KB3 LIQIGPKECVLPGG---ETAGDMGKLRQI-IQRGGILITERKKADFSTKDIYQDLNRLLK . .. : : .::.. .: . . . .. .: : . . . : . .: .... CCDS34 MSSLQPVELLLPSALSEQTEALIHRATSVSVQDDRIRVERMDNIYFEYSHAFQAVTEFYA 420 430 440 450 460 470 250 260 270 280 290 pF1KB3 GK----KGEQMNSAVLPEMENQVAVSSLSAVIKFLE------LLSDDSNFGQFELTTFDF :: :. :... ..:. : . ::.:.::.:. .:: :: :. . ..: CCDS34 KDTVDIKGSQIISGIV-NLEKPV-ICSLAAIIKYLKEFNLEKMLSKPENFKQLS-SKMEF 480 490 500 510 520 530 300 310 320 330 340 350 pF1KB3 SQYMKLDIAAVRALNLFQGSVEDTTGSQSLAALLNKCKTPQGQRLVNQWIKQPLMDKNRI : .. ...: :...:... : . :: .:.. :: :.: ...:. :::. .: CCDS34 ---MTINGTTLRNLEILQNQT-DMKTKGSLLWVLDHTKTSFGRRKLKKWVTQPLLKLREI 540 550 560 570 580 590 360 370 380 390 400 410 pF1KB3 EERLNLVEAFVEDAELRQTLQEDLLRRFPDLNRLAKKFQRQAANLQDCYRLYQGINQLPN . ::. : ... :. ::..::..: .. .. . :. . . . . .: . CCDS34 NARLDAVSEVLHSESSVFGQIENHLRKLPDIERGLCSIYHKKCSTQEFFLIVKTLYHLKS 600 610 620 630 640 650 420 430 440 450 460 470 pF1KB3 VIQALEKHEGKH-QKLLLAVFVTPLTDLRSDFSKFQEMIETTLDMDQVENHEFLVKPSFD .::. ..: :. :: . . . .: : .. .... . .: .. : : CCDS34 EFQAIIPAVNSHIQSDLLRTVILEIPELLSPVEHYLKILNE--QAAKVGDKTELFK---- 660 670 680 690 700 480 490 500 510 520 530 pF1KB3 PNLSELREIMNDLEKKMQSTLISAARDLGLDPGKQIKLDSSAQFGYYFRVTCKEEKVLRN .::.. ... . ..:. .:. : . :. ..: . :::. :: . .. . . CCDS34 -DLSDF-PLIKKRKDEIQG-VIDEIR-MHLQEIRKILKNPSAQY-----VTVSGQEFMIE 710 720 730 740 750 540 550 560 570 580 pF1KB3 NKNFSTVDIQKNGVKFTNSKLTS-LNEEY-TKNKTEYEEAQDAIV----KEIVNISSGYV :: .. : . :: ..: .: .. . ..: . .. .. .: : ... . CCDS34 IKNSAVSCIPTDWVKVGSTKAVSRFHSPFIVENYRHLNQLREQLVLDCSAEWLDFLEKFS 760 770 780 790 800 810 590 600 610 620 630 640 pF1KB3 EPMQTLNDV---LAQLDAVVSFAHVSNGAPVPYVRPAILEKGQGRIILKASRHACVEV-- : ...: . :: .: . :.:.:.. . : ::.. : . .:..: .:: ..: CCDS34 EHYHSLCKAVHHLATVDCIFSLAKVAKQGD--YCRPTVQE--ERKIVIKNGRHPVIDVLL 820 830 840 850 860 870 650 660 670 680 690 700 pF1KB3 --QDEIAFIPNDVYFEKDKQMFHIITGPNMGGKSTYIRQTGVIVLMAQIGCFVPCESAEV ::. ..::.. . .:.. :::::::::::.::.:...:..::::: .:: : : . CCDS34 GEQDQ--YVPNNTDLSEDSERVMIITGPNMGGKSSYIKQVALITIMAQIGSYVPAEEATI 880 890 900 910 920 710 720 730 740 750 760 pF1KB3 SIVDCILARVGAGDSQLKGVSTFMAEMLETASILRSATKDSLIIIDELGRGTSTYDGFGL .::: :..:.::.:. :: :::: :. .:: :.:.::..::.:.:::::::::.::... CCDS34 GIVDGIFTRMGAADNIYKGQSTFMEELTDTAEIIRKATSQSLVILDELGRGTSTHDGIAI 930 940 950 960 970 980 770 780 790 800 810 pF1KB3 AWAISEYIATKIGAFCMFATHFHELTALA-NQIPTVNNLHVTALTTEET----------- :.: ::. . .. .:.::. . : : :.: :. :..:. CCDS34 AYATLEYFIRDVKSLTLFVTHYPPVCELEKNYSHQVGNYHMGFLVSEDESKLDPGAAEQV 990 1000 1010 1020 1030 1040 820 830 840 850 860 pF1KB3 ---LTMLYQVKKGVCDQSFGIHVAELANFPKHVIECAKQKALELEEFQYIGESQGYDIME .:.:::. .:. .:.:..::.::. : .... : .:. ::: CCDS34 PDFVTFLYQITRGIAARSYGLNVAKLADVPGEILKKAAHKSKELEGLINTKRKRLKYFAK 1050 1060 1070 1080 1090 1100 870 880 890 900 910 920 pF1KB3 PAAKKCYLEREQGEKIIQEFLSKVKQMPFTEMSEENITIKLKQLKAEVIAKNNSFVNEII CCDS34 LWTMHNAQDLQKWTEEFNMEETQTSLLH 1110 1120 1130 >>CCDS670.1 MSH4 gene_id:4438|Hs108|chr1 (936 aa) initn: 564 init1: 329 opt: 752 Z-score: 852.9 bits: 169.1 E(32554): 3.5e-41 Smith-Waterman score: 752; 27.1% identity (60.1% similar) in 716 aa overlap (160-846:170-863) 130 140 150 160 170 180 pF1KB3 QFEDILFGNNDMSASIGVVGVKMSAVDGQRQVGVGYVDSIQRKLGLCEFPDNDQFSNLEA ..:.. .: . .. : .: :: .... . CCDS67 GYSASSSSAISAHSPSVIVAVVEGRGLARGEIGMASIDLKNPQIILSQFADNTTYAKVIT 140 150 160 170 180 190 190 200 210 220 230 240 pF1KB3 LLIQIGPKECVLPGGETAGDMGKLRQIIQRGGILITER-KKADFSTKDIYQDLNRLLKGK : ..: : .. ..:: .:. ... :::: :...:.: : . :: CCDS67 KLKILSPLEIIM--SNTACAVGNSTKLFT----LITENFKNVNFTT--IQRKYFNETKGL 200 210 220 230 240 250 250 260 270 280 290 300 pF1KB3 KG-EQMN----SAVLPEMENQV-AVSSLSAVIKFLELLSDDSNFGQFELTTFDFS-QYMK . ::. :.:: :.... .....:..:..:..... . :. : : CCDS67 EYIEQLCIAEFSTVLMEVQSKYYCLAAVAALLKYVEFIQNSVYAPKSLKICFQGSEQTAM 260 270 280 290 300 310 310 320 330 340 350 360 pF1KB3 LDIAAVRALNLFQGSVEDTTGSQSLAALLNKCKTPQGQRLVNQWIKQPLMDKNRIEERLN .: .... :.:. .. .: ....: ..:: ::: :.: . . : .::.: . :. ::. CCDS67 IDSSSAQNLELLINN-QDYRNNHTLFGVLNYTKTPGGSRRLRSNILEPLVDIETINMRLD 320 330 340 350 360 370 370 380 390 400 410 pF1KB3 LVEAFVEDAELRQTLQEDLLRRFPDLNRLAK---KFQRQ----AANLQDCYRLYQGINQL :. ...: :: :: ... :: : ..: . .. .: ::. . .: ... CCDS67 CVQELLQDEELFFGLQ-SVISRFLDTEQLLSVLVQIPKQDTVNAAESKITNLIY--LKHT 380 390 400 410 420 420 430 440 450 460 pF1KB3 PNVIQALEKHEGKHQKLLLAVFVTPLTDLRSDFSKFQEMIETTLD-----MDQVENHEFL .... :. . . :: .. : : : :. . : :.:... : : . CCDS67 LELVDPLKIAMKNCNTPLLRAYYGSLEDKR--FGIILEKIKTVINDDARYMKGCLNMRTQ 430 440 450 460 470 480 470 480 490 500 510 520 pF1KB3 VKPSFDPNLSELREIMNDLEKKMQSTLISAARDLGLDPGKQIKLDSSAQFGYYFRVT--C . :..:. .: .. . . . .:: . .. . :. :.....: : CCDS67 KCYAVRSNINEFLDIARRTYTEIVDDIAGMISQLGEKYSLPLRTSFSSARGFFIQMTTDC 490 500 510 520 530 540 530 540 550 560 570 580 pF1KB3 KEEKVLRNNKNFSTVDIQKNGVKFTNSKLTSLNEEYTKNKTEYEEAQDAIVKEIVNISSG . ..: .. ::. .::.. : ..::. .. : . :: .... CCDS67 IALPSDQLPSEFIKISKVKNSYSFTSADLIKMNERCQESLREIYHMTYMIVCKLLSEIYE 550 560 570 580 590 600 590 600 610 620 630 640 pF1KB3 YVEPMQTLNDVLAQLDAVVSFAHVSNGAPVPYVRPAILEKGQGRIILKASRHACVEVQDE ... . :.:....:: ..::::. . . :::: . . . .: . : .: . CCDS67 HIHCLYKLSDTVSMLDMLLSFAHACTLS--DYVRPEFTDT----LAIKQGWHPILEKISA 610 620 630 640 650 650 660 670 680 690 700 pF1KB3 IAFIPNDVYFEKDKQMFHIITGPNMGGKSTYIRQTGVIVLMAQIGCFVPCESAEVSIVDC : :..: . .. : :::::::.:::::..: .. .::::: .:: : . :. CCDS67 EKPIANNTYVTEGSN-FLIITGPNMSGKSTYLKQIALCQIMAQIGSYVPAEYSSFRIAKQ 660 670 680 690 700 710 710 720 730 740 750 760 pF1KB3 ILARVGAGDSQLKGVSTFMAEMLETASILRSATKDSLIIIDELGRGTSTYDGFGLAWAIS :..:... :. . :::: :: : : ::..:. :::.::::::::.: .:.:. .:. CCDS67 IFTRISTDDDIETNSSTFMKEMKEIAYILHNANDKSLILIDELGRGTNTEEGIGICYAVC 720 730 740 750 760 770 770 780 790 800 810 820 pF1KB3 EYIATKIGAFCMFATHFHELTALANQIPTVNNLHVTAL------TTEETLTMLYQVKKGV ::. . . :: .::::: :: . :.:.:.: . ..:.. . :...::. CCDS67 EYLLS-LKAFTLFATHFLELCHIDALYPNVENMHFEVQHVKNTSRNKEAILYTYKLSKGL 780 790 800 810 820 830 830 840 850 860 870 880 pF1KB3 CDQ-SFGIHVAELANFPKHVIECAKQKALELEEFQYIGESQGYDIMEPAAKKCYLEREQG .. ..:...::....: .. ::. CCDS67 TEEKNYGLKAAEVSSLPPSIVLDAKEITTQITRQILQNQRSTPEMERQRAVYHLATRLVQ 840 850 860 870 880 890 >>CCDS62907.1 MSH6 gene_id:2956|Hs108|chr2 (1058 aa) initn: 678 init1: 428 opt: 590 Z-score: 667.5 bits: 135.0 E(32554): 7.4e-31 Smith-Waterman score: 833; 27.8% identity (57.7% similar) in 823 aa overlap (129-853:219-1023) 100 110 120 130 140 150 pF1KB3 RVEVYKNRAGNKASKENDWYLAYKASPGNLSQFEDILFGNNDMSASIGVVGVKMSAVDGQ .: ..: :. . . : ....: . :.. CCDS62 MMEARCRKMAHISKYDRVVRREICRIITKGTQTYSVLEGDPSENYSKYLLSLKEKEEDSS 190 200 210 220 230 240 160 170 180 190 200 210 pF1KB3 ---RQVGVGYVDSIQRKLGLCEFPDNDQFSNLEALLIQIGPKECVLPGGETAGDM----- : :: .::. :. . .: :. . : ...:. . : . .. :. . . CCDS62 GHTRAYGVCFVDTSLGKFFIGQFSDDRHCSRFRTLVAHYPPVQVLFEKGNLSKETKTILK 250 260 270 280 290 300 220 230 240 250 pF1KB3 GKLRQIIQRGGILITERKKADFSTKDIYQD--------------LNRLLKGKKGEQMNSA ..: .:.: : .. :. . . . .. : ..::: .:. . . CCDS62 SSLSCSLQEGLIPGSQFWDASKTLRTLLEEEYFREKLSDGIGVMLPQVLKGMTSESDSIG 310 320 330 340 350 360 260 270 280 290 pF1KB3 VLPEMENQVAVSSLSAVIKFL-------ELLSDDSNFGQFELTTFD----------FS-- . : ....:.:.:.. . .: :::: .:: .. : :. CCDS62 LTPGEKSELALSALGGCVFYLKKCLIDQELLSM-ANFEEYIPLDSDTVSTTRSGAIFTKA 370 380 390 400 410 420 300 310 320 330 340 350 pF1KB3 -QYMKLDIAAVRALNLF-QGSVEDTTGSQSLAALLNKCKTPQGQRLVNQWIKQPLMDKNR : : :: ... :..: .:. .: :. : .. :.:: :.::..::. :: .. CCDS62 YQRMVLDAVTLNNLEIFLNGTNGSTEGT--LLERVDTCHTPFGKRLLKQWLCAPLCNHYA 430 440 450 460 470 480 360 370 380 390 400 410 pF1KB3 IEERLNLVEAF-VEDAELRQTLQEDLLRRFPDLNRLAKKFQRQAANLQDCYRLYQGINQL :..::. .: . : .. ... .::...:::.:: .:.. .. :.. .. CCDS62 INDRLDAIEDLMVVPDKISEVV--ELLKKLPDLERLLSKIHNVGSPLKS--------QNH 490 500 510 520 530 420 430 440 450 460 pF1KB3 PNVIQALEKHEGKHQKLLLAVFVTPLTDLRSDFSKFQEMIETTLD------MDQVENHEF :. .:. .: ..: . :.. : .. . :. ..: . : . :: . . CCDS62 PDS-RAIMYEETTYSKKKIIDFLSALEGFKV-MCKIIGIMEEVADGFKSKILKQVISLQT 540 550 560 570 580 590 470 480 490 500 510 520 pF1KB3 LVKPSFDPNLS-ELR--EIMNDLEKKMQSTLIS--AARDLGLDPG-KQIKLDSSAQFGYY . :.:. :: . : :: .. ::. :. : : . .:. . .. . : CCDS62 KNPEGRFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQALADIRENEQSLLEYL 600 610 620 630 640 650 530 540 550 560 pF1KB3 F----RVTCKE---EKVLRNN------KNFSTVDIQ-----KNGVKFTNSKLTSLNEEYT :. :. . :: .::.: .. :. : . :. :. CCDS62 EKQRNRIGCRTIVYWGIGRNRYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKL 660 670 680 690 700 710 570 580 590 600 610 pF1KB3 KNKTEYEEAQDAIVKEIV-----NISSGYVEPMQTLNDVLAQLDAVVSFAHVSNGAPVPY : . :: .:. .:. . :....: . :. . .: ::... .:. : :. :. CCDS62 ANLINAEERRDVSLKDCMRRLFYNFDKNY-KDWQSAVECIAVLDVLLCLANYSRGGDGPM 720 730 740 750 760 770 620 630 640 650 660 pF1KB3 VRPAIL--EKGQGRIILKASRHACVE---VQDEIAFIPNDVYF-------EKDKQMFHII ::.:: : . ::.::: :. :. :::::. . :. : . .. CCDS62 CRPVILLPEDTPPFLELKGSRHPCITKTFFGDD--FIPNDILIGCEEEEQENGKAYCVLV 780 790 800 810 820 830 670 680 690 700 710 720 pF1KB3 TGPNMGGKSTYIRQTGVIVLMAQIGCFVPCESAEVSIVDCILARVGAGDSQLKGVSTFMA :::::::::: .::.:....:::.::.:: : ... .: ...:.::.: ..: :::.. CCDS62 TGPNMGGKSTLMRQAGLLAVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFFV 840 850 860 870 880 890 730 740 750 760 770 780 pF1KB3 EMLETASILRSATKDSLIIIDELGRGTSTYDGFGLAWAISEYIATKIGAFCMFATHFHEL :. :::::: :: ::...:::::::.:.:: ..: :. . .: : .:.::.: : CCDS62 ELSETASILMHATAHSLVLVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHSL 900 910 920 930 940 950 790 800 810 820 830 840 pF1KB3 TALANQIPTVNNLHVTALT-------TEETLTMLYQVKKGVCDQSFGIHVAELANFPKHV . .: .: :.. .. ..::.:.::. ::.: .:.:...:.:::.:..: CCDS62 VEDYSQNVAVRLGHMACMVENECEDPSQETITFLYKFIKGACPKSYGFNAARLANLPEEV 960 970 980 990 1000 1010 850 860 870 880 890 900 pF1KB3 IECAKQKALELEEFQYIGESQGYDIMEPAAKKCYLEREQGEKIIQEFLSKVKQMPFTEMS :. ...:: :.:. CCDS62 IQKGHRKAREFEKMNQSLRLFREVCLASERSTVDAEAVHKLLTLIKEL 1020 1030 1040 1050 >>CCDS62906.1 MSH6 gene_id:2956|Hs108|chr2 (1230 aa) initn: 678 init1: 428 opt: 590 Z-score: 666.4 bits: 135.0 E(32554): 8.5e-31 Smith-Waterman score: 833; 27.8% identity (57.7% similar) in 823 aa overlap (129-853:391-1195) 100 110 120 130 140 150 pF1KB3 RVEVYKNRAGNKASKENDWYLAYKASPGNLSQFEDILFGNNDMSASIGVVGVKMSAVDGQ .: ..: :. . . : ....: . :.. CCDS62 MMEARCRKMAHISKYDRVVRREICRIITKGTQTYSVLEGDPSENYSKYLLSLKEKEEDSS 370 380 390 400 410 420 160 170 180 190 200 210 pF1KB3 ---RQVGVGYVDSIQRKLGLCEFPDNDQFSNLEALLIQIGPKECVLPGGETAGDM----- : :: .::. :. . .: :. . : ...:. . : . .. :. . . CCDS62 GHTRAYGVCFVDTSLGKFFIGQFSDDRHCSRFRTLVAHYPPVQVLFEKGNLSKETKTILK 430 440 450 460 470 480 220 230 240 250 pF1KB3 GKLRQIIQRGGILITERKKADFSTKDIYQD--------------LNRLLKGKKGEQMNSA ..: .:.: : .. :. . . . .. : ..::: .:. . . CCDS62 SSLSCSLQEGLIPGSQFWDASKTLRTLLEEEYFREKLSDGIGVMLPQVLKGMTSESDSIG 490 500 510 520 530 540 260 270 280 290 pF1KB3 VLPEMENQVAVSSLSAVIKFL-------ELLSDDSNFGQFELTTFD----------FS-- . : ....:.:.:.. . .: :::: .:: .. : :. CCDS62 LTPGEKSELALSALGGCVFYLKKCLIDQELLSM-ANFEEYIPLDSDTVSTTRSGAIFTKA 550 560 570 580 590 300 310 320 330 340 350 pF1KB3 -QYMKLDIAAVRALNLF-QGSVEDTTGSQSLAALLNKCKTPQGQRLVNQWIKQPLMDKNR : : :: ... :..: .:. .: :. : .. :.:: :.::..::. :: .. CCDS62 YQRMVLDAVTLNNLEIFLNGTNGSTEGT--LLERVDTCHTPFGKRLLKQWLCAPLCNHYA 600 610 620 630 640 650 360 370 380 390 400 410 pF1KB3 IEERLNLVEAF-VEDAELRQTLQEDLLRRFPDLNRLAKKFQRQAANLQDCYRLYQGINQL :..::. .: . : .. ... .::...:::.:: .:.. .. :.. .. CCDS62 INDRLDAIEDLMVVPDKISEVV--ELLKKLPDLERLLSKIHNVGSPLKS--------QNH 660 670 680 690 700 420 430 440 450 460 pF1KB3 PNVIQALEKHEGKHQKLLLAVFVTPLTDLRSDFSKFQEMIETTLD------MDQVENHEF :. .:. .: ..: . :.. : .. . :. ..: . : . :: . . CCDS62 PDS-RAIMYEETTYSKKKIIDFLSALEGFKV-MCKIIGIMEEVADGFKSKILKQVISLQT 710 720 730 740 750 760 470 480 490 500 510 520 pF1KB3 LVKPSFDPNLS-ELR--EIMNDLEKKMQSTLIS--AARDLGLDPG-KQIKLDSSAQFGYY . :.:. :: . : :: .. ::. :. : : . .:. . .. . : CCDS62 KNPEGRFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQALADIRENEQSLLEYL 770 780 790 800 810 820 530 540 550 560 pF1KB3 F----RVTCKE---EKVLRNN------KNFSTVDIQ-----KNGVKFTNSKLTSLNEEYT :. :. . :: .::.: .. :. : . :. :. CCDS62 EKQRNRIGCRTIVYWGIGRNRYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKL 830 840 850 860 870 880 570 580 590 600 610 pF1KB3 KNKTEYEEAQDAIVKEIV-----NISSGYVEPMQTLNDVLAQLDAVVSFAHVSNGAPVPY : . :: .:. .:. . :....: . :. . .: ::... .:. : :. :. CCDS62 ANLINAEERRDVSLKDCMRRLFYNFDKNY-KDWQSAVECIAVLDVLLCLANYSRGGDGPM 890 900 910 920 930 940 620 630 640 650 660 pF1KB3 VRPAIL--EKGQGRIILKASRHACVE---VQDEIAFIPNDVYF-------EKDKQMFHII ::.:: : . ::.::: :. :. :::::. . :. : . .. CCDS62 CRPVILLPEDTPPFLELKGSRHPCITKTFFGDD--FIPNDILIGCEEEEQENGKAYCVLV 950 960 970 980 990 1000 670 680 690 700 710 720 pF1KB3 TGPNMGGKSTYIRQTGVIVLMAQIGCFVPCESAEVSIVDCILARVGAGDSQLKGVSTFMA :::::::::: .::.:....:::.::.:: : ... .: ...:.::.: ..: :::.. CCDS62 TGPNMGGKSTLMRQAGLLAVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFFV 1010 1020 1030 1040 1050 1060 730 740 750 760 770 780 pF1KB3 EMLETASILRSATKDSLIIIDELGRGTSTYDGFGLAWAISEYIATKIGAFCMFATHFHEL :. :::::: :: ::...:::::::.:.:: ..: :. . .: : .:.::.: : CCDS62 ELSETASILMHATAHSLVLVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHSL 1070 1080 1090 1100 1110 1120 790 800 810 820 830 840 pF1KB3 TALANQIPTVNNLHVTALT-------TEETLTMLYQVKKGVCDQSFGIHVAELANFPKHV . .: .: :.. .. ..::.:.::. ::.: .:.:...:.:::.:..: CCDS62 VEDYSQNVAVRLGHMACMVENECEDPSQETITFLYKFIKGACPKSYGFNAARLANLPEEV 1130 1140 1150 1160 1170 1180 850 860 870 880 890 900 pF1KB3 IECAKQKALELEEFQYIGESQGYDIMEPAAKKCYLEREQGEKIIQEFLSKVKQMPFTEMS :. ...:: :.:. CCDS62 IQKGHRKAREFEKMNQSLRLFREVCLASERSTVDAEAVHKLLTLIKEL 1190 1200 1210 1220 1230 >>CCDS1836.1 MSH6 gene_id:2956|Hs108|chr2 (1360 aa) initn: 678 init1: 428 opt: 590 Z-score: 665.7 bits: 135.0 E(32554): 9.3e-31 Smith-Waterman score: 833; 27.8% identity (57.7% similar) in 823 aa overlap (129-853:521-1325) 100 110 120 130 140 150 pF1KB3 RVEVYKNRAGNKASKENDWYLAYKASPGNLSQFEDILFGNNDMSASIGVVGVKMSAVDGQ .: ..: :. . . : ....: . :.. CCDS18 MMEARCRKMAHISKYDRVVRREICRIITKGTQTYSVLEGDPSENYSKYLLSLKEKEEDSS 500 510 520 530 540 550 160 170 180 190 200 210 pF1KB3 ---RQVGVGYVDSIQRKLGLCEFPDNDQFSNLEALLIQIGPKECVLPGGETAGDM----- : :: .::. :. . .: :. . : ...:. . : . .. :. . . CCDS18 GHTRAYGVCFVDTSLGKFFIGQFSDDRHCSRFRTLVAHYPPVQVLFEKGNLSKETKTILK 560 570 580 590 600 610 220 230 240 250 pF1KB3 GKLRQIIQRGGILITERKKADFSTKDIYQD--------------LNRLLKGKKGEQMNSA ..: .:.: : .. :. . . . .. : ..::: .:. . . CCDS18 SSLSCSLQEGLIPGSQFWDASKTLRTLLEEEYFREKLSDGIGVMLPQVLKGMTSESDSIG 620 630 640 650 660 670 260 270 280 290 pF1KB3 VLPEMENQVAVSSLSAVIKFL-------ELLSDDSNFGQFELTTFD----------FS-- . : ....:.:.:.. . .: :::: .:: .. : :. CCDS18 LTPGEKSELALSALGGCVFYLKKCLIDQELLSM-ANFEEYIPLDSDTVSTTRSGAIFTKA 680 690 700 710 720 300 310 320 330 340 350 pF1KB3 -QYMKLDIAAVRALNLF-QGSVEDTTGSQSLAALLNKCKTPQGQRLVNQWIKQPLMDKNR : : :: ... :..: .:. .: :. : .. :.:: :.::..::. :: .. CCDS18 YQRMVLDAVTLNNLEIFLNGTNGSTEGT--LLERVDTCHTPFGKRLLKQWLCAPLCNHYA 730 740 750 760 770 780 360 370 380 390 400 410 pF1KB3 IEERLNLVEAF-VEDAELRQTLQEDLLRRFPDLNRLAKKFQRQAANLQDCYRLYQGINQL :..::. .: . : .. ... .::...:::.:: .:.. .. :.. .. CCDS18 INDRLDAIEDLMVVPDKISEVV--ELLKKLPDLERLLSKIHNVGSPLKS--------QNH 790 800 810 820 830 420 430 440 450 460 pF1KB3 PNVIQALEKHEGKHQKLLLAVFVTPLTDLRSDFSKFQEMIETTLD------MDQVENHEF :. .:. .: ..: . :.. : .. . :. ..: . : . :: . . CCDS18 PDS-RAIMYEETTYSKKKIIDFLSALEGFKV-MCKIIGIMEEVADGFKSKILKQVISLQT 840 850 860 870 880 890 470 480 490 500 510 520 pF1KB3 LVKPSFDPNLS-ELR--EIMNDLEKKMQSTLIS--AARDLGLDPG-KQIKLDSSAQFGYY . :.:. :: . : :: .. ::. :. : : . .:. . .. . : CCDS18 KNPEGRFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQALADIRENEQSLLEYL 900 910 920 930 940 950 530 540 550 560 pF1KB3 F----RVTCKE---EKVLRNN------KNFSTVDIQ-----KNGVKFTNSKLTSLNEEYT :. :. . :: .::.: .. :. : . :. :. CCDS18 EKQRNRIGCRTIVYWGIGRNRYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKL 960 970 980 990 1000 1010 570 580 590 600 610 pF1KB3 KNKTEYEEAQDAIVKEIV-----NISSGYVEPMQTLNDVLAQLDAVVSFAHVSNGAPVPY : . :: .:. .:. . :....: . :. . .: ::... .:. : :. :. CCDS18 ANLINAEERRDVSLKDCMRRLFYNFDKNY-KDWQSAVECIAVLDVLLCLANYSRGGDGPM 1020 1030 1040 1050 1060 1070 620 630 640 650 660 pF1KB3 VRPAIL--EKGQGRIILKASRHACVE---VQDEIAFIPNDVYF-------EKDKQMFHII ::.:: : . ::.::: :. :. :::::. . :. : . .. CCDS18 CRPVILLPEDTPPFLELKGSRHPCITKTFFGDD--FIPNDILIGCEEEEQENGKAYCVLV 1080 1090 1100 1110 1120 1130 670 680 690 700 710 720 pF1KB3 TGPNMGGKSTYIRQTGVIVLMAQIGCFVPCESAEVSIVDCILARVGAGDSQLKGVSTFMA :::::::::: .::.:....:::.::.:: : ... .: ...:.::.: ..: :::.. CCDS18 TGPNMGGKSTLMRQAGLLAVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFFV 1140 1150 1160 1170 1180 1190 730 740 750 760 770 780 pF1KB3 EMLETASILRSATKDSLIIIDELGRGTSTYDGFGLAWAISEYIATKIGAFCMFATHFHEL :. :::::: :: ::...:::::::.:.:: ..: :. . .: : .:.::.: : CCDS18 ELSETASILMHATAHSLVLVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHSL 1200 1210 1220 1230 1240 1250 790 800 810 820 830 840 pF1KB3 TALANQIPTVNNLHVTALT-------TEETLTMLYQVKKGVCDQSFGIHVAELANFPKHV . .: .: :.. .. ..::.:.::. ::.: .:.:...:.:::.:..: CCDS18 VEDYSQNVAVRLGHMACMVENECEDPSQETITFLYKFIKGACPKSYGFNAARLANLPEEV 1260 1270 1280 1290 1300 1310 850 860 870 880 890 900 pF1KB3 IECAKQKALELEEFQYIGESQGYDIMEPAAKKCYLEREQGEKIIQEFLSKVKQMPFTEMS :. ...:: :.:. CCDS18 IQKGHRKAREFEKMNQSLRLFREVCLASERSTVDAEAVHKLLTLIKEL 1320 1330 1340 1350 1360 >>CCDS4720.1 MSH5 gene_id:4439|Hs108|chr6 (834 aa) initn: 392 init1: 345 opt: 554 Z-score: 628.2 bits: 127.4 E(32554): 1.1e-28 Smith-Waterman score: 581; 23.4% identity (57.8% similar) in 734 aa overlap (161-846:61-773) 140 150 160 170 180 pF1KB3 FEDILFGNNDMSASIGVVGVKMSAVDGQRQVGVGYVDSIQRKLGLC-EFPDNDQFSNLEA .:..: :. . . . . ::..... :. CCDS47 PGPREAEEEEVEEEEELAEIHLCVLWNSGYLGIAYYDTSDSTIHFMPDAPDHESLKLLQR 40 50 60 70 80 90 190 200 210 220 230 240 pF1KB3 LLIQIGPKECVLPGGETAGD---MGKLRQIIQRGGIL--ITERKKADFSTKDIYQDLNRL .: .:.:. : . . . .::: . .: : ..::. . : :: CCDS47 VLDEINPQSVVTSAKQDENMTRFLGKLASQEHREPKRPEIIFLPSVDFGLEISKQ---RL 100 110 120 130 140 250 260 270 280 pF1KB3 LKGKKG---EQMN--------SAVLPEMENQVAVSSLSAVIKFL-------ELLSDDSNF :.:. . . :. :...: .. ..: .:....::: :: . . . CCDS47 LSGNYSFIPDAMTATEKILFLSSIIP-FDCLLTVRALGGLLKFLGRRRIGVELEDYNVSV 150 160 170 180 190 200 290 300 310 320 330 pF1KB3 GQFELTTFDFSQYMKLDIAAVRALNLFQGSVEDT-----TGSQ---SLAALLNKCKTPQG . . : ... ...: . .:..:.. . . .: . :: ..::.:. : CCDS47 PILGFKKFMLTHLVNIDQDTYSVLQIFKSESHPSVYKVASGLKEGLSLFGILNRCHCKWG 210 220 230 240 250 260 340 350 360 370 380 390 pF1KB3 QRLVNQWIKQPLMDKNRIEERLNLVEAFV--EDAELRQTLQEDLLRRFPDLNRLAKKFQR ..:. :. .: : ... ::.... :. .. .. : :.. :: .. .. . :... CCDS47 EKLLRLWFTRPTHDLGELSSRLDVIQFFLLPQNLDMAQMLHR-LLGHIKNVPLILKRMKL 270 280 290 300 310 320 400 410 420 430 440 450 pF1KB3 QAANLQDCYRLYQGINQLPNVIQALEKHEG-KHQKLLLAVFVTPLTDLRSDFSKFQEMIE . ....: ::. .: .:: ... . . .: .. .:. .. .: CCDS47 SHTKVSDWQVLYK------TVYSALGLRDACRSLPQSIQLFRDIAQEFSDDLHHIASLIG 330 340 350 360 370 460 470 480 490 500 510 pF1KB3 TTLDMD-QVENHEFLVKPSFDPNLSEL-REIMNDLEKKMQSTLISAARDLGLDPGKQIKL ..:.. .. ...: : :..::...: :..:. . : : .:: . ..: CCDS47 KVVDFEGSLAENRFTVLPNIDPEIDEKKRRLMG-----LPSFLTEVARKELENLDSRIPS 380 390 400 410 420 430 520 530 540 550 560 pF1KB3 DSSAQF---GYYFRVTCKEEKVLRNNKNFSTVD---IQKNGVKFTNSKLTSLNEEYTKNK : . :. . . : .. ... .: .... ... ... :. . CCDS47 CSVIYIPLIGFLLSIPRLPSMVEASDFEINGLDFMFLSEEKLHYRSARTKELDALLGDLH 440 450 460 470 480 490 570 580 590 600 610 620 pF1KB3 TEYEEAQDAIVKEIVNISSGYVEPMQTLNDVLAQLDAVVSFAHVSNGAPVPYVRPAILEK : .. . .. .. . . . . :. ..::.....: : . : :: . CCDS47 CEIRDQETLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALA--SAARDYGYSRPRYSPQ 500 510 520 530 540 550 630 640 650 660 670 680 pF1KB3 GQGRIILKASRHACVEVQDEIAFIPNDVYFEKDKQMFHIITGPNMGGKSTYIRQTGVIVL : . .. .:: .:. . .:.::.. :: ..::::: .::: :..:.:.:.. CCDS47 VLG-VRIQNGRHPLMELCAR-TFVPNSTECGGDKGRVKVITGPNSSGKSIYLKQVGLITF 560 570 580 590 600 610 690 700 710 720 730 740 pF1KB3 MAQIGCFVPCESAEVSIVDCILARVGAGDSQLKGVSTFMAEMLETASILRSATKDSLIII :: .: ::: : ::.. :: :..:. . .: :.:::: .. ..:. . .:: .::..: CCDS47 MALVGSFVPAEEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQVAKAVNNATAQSLVLI 620 630 640 650 660 670 750 760 770 780 790 800 pF1KB3 DELGRGTSTYDGFGLAWAISEYIATKIGAFC--MF-ATHFHELTALA--NQIPTVNNLHV ::.:.::.: ::..: :. .. .. : : .: ::.: :. : : : :. : . CCDS47 DEFGKGTNTVDGLALLAAVLRHWLAR-GPTCPHIFVATNFLSLVQLQLLPQGPLVQYLTM 680 690 700 710 720 810 820 830 840 850 860 pF1KB3 TALTTEETLTMLYQVKKGVCDQSFGIHVAELANFPKHVIECAKQKALELEEFQYIGESQG . . :...::: .:: : . :.: :..: ... .:. CCDS47 ETCEDGNDLVFFYQVCEGVAKASHASHTAAQAGLPDKLVARGKEVSDLIRSGKPIKPVKD 730 740 750 760 770 780 870 880 890 900 910 920 pF1KB3 YDIMEPAAKKCYLEREQGEKIIQEFLSKVKQMPFTEMSEENITIKLKQLKAEVIAKNNSF CCDS47 LLKKNQMENCQTLVDKFMKLDLEDPNLDLNVFMSQEVLPAATSIL 790 800 810 820 830 >>CCDS34410.1 MSH5 gene_id:4439|Hs108|chr6 (835 aa) initn: 382 init1: 242 opt: 544 Z-score: 616.8 bits: 125.3 E(32554): 4.9e-28 Smith-Waterman score: 571; 23.4% identity (57.7% similar) in 735 aa overlap (161-846:61-774) 140 150 160 170 180 pF1KB3 FEDILFGNNDMSASIGVVGVKMSAVDGQRQVGVGYVDSIQRKLGLC-EFPDNDQFSNLEA .:..: :. . . . . ::..... :. CCDS34 PGPREAEEEEVEEEEELAEIHLCVLWNSGYLGIAYYDTSDSTIHFMPDAPDHESLKLLQR 40 50 60 70 80 90 190 200 210 220 230 240 pF1KB3 LLIQIGPKECVLPGGETAGD---MGKLRQIIQRGGIL--ITERKKADFSTKDIYQDLNRL .: .:.:. : . . . .::: . .: : ..::. . : :: CCDS34 VLDEINPQSVVTSAKQDENMTRFLGKLASQEHREPKRPEIIFLPSVDFGLEISKQ---RL 100 110 120 130 140 250 260 270 280 pF1KB3 LKGKKG---EQMN--------SAVLPEMENQVAVSSLSAVIKFL-------ELLSDDSNF :.:. . . :. :...: .. ..: .:....::: :: . . . CCDS34 LSGNYSFIPDAMTATEKILFLSSIIP-FDCLLTVRALGGLLKFLGRRRIGVELEDYNVSV 150 160 170 180 190 200 290 300 310 320 330 pF1KB3 GQFELTTFDFSQYMKLDIAAVRALNLFQGSVEDT-----TGSQ---SLAALLNKCKTPQG . . : ... ...: . .:..:.. . . .: . :: ..::.:. : CCDS34 PILGFKKFMLTHLVNIDQDTYSVLQIFKSESHPSVYKVASGLKEGLSLFGILNRCHCKWG 210 220 230 240 250 260 340 350 360 370 380 390 pF1KB3 QRLVNQWIKQPLMDKNRIEERLNLVEAFV--EDAELRQTLQEDLLRRFPDLNRLAKKFQR ..:. :. .: : ... ::.... :. .. .. : :.. :: .. .. . :... CCDS34 EKLLRLWFTRPTHDLGELSSRLDVIQFFLLPQNLDMAQMLHR-LLGHIKNVPLILKRMKL 270 280 290 300 310 320 400 410 420 430 440 450 pF1KB3 QAANLQDCYRLYQGINQLPNVIQALEKHEG-KHQKLLLAVFVTPLTDLRSDFSKFQEMIE . ....: ::. .: .:: ... . . .: .. .:. .. .: CCDS34 SHTKVSDWQVLYK------TVYSALGLRDACRSLPQSIQLFRDIAQEFSDDLHHIASLIG 330 340 350 360 370 460 470 480 490 500 510 pF1KB3 TTLDMD-QVENHEFLVKPSFDPNLSEL-REIMNDLEKKMQSTLISAARDLGLDPGKQIKL ..:.. .. ...: : :..::...: :..:. . : : .:: . ..: CCDS34 KVVDFEGSLAENRFTVLPNIDPEIDEKKRRLMG-----LPSFLTEVARKELENLDSRIPS 380 390 400 410 420 430 520 530 540 550 560 pF1KB3 DSSAQF---GYYFRVTCKEEKVLRNNKNFSTVD---IQKNGVKFTNSKLTSLNEEYTKNK : . :. . . : .. ... .: .... ... ... :. . CCDS34 CSVIYIPLIGFLLSIPRLPSMVEASDFEINGLDFMFLSEEKLHYRSARTKELDALLGDLH 440 450 460 470 480 490 570 580 590 600 610 620 pF1KB3 TEYEEAQDAIVKEIVNISSGYVEPMQTLNDVLAQLDAVVSFAHVSNGAPVPYVRPAILEK : .. . .. .. . . . . :. ..::.....: : . : :: . CCDS34 CEIRDQETLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALA--SAARDYGYSRPRYSPQ 500 510 520 530 540 550 630 640 650 660 670 680 pF1KB3 GQGRIILKASRHACVEVQDEIAFIPNDVYFEKDKQMFHIITGPNMGGKSTYIRQTGVIVL : . .. .:: .:. . .:.::.. :: ..::::: .::: :..:.:.:.. CCDS34 VLG-VRIQNGRHPLMELCAR-TFVPNSTECGGDKGRVKVITGPNSSGKSIYLKQVGLITF 560 570 580 590 600 610 690 700 710 720 730 740 pF1KB3 MAQIGCFVPCESAEVSIVDCILARVGAGDSQLKGVSTFMAEM-LETASILRSATKDSLII :: .: ::: : ::.. :: :..:. . .: :.:::: .. ..:. . .:: .::.. CCDS34 MALVGSFVPAEEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQQVAKAVNNATAQSLVL 620 630 640 650 660 670 750 760 770 780 790 800 pF1KB3 IDELGRGTSTYDGFGLAWAISEYIATKIGAFC--MF-ATHFHELTALA--NQIPTVNNLH :::.:.::.: ::..: :. .. .. : : .: ::.: :. : : : :. : CCDS34 IDEFGKGTNTVDGLALLAAVLRHWLAR-GPTCPHIFVATNFLSLVQLQLLPQGPLVQYLT 680 690 700 710 720 810 820 830 840 850 860 pF1KB3 VTALTTEETLTMLYQVKKGVCDQSFGIHVAELANFPKHVIECAKQKALELEEFQYIGESQ . . . :...::: .:: : . :.: :..: ... .:. CCDS34 METCEDGNDLVFFYQVCEGVAKASHASHTAAQAGLPDKLVARGKEVSDLIRSGKPIKPVK 730 740 750 760 770 780 870 880 890 900 910 920 pF1KB3 GYDIMEPAAKKCYLEREQGEKIIQEFLSKVKQMPFTEMSEENITIKLKQLKAEVIAKNNS CCDS34 DLLKKNQMENCQTLVDKFMKLDLEDPNLDLNVFMSQEVLPAATSIL 790 800 810 820 830 >>CCDS34409.2 MSH5 gene_id:4439|Hs108|chr6 (822 aa) initn: 324 init1: 242 opt: 500 Z-score: 566.8 bits: 116.0 E(32554): 3e-25 Smith-Waterman score: 504; 23.8% identity (58.5% similar) in 583 aa overlap (267-817:197-762) 240 250 260 270 280 pF1KB3 IYQDLNRLLKGKKGEQMNSAVLPEMENQVAVSSLSAVIKFL-------ELLSDDSNFGQF : .:....::: :: . . . . CCDS34 FLSSIIPFDCLLTPPGDLRFTPIPLLIPSQVRALGGLLKFLGRRRIGVELEDYNVSVPIL 170 180 190 200 210 220 290 300 310 320 330 340 pF1KB3 ELTTFDFSQYMKLDIAAVRALNLFQGSVEDT-----TGSQ---SLAALLNKCKTPQGQRL . : ... ...: . .:..:.. . . .: . :: ..::.:. :..: CCDS34 GFKKFMLTHLVNIDQDTYSVLQIFKSESHPSVYKVASGLKEGLSLFGILNRCHCKWGEKL 230 240 250 260 270 280 350 360 370 380 390 pF1KB3 VNQWIKQPLMDKNRIEERLNLVEAFV--EDAELRQTLQEDLLRRFPDLNRLAKKFQRQAA . :. .: : ... ::.... :. .. .. : :.. :: .. .. . :... . . CCDS34 LRLWFTRPTHDLGELSSRLDVIQFFLLPQNLDMAQMLHR-LLGHIKNVPLILKRMKLSHT 290 300 310 320 330 340 400 410 420 430 440 450 pF1KB3 NLQDCYRLYQGINQLPNVIQALEKHEG-KHQKLLLAVFVTPLTDLRSDFSKFQEMIETTL ...: ::. .: .:: ... . . .: .. .:. .. .: .. CCDS34 KVSDWQVLYK------TVYSALGLRDACRSLPQSIQLFRDIAQEFSDDLHHIASLIGKVV 350 360 370 380 390 460 470 480 490 500 510 pF1KB3 DMD-QVENHEFLVKPSFDPNLSEL-REIMNDLEKKMQSTLISAARDLGLDPGKQIKLDSS :.. .. ...: : :..::...: :..:. . : : .:: . ..: : CCDS34 DFEGSLAENRFTVLPNIDPEIDEKKRRLMG-----LPSFLTEVARKELENLDSRIPSCSV 400 410 420 430 440 450 520 530 540 550 560 570 pF1KB3 AQF---GYYFRVTCKEEKVLRNNKNFSTVD---IQKNGVKFTNSKLTSLNEEYTKNKTEY . :. . . : .. ... .: .... ... ... :. . : CCDS34 IYIPLIGFLLSIPRLPSMVEASDFEINGLDFMFLSEEKLHYRSARTKELDALLGDLHCEI 460 470 480 490 500 510 580 590 600 610 620 630 pF1KB3 EEAQDAIVKEIVNISSGYVEPMQTLNDVLAQLDAVVSFAHVSNGAPVPYVRPAILEKGQG .. . .. .. . . . . :. ..::.....: : . : :: . : CCDS34 RDQETLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALA--SAARDYGYSRPRYSPQVLG 520 530 540 550 560 570 640 650 660 670 680 690 pF1KB3 RIILKASRHACVEVQDEIAFIPNDVYFEKDKQMFHIITGPNMGGKSTYIRQTGVIVLMAQ . .. .:: .:. . .:.::.. :: ..::::: .::: :..:.:.:..:: CCDS34 -VRIQNGRHPLMELCAR-TFVPNSTECGGDKGRVKVITGPNSSGKSIYLKQVGLITFMAL 580 590 600 610 620 630 700 710 720 730 740 pF1KB3 IGCFVPCESAEVSIVDCILARVGAGDSQLKGVSTFMAEM-LETASILRSATKDSLIIIDE .: ::: : ::.. :: :..:. . .: :.:::: .. ..:. . .:: .::..::: CCDS34 VGSFVPAEEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQQVAKAVNNATAQSLVLIDE 640 650 660 670 680 690 750 760 770 780 790 800 pF1KB3 LGRGTSTYDGFGLAWAISEYIATKIGAFC--MF-ATHFHELTALA--NQIPTVNNLHVTA .:.::.: ::..: :. .. .. : : .: ::.: :. : : : :. : . . CCDS34 FGKGTNTVDGLALLAAVLRHWLAR-GPTCPHIFVATNFLSLVQLQLLPQGPLVQYLTMET 700 710 720 730 740 810 820 830 840 850 860 pF1KB3 LTTEETLTMLYQVKKGVCDQSFGIHVAELANFPKHVIECAKQKALELEEFQYIGESQGYD . :...::: CCDS34 CEDGNDLVFFYQVSDLIRSGKPIKPVKDLLKKNQMENCQTLVDKFMKLDLEDPNLDLNVF 750 760 770 780 790 800 934 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 02:25:20 2016 done: Sat Nov 5 02:25:20 2016 Total Scan time: 3.730 Total Display time: 0.250 Function used was FASTA [36.3.4 Apr, 2011]