FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB8501, 936 aa 1>>>pF1KB8501 936 - 936 aa - 936 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.9071+/-0.00125; mu= 9.7553+/- 0.075 mean_var=145.8917+/-29.679, 0's: 0 Z-trim(105.4): 34 B-trim: 125 in 1/51 Lambda= 0.106184 statistics sampled from 8374 (8395) to 8374 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.595), E-opt: 0.2 (0.258), width: 16 Scan time: 4.430 The best scores are: opt bits E(32554) CCDS670.1 MSH4 gene_id:4438|Hs108|chr1 ( 936) 6010 933.4 0 CCDS58709.1 MSH2 gene_id:4436|Hs108|chr2 ( 868) 751 127.8 9.1e-29 CCDS1834.1 MSH2 gene_id:4436|Hs108|chr2 ( 934) 751 127.8 9.7e-29 CCDS34195.1 MSH3 gene_id:4437|Hs108|chr5 (1137) 613 106.7 2.6e-22 CCDS4720.1 MSH5 gene_id:4439|Hs108|chr6 ( 834) 501 89.5 3e-17 CCDS34410.1 MSH5 gene_id:4439|Hs108|chr6 ( 835) 491 87.9 8.6e-17 CCDS34409.2 MSH5 gene_id:4439|Hs108|chr6 ( 822) 452 82.0 5.3e-15 CCDS62907.1 MSH6 gene_id:2956|Hs108|chr2 (1058) 408 75.3 7e-13 CCDS62906.1 MSH6 gene_id:2956|Hs108|chr2 (1230) 408 75.3 8e-13 CCDS1836.1 MSH6 gene_id:2956|Hs108|chr2 (1360) 408 75.3 8.7e-13 >>CCDS670.1 MSH4 gene_id:4438|Hs108|chr1 (936 aa) initn: 6010 init1: 6010 opt: 6010 Z-score: 4983.5 bits: 933.4 E(32554): 0 Smith-Waterman score: 6010; 99.9% identity (100.0% similar) in 936 aa overlap (1-936:1-936) 10 20 30 40 50 60 pF1KB8 MLRPEISSTSPSAPAVSPSSGETRSPQGPRYNFGLQETPQSRPSVQVVSASTCPGTSGAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 MLRPEISSTSPSAPAVSPSSGETRSPQGPRYNFGLQETPQSRPSVQVVSASTCPGTSGAA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB8 GDRSSSSSSLPCPAPNSRPAQGSYFGNKRAYAENTVASNFTFGASSSSARDTNYPQTLKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 GDRSSSSSSLPCPAPNSRPAQGSYFGNKRAYAENTVASNFTFGASSSSARDTNYPQTLKT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB8 PLSTGNPQRSGYKSWTPQVGYSASSSSAISAHSPSVIVAVVEGRGLARGEIGMASIDLKN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 PLSTGNPQRSGYKSWTPQVGYSASSSSAISAHSPSVIVAVVEGRGLARGEIGMASIDLKN 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB8 PQIILSQFADNTTYAKVITKLKILSPLEIIMSNTACAVGNSTKLFTLITENFKNVNFTTI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 PQIILSQFADNTTYAKVITKLKILSPLEIIMSNTACAVGNSTKLFTLITENFKNVNFTTI 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB8 QRKYFNETKGLEYIEQLCIAEFSTVLMEVQSKYYCLAAVAALLKYVEFIQNSVYAPKSLK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 QRKYFNETKGLEYIEQLCIAEFSTVLMEVQSKYYCLAAVAALLKYVEFIQNSVYAPKSLK 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB8 ICFQGSEQTAMIDSSSAQNLELLINNQDYRNNHTLFGVLNYTKTPGGSRRLRSNILEPLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 ICFQGSEQTAMIDSSSAQNLELLINNQDYRNNHTLFGVLNYTKTPGGSRRLRSNILEPLV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB8 DIETVNMRLDCVQELLQDEELFFGLQSVISRFLDTEQLLSVLVQIPKQDTVNAAESKITN ::::.::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 DIETINMRLDCVQELLQDEELFFGLQSVISRFLDTEQLLSVLVQIPKQDTVNAAESKITN 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB8 LIYLKHTLELVDPLKIAMKNCNTPLLRAYYGSLEDKRFGIILEKIKTVINDDARYMKGCL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 LIYLKHTLELVDPLKIAMKNCNTPLLRAYYGSLEDKRFGIILEKIKTVINDDARYMKGCL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB8 NMRTQKCYAVRSNINEFLDIARRTYTEIVDDIAGMISQLGEKYSLPLRTSFSSARGFFIQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 NMRTQKCYAVRSNINEFLDIARRTYTEIVDDIAGMISQLGEKYSLPLRTSFSSARGFFIQ 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB8 MTTDCIALPSDQLPSEFIKISKVKNSYSFTSADLIKMNERCQESLREIYHMTYMIVCKLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 MTTDCIALPSDQLPSEFIKISKVKNSYSFTSADLIKMNERCQESLREIYHMTYMIVCKLL 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB8 SEIYEHIHCLYKLSDTVSMLDMLLSFAHACTLSDYVRPEFTDTLAIKQGWHPILEKISAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 SEIYEHIHCLYKLSDTVSMLDMLLSFAHACTLSDYVRPEFTDTLAIKQGWHPILEKISAE 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB8 KPIANNTYVTEGSNFLIITGPNMSGKSTYLKQIALCQIMAQIGSYVPAEYSSFRIAKQIF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 KPIANNTYVTEGSNFLIITGPNMSGKSTYLKQIALCQIMAQIGSYVPAEYSSFRIAKQIF 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB8 TRISTDDDIETNSSTFMKEMKEIAYILHNANDKSLILIDELGRGTNTEEGIGICYAVCEY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 TRISTDDDIETNSSTFMKEMKEIAYILHNANDKSLILIDELGRGTNTEEGIGICYAVCEY 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB8 LLSLKAFTLFATHFLELCHIDALYPNVENMHFEVQHVKNTSRNKEAILYTYKLSKGLTEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 LLSLKAFTLFATHFLELCHIDALYPNVENMHFEVQHVKNTSRNKEAILYTYKLSKGLTEE 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB8 KNYGLKAAEVSSLPPSIVLDAKEITTQITRQILQNQRSTPEMERQRAVYHLATRLVQTAR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 KNYGLKAAEVSSLPPSIVLDAKEITTQITRQILQNQRSTPEMERQRAVYHLATRLVQTAR 850 860 870 880 890 900 910 920 930 pF1KB8 NSQLDPDSLRIYLSNLKKKYKEDFPRTEQVPEKTEE :::::::::::::::::::::::::::::::::::: CCDS67 NSQLDPDSLRIYLSNLKKKYKEDFPRTEQVPEKTEE 910 920 930 >>CCDS58709.1 MSH2 gene_id:4436|Hs108|chr2 (868 aa) initn: 563 init1: 329 opt: 751 Z-score: 630.0 bits: 127.8 E(32554): 9.1e-29 Smith-Waterman score: 751; 27.0% identity (60.2% similar) in 716 aa overlap (170-863:94-780) 140 150 160 170 180 190 pF1KB8 GYSASSSSAISAHSPSVIVAVVEGRGLARGEIGMASIDLKNPQIILSQFADNTTYAKVIT ..:.. .: . .. : .: :: .... . CCDS58 QFEDILFGNNDMSASIGVVGVKMSAVDGQRQVGVGYVDSIQRKLGLCEFPDNDQFSNLEA 70 80 90 100 110 120 200 210 220 230 240 250 pF1KB8 KLKILSPLEIIM--SNTACAVGNSTKLFT----LITENFKNVNFTT--IQRKYFNETKGL : ..: : .. ..:: .:. ... :::: :...:.: : . :: CCDS58 LLIQIGPKECVLPGGETAGDMGKLRQIIQRGGILITER-KKADFSTKDIYQDLNRLLKG- 130 140 150 160 170 180 260 270 280 290 300 310 pF1KB8 EYIEQLCIAEFSTVLMEVQSKYYCLAAVAALLKYVEFIQNSVYAPKSLKICFQGSEQTAM . ::. :.:: :.... .....:..:..:..... . :. : : CCDS58 KKGEQMN----SAVLPEMENQV-AVSSLSAVIKFLELLSDDSNFGQFELTTFDFS-QYMK 190 200 210 220 230 320 330 340 350 360 370 pF1KB8 IDSSSAQNLELLINN-QDYRNNHTLFGVLNYTKTPGGSRRLRSNILEPLVDIETVNMRLD .: .... :.:. .. .: ....: ..:: ::: :.: . . : .::.: . .. ::. CCDS58 LDIAAVRALNLFQGSVEDTTGSQSLAALLNKCKTPQGQRLVNQWIKQPLMDKNRIEERLN 240 250 260 270 280 290 380 390 400 410 420 pF1KB8 CVQELLQDEELFFGLQ-SVISRFLDTEQLLSVLVQIPKQDTVNAAESKITNLIY--LKHT :. ...: :: :: ... :: : ..: . .. .: ::. . .: ... CCDS58 LVEAFVEDAELRQTLQEDLLRRFPDLNRLAK---KFQRQ----AANLQDCYRLYQGINQL 300 310 320 330 340 430 440 450 460 470 480 pF1KB8 LELVDPLKIAMKNCNTPLLRAYYGSLEDKR--FGIILEKIKTVINDDARYMKGCLNMRTQ .... :. . . :: .. : : : :. . : :.:... : : . CCDS58 PNVIQALEKHEGKHQKLLLAVFVTPLTDLRSDFSKFQEMIETTLD-----MDQVENHEFL 350 360 370 380 390 400 490 500 510 520 530 540 pF1KB8 KCYAVRSNINEFLDIARRTYTEIVDDIAGMISQLGEKYSLPLRTSFSSARGFFIQMTTDC . :..:. .: .. . . . .:: . .. . :. :.....: : CCDS58 VKPSFDPNLSELREIMNDLEKKMQSTLISAARDLGLDPGKQIKLDSSAQFGYYFRVT--C 410 420 430 440 450 460 550 560 570 580 590 600 pF1KB8 IALPSDQLPSEFIKISKVKNSYSFTSADLIKMNERCQESLREIYHMTYMIVCKLLSEIYE . ..: .. ::. .::.. : ..::. .. : . :: .... CCDS58 KEEKVLRNNKNFSTVDIQKNGVKFTNSKLTSLNEEYTKNKTEYEEAQDAIVKEIVNISSG 470 480 490 500 510 520 610 620 630 640 650 pF1KB8 HIHCLYKLSDTVSMLDMLLSFAHACTLSD--YVRPEFTDT----LAIKQGWHPILEKISA ... . :.:....:: ..::::. . . :::: . . . .: . : .: . CCDS58 YVEPMQTLNDVLAQLDAVVSFAHVSNGAPVPYVRPAILEKGQGRIILKASRHACVEVQDE 530 540 550 560 570 580 660 670 680 690 700 710 pF1KB8 EKPIANNTYVTEGSN-FLIITGPNMSGKSTYLKQIALCQIMAQIGSYVPAEYSSFRIAKQ : :..: . .. : :::::::.:::::..: .. .::::: .:: : . :. CCDS58 IAFIPNDVYFEKDKQMFHIITGPNMGGKSTYIRQTGVIVLMAQIGCFVPCESAEVSIVDC 590 600 610 620 630 640 720 730 740 750 760 770 pF1KB8 IFTRISTDDDIETNSSTFMKEMKEIAYILHNANDKSLILIDELGRGTNTEEGIGICYAVC :..:... :. . :::: :: : : ::..:. :::.::::::::.: .:.:. .:. CCDS58 ILARVGAGDSQLKGVSTFMAEMLETASILRSATKDSLIIIDELGRGTSTYDGFGLAWAIS 650 660 670 680 690 700 780 790 800 810 820 830 pF1KB8 EYLLS-LKAFTLFATHFLELCHIDALYPNVENMHFEVQHVKNTSRNKEAILYTYKLSKGL ::. . . :: .::::: :: . :.:.:.: .. ..:.. . :...::. CCDS58 EYIATKIGAFCMFATHFHELTALANQIPTVNNLHV------TALTTEETLTMLYQVKKGV 710 720 730 740 750 840 850 860 870 880 890 pF1KB8 TEEKNYGLKAAEVSSLPPSIVLDAKEITTQITRQILQNQRSTPEMERQRAVYHLATRLVQ .. ..:...::....: .. ::. CCDS58 CDQ-SFGIHVAELANFPKHVIECAKQKALELEEFQYIGESQGYDIMEPAAKKCYLEREQG 760 770 780 790 800 810 >>CCDS1834.1 MSH2 gene_id:4436|Hs108|chr2 (934 aa) initn: 563 init1: 329 opt: 751 Z-score: 629.5 bits: 127.8 E(32554): 9.7e-29 Smith-Waterman score: 751; 27.0% identity (60.2% similar) in 716 aa overlap (170-863:160-846) 140 150 160 170 180 190 pF1KB8 GYSASSSSAISAHSPSVIVAVVEGRGLARGEIGMASIDLKNPQIILSQFADNTTYAKVIT ..:.. .: . .. : .: :: .... . CCDS18 QFEDILFGNNDMSASIGVVGVKMSAVDGQRQVGVGYVDSIQRKLGLCEFPDNDQFSNLEA 130 140 150 160 170 180 200 210 220 230 240 250 pF1KB8 KLKILSPLEIIM--SNTACAVGNSTKLFT----LITENFKNVNFTT--IQRKYFNETKGL : ..: : .. ..:: .:. ... :::: :...:.: : . :: CCDS18 LLIQIGPKECVLPGGETAGDMGKLRQIIQRGGILITER-KKADFSTKDIYQDLNRLLKG- 190 200 210 220 230 240 260 270 280 290 300 310 pF1KB8 EYIEQLCIAEFSTVLMEVQSKYYCLAAVAALLKYVEFIQNSVYAPKSLKICFQGSEQTAM . ::. :.:: :.... .....:..:..:..... . :. : : CCDS18 KKGEQMN----SAVLPEMENQV-AVSSLSAVIKFLELLSDDSNFGQFELTTFDFS-QYMK 250 260 270 280 290 300 320 330 340 350 360 370 pF1KB8 IDSSSAQNLELLINN-QDYRNNHTLFGVLNYTKTPGGSRRLRSNILEPLVDIETVNMRLD .: .... :.:. .. .: ....: ..:: ::: :.: . . : .::.: . .. ::. CCDS18 LDIAAVRALNLFQGSVEDTTGSQSLAALLNKCKTPQGQRLVNQWIKQPLMDKNRIEERLN 310 320 330 340 350 360 380 390 400 410 420 pF1KB8 CVQELLQDEELFFGLQ-SVISRFLDTEQLLSVLVQIPKQDTVNAAESKITNLIY--LKHT :. ...: :: :: ... :: : ..: . .. .: ::. . .: ... CCDS18 LVEAFVEDAELRQTLQEDLLRRFPDLNRLAK---KFQRQ----AANLQDCYRLYQGINQL 370 380 390 400 410 430 440 450 460 470 480 pF1KB8 LELVDPLKIAMKNCNTPLLRAYYGSLEDKR--FGIILEKIKTVINDDARYMKGCLNMRTQ .... :. . . :: .. : : : :. . : :.:... : : . CCDS18 PNVIQALEKHEGKHQKLLLAVFVTPLTDLRSDFSKFQEMIETTLD-----MDQVENHEFL 420 430 440 450 460 490 500 510 520 530 540 pF1KB8 KCYAVRSNINEFLDIARRTYTEIVDDIAGMISQLGEKYSLPLRTSFSSARGFFIQMTTDC . :..:. .: .. . . . .:: . .. . :. :.....: : CCDS18 VKPSFDPNLSELREIMNDLEKKMQSTLISAARDLGLDPGKQIKLDSSAQFGYYFRVT--C 470 480 490 500 510 520 550 560 570 580 590 600 pF1KB8 IALPSDQLPSEFIKISKVKNSYSFTSADLIKMNERCQESLREIYHMTYMIVCKLLSEIYE . ..: .. ::. .::.. : ..::. .. : . :: .... CCDS18 KEEKVLRNNKNFSTVDIQKNGVKFTNSKLTSLNEEYTKNKTEYEEAQDAIVKEIVNISSG 530 540 550 560 570 580 610 620 630 640 650 pF1KB8 HIHCLYKLSDTVSMLDMLLSFAHACTLSD--YVRPEFTDT----LAIKQGWHPILEKISA ... . :.:....:: ..::::. . . :::: . . . .: . : .: . CCDS18 YVEPMQTLNDVLAQLDAVVSFAHVSNGAPVPYVRPAILEKGQGRIILKASRHACVEVQDE 590 600 610 620 630 640 660 670 680 690 700 710 pF1KB8 EKPIANNTYVTEGSN-FLIITGPNMSGKSTYLKQIALCQIMAQIGSYVPAEYSSFRIAKQ : :..: . .. : :::::::.:::::..: .. .::::: .:: : . :. CCDS18 IAFIPNDVYFEKDKQMFHIITGPNMGGKSTYIRQTGVIVLMAQIGCFVPCESAEVSIVDC 650 660 670 680 690 700 720 730 740 750 760 770 pF1KB8 IFTRISTDDDIETNSSTFMKEMKEIAYILHNANDKSLILIDELGRGTNTEEGIGICYAVC :..:... :. . :::: :: : : ::..:. :::.::::::::.: .:.:. .:. CCDS18 ILARVGAGDSQLKGVSTFMAEMLETASILRSATKDSLIIIDELGRGTSTYDGFGLAWAIS 710 720 730 740 750 760 780 790 800 810 820 830 pF1KB8 EYLLS-LKAFTLFATHFLELCHIDALYPNVENMHFEVQHVKNTSRNKEAILYTYKLSKGL ::. . . :: .::::: :: . :.:.:.: .. ..:.. . :...::. CCDS18 EYIATKIGAFCMFATHFHELTALANQIPTVNNLHV------TALTTEETLTMLYQVKKGV 770 780 790 800 810 820 840 850 860 870 880 890 pF1KB8 TEEKNYGLKAAEVSSLPPSIVLDAKEITTQITRQILQNQRSTPEMERQRAVYHLATRLVQ .. ..:...::....: .. ::. CCDS18 CDQ-SFGIHVAELANFPKHVIECAKQKALELEEFQYIGESQGYDIMEPAAKKCYLEREQG 830 840 850 860 870 880 >>CCDS34195.1 MSH3 gene_id:4437|Hs108|chr5 (1137 aa) initn: 619 init1: 385 opt: 613 Z-score: 513.9 bits: 106.7 E(32554): 2.6e-22 Smith-Waterman score: 869; 26.2% identity (63.8% similar) in 740 aa overlap (171-868:388-1093) 150 160 170 180 190 200 pF1KB8 YSASSSSAISAHSPSVIVAVVEGRGLARGEIGMASIDLKNPQIILSQFADNTTYAKVITK ::..... . ......: :... ... :. CCDS34 EIMTDTSTSYLLCISENKENVRDKKKGNIFIGIVGVQPATGEVVFDSFQDSASRSELETR 360 370 380 390 400 410 210 220 230 240 250 pF1KB8 LKILSPLEIIMSNTACAVGNSTKLF----TLITENFKNVNFTTIQRKYFNETKGLEYIEQ .. :.:.:... . :....:. . : .. . . .. ::. ..... . . CCDS34 MSSLQPVELLLPS---ALSEQTEALIHRATSVSVQDDRIRVERMDNIYFEYSHAFQAVTE 420 430 440 450 460 470 260 270 280 290 300 pF1KB8 LCIAEFSTV--------LMEVQSKYYCLAAVAALLKYV-EF-IQNSVYAPKSLKICFQGS . . . ...... : ..::..::. :: ... . :...: .... CCDS34 FYAKDTVDIKGSQIISGIVNLEKPVIC--SLAAIIKYLKEFNLEKMLSKPENFKQ-LSSK 480 490 500 510 520 530 310 320 330 340 350 360 pF1KB8 EQTAMIDSSSAQNLELLINNQDYRNNHTLFGVLNYTKTPGGSRRLRSNILEPLVDIETVN . :.... .:::.: :. :.... .:. ::..::: : :.:.. . .::. .. .: CCDS34 MEFMTINGTTLRNLEILQNQTDMKTKGSLLWVLDHTKTSFGRRKLKKWVTQPLLKLREIN 540 550 560 570 580 590 370 380 390 400 410 420 pF1KB8 MRLDCVQELLQDEELFFG-LQSVISRFLDTEQLLSVLVQIPKQDTVNAAESKITNLIYLK ::: :.:.:..: :: ... . .. : :. : . . :. ... . .: .:: CCDS34 ARLDAVSEVLHSESSVFGQIENHLRKLPDIERGLCSIYH--KKCSTQEFFLIVKTLYHLK 600 610 620 630 640 430 440 450 460 470 480 pF1KB8 HTLELVDPLKIAMKNCNTPLLRAYYGSLEDKRFGIILEKIKTVINDDARYMKGCLNMRTQ .. . : . .. .. :::. .::: : ... .:.: :: .. CCDS34 SEFQAIIP--AVNSHIQSDLLRT-----------VILE-IPELLSPVEHYLK-ILNEQAA 650 660 670 680 690 490 500 510 520 530 pF1KB8 KC---YAVRSNINEFLDIARRT--YTEIVDDIAGMISQLGEKYSLPLRTSFSSARG--FF : . .....: : .: ..:.: .... . . : ... .. : :. CCDS34 KVGDKTELFKDLSDFPLIKKRKDEIQGVIDEIRMHLQEIRKILKNP-SAQYVTVSGQEFM 700 710 720 730 740 750 540 550 560 570 580 590 pF1KB8 IQMTTDCIALPSDQLPSEFIKISKVKNSYSFTSADLIKMNERCQESLREIYHMTYMIVCK :.. .. .. .:....:....: : : ... : : ..::: .. :. CCDS34 IEIKNSAVSC----IPTDWVKVGSTKAVSRFHSPFIVE-NYRHLNQLRE----QLVLDCS 760 770 780 790 800 600 610 620 630 640 650 pF1KB8 -----LLSEIYEHIHCLYKLSDTVSMLDMLLSFAHACTLSDYVRPEFTDT--LAIKQGWH .: .. :: : : : .. .: ..:.:.. .:: :: . ..::.: : CCDS34 AEWLDFLEKFSEHYHSLCKAVHHLATVDCIFSLAKVAKQGDYCRPTVQEERKIVIKNGRH 810 820 830 840 850 860 660 670 680 690 700 pF1KB8 PILEKISAEKP--IANNTYVTEGSN-FLIITGPNMSGKSTYLKQIALCQIMAQIGSYVPA :... . .:. . ::: ..: :. .:::::::.:::.:.::.:: ::::::::::: CCDS34 PVIDVLLGEQDQYVPNNTDLSEDSERVMIITGPNMGGKSSYIKQVALITIMAQIGSYVPA 870 880 890 900 910 920 710 720 730 740 750 760 pF1KB8 EYSSFRIAKQIFTRISTDDDIETNSSTFMKEMKEIAYILHNANDKSLILIDELGRGTNTE : ... :. ::::... :.: ..::::.:. . : :...:...::...:::::::.:. CCDS34 EEATIGIVDGIFTRMGAADNIYKGQSTFMEELTDTAEIIRKATSQSLVILDELGRGTSTH 930 940 950 960 970 980 770 780 790 800 810 820 pF1KB8 EGIGICYAVCEYLL-SLKAFTLFATHFLELCHIDALYPN-VENMHFEVQHVKNTSR---- .::.: ::. ::.. ..:..:::.::. .:... : . : :.:. .. :. CCDS34 DGIAIAYATLEYFIRDVKSLTLFVTHYPPVCELEKNYSHQVGNYHMGFLVSEDESKLDPG 990 1000 1010 1020 1030 1040 830 840 850 860 870 pF1KB8 ----NKEAILYTYKLSKGLTEEKNYGLKAAEVSSLPPSIVLDAKEITTQITRQILQNQRS . . . :....:.. ..:::..:.....: :. : . . .. CCDS34 AAEQVPDFVTFLYQITRGIAA-RSYGLNVAKLADVPGEILKKAAHKSKELEGLINTKRKR 1050 1060 1070 1080 1090 1100 880 890 900 910 920 930 pF1KB8 TPEMERQRAVYHLATRLVQTARNSQLDPDSLRIYLSNLKKKYKEDFPRTEQVPEKTEE CCDS34 LKYFAKLWTMHNAQDLQKWTEEFNMEETQTSLLH 1110 1120 1130 >>CCDS4720.1 MSH5 gene_id:4439|Hs108|chr6 (834 aa) initn: 528 init1: 315 opt: 501 Z-score: 423.2 bits: 89.5 E(32554): 3e-17 Smith-Waterman score: 520; 24.3% identity (57.3% similar) in 602 aa overlap (334-914:253-823) 310 320 330 340 350 360 pF1KB8 QGSEQTAMIDSSSAQNLELLINNQDYRNNHTLFGVLNYTKTPGGSRRLRSNILEPLVDIE .:::.:: . : . :: . .: :. CCDS47 DQDTYSVLQIFKSESHPSVYKVASGLKEGLSLFGILNRCHCKWGEKLLRLWFTRPTHDLG 230 240 250 260 270 280 370 380 390 400 410 420 pF1KB8 TVNMRLDCVQELLQDEELFFGLQSVISRFLDTEQLLSVLVQIPKQDTVNAAESKITNLIY .. ::: .: .: ..: . ... :.: . . .... .. ...:... CCDS47 ELSSRLDVIQFFLLPQNL--DMAQMLHRLLGHIKNVPLILK-----RMKLSHTKVSDWQV 290 300 310 320 330 430 440 450 460 470 480 pF1KB8 LKHTLELVDPLKIAMKNCNTPLLRAYYGSLEDKRFGIILEKIKTVINDDARYMKGCLNMR : .:. . :. : .. : . .. ..:. :..: ..:. . . .: : CCDS47 LYKTVYSALGLRDACRS--LPQSIQLFRDIA-QEFSDDLHHIASLIGKVVDF-EGSL--- 340 350 360 370 380 490 500 510 520 530 540 pF1KB8 TQKCYAVRSNINEFLDIARRTYTEIVDDIAGMISQLGEKYSLPLRTSFSSARGFFIQMTT ... ..: ::. .: .: . ........: : . . : ..: . CCDS47 AENRFTVLPNIDPEIDEKKRRLM----GLPSFLTEVARKELENLDSRIPSCSVIYIPLIG 390 400 410 420 430 440 550 560 570 580 590 pF1KB8 DCIALPSDQLPSEFIKISKVK-NSYSFTSADLIKMNERCQESLR----------EIYHMT ...: .::: ... : . :. .: . :.. : .. . :: . CCDS47 FLLSIP--RLPS-MVEASDFEINGLDFMFLSEEKLHYRSARTKELDALLGDLHCEIRDQE 450 460 470 480 490 500 600 610 620 630 640 pF1KB8 YMIVCKLLSEIYEHIHCLYKLSDTVSMLDMLLSFAHACTLSDYVRPEFTDTLA---IKQG ... .: .. . : .. : .: ::.::..: : : ::... . :..: CCDS47 TLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALASAARDYGYSRPRYSPQVLGVRIQNG 510 520 530 540 550 560 650 660 670 680 690 700 pF1KB8 WHPILEKISAEKPIANNTYVT-EGSNFLIITGPNMSGKSTYLKQIALCQIMAQIGSYVPA ::..: . :. . :.: . . .::::: :::: ::::..: .:: .::.::: CCDS47 RHPLME-LCARTFVPNSTECGGDKGRVKVITGPNSSGKSIYLKQVGLITFMALVGSFVPA 570 580 590 600 610 620 710 720 730 740 750 760 pF1KB8 EYSSFRIAKQIFTRISTDDDIETNSSTFMKEMKEIAYILHNANDKSLILIDELGRGTNTE : . . . ::::: . ..: . :::: .....: ..::. .::.::::.:.:::: CCDS47 EEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQVAKAVNNATAQSLVLIDEFGKGTNTV 630 640 650 660 670 680 770 780 790 800 810 820 pF1KB8 EGIGICYAVCEYLLS---LKAFTLFATHFLELCHIDALY--PNVENMHFEVQHVKNTSRN .:... :: .. :. . ::.:: : ... : : :. . .: : .. CCDS47 DGLALLAAVLRHWLARGPTCPHIFVATNFLSLVQLQLLPQGPLVQYLTME------TCED 690 700 710 720 730 830 840 850 860 870 880 pF1KB8 KEAILYTYKLSKGLTEEKNYGLKAAEVSSLPPSIVLDAKEITTQITRQILQNQRSTPEME . ... :.. .:... .. . ::. ..:: ..: .::.. : . . . .. CCDS47 GNDLVFFYQVCEGVAKASHASHTAAQ-AGLPDKLVARGKEVSDLIRSG--KPIKPVKDLL 740 750 760 770 780 790 890 900 910 920 930 pF1KB8 RQRAVYHLATRLVQTARNSQLDPD-SLRIYLSNLKKKYKEDFPRTEQVPEKTEE .. . . : . . . . ::. .: ...: CCDS47 KKNQMENCQTLVDKFMKLDLEDPNLDLNVFMSQEVLPAATSIL 800 810 820 830 >>CCDS34410.1 MSH5 gene_id:4439|Hs108|chr6 (835 aa) initn: 506 init1: 199 opt: 491 Z-score: 415.0 bits: 87.9 E(32554): 8.6e-17 Smith-Waterman score: 510; 24.2% identity (57.2% similar) in 603 aa overlap (334-914:253-824) 310 320 330 340 350 360 pF1KB8 QGSEQTAMIDSSSAQNLELLINNQDYRNNHTLFGVLNYTKTPGGSRRLRSNILEPLVDIE .:::.:: . : . :: . .: :. CCDS34 DQDTYSVLQIFKSESHPSVYKVASGLKEGLSLFGILNRCHCKWGEKLLRLWFTRPTHDLG 230 240 250 260 270 280 370 380 390 400 410 420 pF1KB8 TVNMRLDCVQELLQDEELFFGLQSVISRFLDTEQLLSVLVQIPKQDTVNAAESKITNLIY .. ::: .: .: ..: . ... :.: . . .... .. ...:... CCDS34 ELSSRLDVIQFFLLPQNL--DMAQMLHRLLGHIKNVPLILK-----RMKLSHTKVSDWQV 290 300 310 320 330 430 440 450 460 470 480 pF1KB8 LKHTLELVDPLKIAMKNCNTPLLRAYYGSLEDKRFGIILEKIKTVINDDARYMKGCLNMR : .:. . :. : .. : . .. ..:. :..: ..:. . . .: : CCDS34 LYKTVYSALGLRDACRS--LPQSIQLFRDIA-QEFSDDLHHIASLIGKVVDF-EGSL--- 340 350 360 370 380 490 500 510 520 530 540 pF1KB8 TQKCYAVRSNINEFLDIARRTYTEIVDDIAGMISQLGEKYSLPLRTSFSSARGFFIQMTT ... ..: ::. .: .: . ........: : . . : ..: . CCDS34 AENRFTVLPNIDPEIDEKKRRLM----GLPSFLTEVARKELENLDSRIPSCSVIYIPLIG 390 400 410 420 430 440 550 560 570 580 590 pF1KB8 DCIALPSDQLPSEFIKISKVK-NSYSFTSADLIKMNERCQESLR----------EIYHMT ...: .::: ... : . :. .: . :.. : .. . :: . CCDS34 FLLSIP--RLPS-MVEASDFEINGLDFMFLSEEKLHYRSARTKELDALLGDLHCEIRDQE 450 460 470 480 490 500 600 610 620 630 640 pF1KB8 YMIVCKLLSEIYEHIHCLYKLSDTVSMLDMLLSFAHACTLSDYVRPEFTDTLA---IKQG ... .: .. . : .. : .: ::.::..: : : ::... . :..: CCDS34 TLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALASAARDYGYSRPRYSPQVLGVRIQNG 510 520 530 540 550 560 650 660 670 680 690 700 pF1KB8 WHPILEKISAEKPIANNTYVT-EGSNFLIITGPNMSGKSTYLKQIALCQIMAQIGSYVPA ::..: . :. . :.: . . .::::: :::: ::::..: .:: .::.::: CCDS34 RHPLME-LCARTFVPNSTECGGDKGRVKVITGPNSSGKSIYLKQVGLITFMALVGSFVPA 570 580 590 600 610 620 710 720 730 740 750 760 pF1KB8 EYSSFRIAKQIFTRISTDDDIETNSSTFMKEM-KEIAYILHNANDKSLILIDELGRGTNT : . . . ::::: . ..: . :::: .. ...: ..::. .::.::::.:.:::: CCDS34 EEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQQVAKAVNNATAQSLVLIDEFGKGTNT 630 640 650 660 670 680 770 780 790 800 810 820 pF1KB8 EEGIGICYAVCEYLLS---LKAFTLFATHFLELCHIDALY--PNVENMHFEVQHVKNTSR .:... :: .. :. . ::.:: : ... : : :. . .: : . CCDS34 VDGLALLAAVLRHWLARGPTCPHIFVATNFLSLVQLQLLPQGPLVQYLTME------TCE 690 700 710 720 730 830 840 850 860 870 880 pF1KB8 NKEAILYTYKLSKGLTEEKNYGLKAAEVSSLPPSIVLDAKEITTQITRQILQNQRSTPEM . . ... :.. .:... .. . ::. ..:: ..: .::.. : . . . .. CCDS34 DGNDLVFFYQVCEGVAKASHASHTAAQ-AGLPDKLVARGKEVSDLIRSG--KPIKPVKDL 740 750 760 770 780 790 890 900 910 920 930 pF1KB8 ERQRAVYHLATRLVQTARNSQLDPD-SLRIYLSNLKKKYKEDFPRTEQVPEKTEE .. . . : . . . . ::. .: ...: CCDS34 LKKNQMENCQTLVDKFMKLDLEDPNLDLNVFMSQEVLPAATSIL 800 810 820 830 >>CCDS34409.2 MSH5 gene_id:4439|Hs108|chr6 (822 aa) initn: 506 init1: 199 opt: 452 Z-score: 382.8 bits: 82.0 E(32554): 5.3e-15 Smith-Waterman score: 471; 25.5% identity (57.3% similar) in 522 aa overlap (334-834:270-763) 310 320 330 340 350 360 pF1KB8 QGSEQTAMIDSSSAQNLELLINNQDYRNNHTLFGVLNYTKTPGGSRRLRSNILEPLVDIE .:::.:: . : . :: . .: :. CCDS34 DQDTYSVLQIFKSESHPSVYKVASGLKEGLSLFGILNRCHCKWGEKLLRLWFTRPTHDLG 240 250 260 270 280 290 370 380 390 400 410 420 pF1KB8 TVNMRLDCVQELLQDEELFFGLQSVISRFLDTEQLLSVLVQIPKQDTVNAAESKITNLIY .. ::: .: .: ..: . ... :.: . . .... .. ...:... CCDS34 ELSSRLDVIQFFLLPQNL--DMAQMLHRLLGHIKNVPLILK-----RMKLSHTKVSDWQV 300 310 320 330 340 350 430 440 450 460 470 480 pF1KB8 LKHTLELVDPLKIAMKNCNTPLLRAYYGSLEDKRFGIILEKIKTVINDDARYMKGCLNMR : .:. . :. : .. : . .. ..:. :..: ..:. . . .: : CCDS34 LYKTVYSALGLRDACRS--LPQSIQLFRDIA-QEFSDDLHHIASLIGKVVDF-EGSL--- 360 370 380 390 400 490 500 510 520 530 540 pF1KB8 TQKCYAVRSNINEFLDIARRTYTEIVDDIAGMISQLGEKYSLPLRTSFSSARGFFIQMTT ... ..: ::. .: .: . ........: : . . : ..: . CCDS34 AENRFTVLPNIDPEIDEKKRRLM----GLPSFLTEVARKELENLDSRIPSCSVIYIPLIG 410 420 430 440 450 460 550 560 570 580 590 pF1KB8 DCIALPSDQLPSEFIKISKVK-NSYSFTSADLIKMNERCQESLR----------EIYHMT ...: .::: ... : . :. .: . :.. : .. . :: . CCDS34 FLLSIP--RLPS-MVEASDFEINGLDFMFLSEEKLHYRSARTKELDALLGDLHCEIRDQE 470 480 490 500 510 600 610 620 630 640 pF1KB8 YMIVCKLLSEIYEHIHCLYKLSDTVSMLDMLLSFAHACTLSDYVRPEFTDTLA---IKQG ... .: .. . : .. : .: ::.::..: : : ::... . :..: CCDS34 TLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALASAARDYGYSRPRYSPQVLGVRIQNG 520 530 540 550 560 570 650 660 670 680 690 700 pF1KB8 WHPILEKISAEKPIANNTYVT-EGSNFLIITGPNMSGKSTYLKQIALCQIMAQIGSYVPA ::..: . :. . :.: . . .::::: :::: ::::..: .:: .::.::: CCDS34 RHPLME-LCARTFVPNSTECGGDKGRVKVITGPNSSGKSIYLKQVGLITFMALVGSFVPA 580 590 600 610 620 630 710 720 730 740 750 760 pF1KB8 EYSSFRIAKQIFTRISTDDDIETNSSTFMKEM-KEIAYILHNANDKSLILIDELGRGTNT : . . . ::::: . ..: . :::: .. ...: ..::. .::.::::.:.:::: CCDS34 EEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQQVAKAVNNATAQSLVLIDEFGKGTNT 640 650 660 670 680 690 770 780 790 800 810 820 pF1KB8 EEGIGICYAVCEYLLS---LKAFTLFATHFLELCHIDALY--PNVENMHFEVQHVKNTSR .:... :: .. :. . ::.:: : ... : : :. . .: : . CCDS34 VDGLALLAAVLRHWLARGPTCPHIFVATNFLSLVQLQLLPQGPLVQYLTME------TCE 700 710 720 730 740 750 830 840 850 860 870 880 pF1KB8 NKEAILYTYKLSKGLTEEKNYGLKAAEVSSLPPSIVLDAKEITTQITRQILQNQRSTPEM . . ... :..: CCDS34 DGNDLVFFYQVSDLIRSGKPIKPVKDLLKKNQMENCQTLVDKFMKLDLEDPNLDLNVFMS 760 770 780 790 800 810 >>CCDS62907.1 MSH6 gene_id:2956|Hs108|chr2 (1058 aa) initn: 480 init1: 309 opt: 408 Z-score: 344.7 bits: 75.3 E(32554): 7e-13 Smith-Waterman score: 543; 25.8% identity (56.3% similar) in 679 aa overlap (276-893:398-1053) 250 260 270 280 290 300 pF1KB8 NETKGLEYIEQLCIAEFSTVLMEVQSKYYCLAAVAALLKYVEFIQNSVYAPKSLKICFQG : ..: . .:. . ...: . .: : : CCDS62 GLTPGEKSELALSALGGCVFYLKKCLIDQELLSMANFEEYIPLDSDTVSTTRSGAI-FTK 370 380 390 400 410 420 310 320 330 340 350 360 pF1KB8 SEQTAMIDSSSAQNLELLINNQDYRNNHTLFGVLNYTKTPGGSRRLRSNILEPLVDIETV . : ..:. . .:::...:. . .. ::. .. .:: :.: :.. . :: . .. CCDS62 AYQRMVLDAVTLNNLEIFLNGTNGSTEGTLLERVDTCHTPFGKRLLKQWLCAPLCNHYAI 430 440 450 460 470 480 370 380 390 400 410 420 pF1KB8 NMRLDCVQELLQDEELFFGLQSVISRFLDTEQLLSVLVQIPKQ-DTVNAAESKITNLIYL : ::: ...:. . . . ..... : :.::: . .. . . : .:. ..: CCDS62 NDRLDAIEDLMVVPDKISEVVELLKKLPDLERLLSKIHNVGSPLKSQNHPDSR--AIMYE 490 500 510 520 530 540 430 440 450 460 470 480 pF1KB8 KHTL---ELVDPLKIAMKNCNTPLLRAYYGSLEDKRFGIILEKIKTVINDDARYMKGCLN . : ...: :. :... . .. : .:. :. . .: ::. ... .: CCDS62 ETTYSKKKIIDFLS-ALEGFK--VMCKIIGIMEEVADGFKSKILKQVISLQTKNPEG--- 550 560 570 580 590 490 500 510 520 530 540 pF1KB8 MRTQKCYAVRSNINEFLDIARRTYTEIVDDIAGMISQLGEKYSLPLRTSFSSARGFFIQM : . . . .: . : .. ::. :. . . .: . .: .. .. CCDS62 -RFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQALA-DIRENEQSLLEYLEKQ 600 610 620 630 640 650 550 560 570 pF1KB8 TT--DC--------------IALPSD----QLPSEF-IKISKVKNSYSFTS------ADL . : . .: . .:: :. .: .: . .:. :.: CCDS62 RNRIGCRTIVYWGIGRNRYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKLANL 660 670 680 690 700 710 580 590 600 610 620 630 pF1KB8 IKMNERCQESLREIYHMTYMIVCKLLSEIYEHIHCLYKLSDTVSMLDMLLSFAHACTLSD :. .:: . ::.. .. .. : .. ..: ...::.:: .:. .: CCDS62 INAEERRDVSLKDCMRRLFYNFDKNYKDWQSAVEC-------IAVLDVLLCLANYSRGGD 720 730 740 750 760 640 650 660 670 pF1KB8 --YVRPEFT---DT---LAIKQGWHPILEK-ISAEKPIANNTYV-------TEGSNF-LI . :: . :: : .: . :: . : . .. : :. . .:. . .. CCDS62 GPMCRPVILLPEDTPPFLELKGSRHPCITKTFFGDDFIPNDILIGCEEEEQENGKAYCVL 770 780 790 800 810 820 680 690 700 710 720 730 pF1KB8 ITGPNMSGKSTYLKQIALCQIMAQIGSYVPAEYSSFRIAKQIFTRISTDDDIETNSSTFM .:::::.:::: ..: .: .:::.: ::::: . ..:::....: : .. :::. CCDS62 VTGPNMGGKSTLMRQAGLLAVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFF 830 840 850 860 870 880 740 750 760 770 780 790 pF1KB8 KEMKEIAYILHNANDKSLILIDELGRGTNTEEGIGICYAVCEYLL-SLKAFTLFATHFLE :..: : :: .:. .::.:.::::::: : .: .: :: . : ..: :::.::. CCDS62 VELSETASILMHATAHSLVLVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHS 890 900 910 920 930 940 800 810 820 830 840 850 pF1KB8 LCHIDALYPNVENMHFEVQHVKNTSRN--KEAILYTYKLSKGLTEEKNYGLKAAEVSSLP : . . :. :. . :.: .. .:.: . ::. :: :.::..::....:: CCDS62 LVEDYSQNVAVRLGHMACM-VENECEDPSQETITFLYKFIKGACP-KSYGFNAARLANLP 950 960 970 980 990 1000 860 870 880 890 900 pF1KB8 PSIVLD----AKEI-----TTQITRQI-LQNQRSTPEMERQRAVYHLATRLVQTARNSQL .. :.:. . .. :.. : ..::: . : ::..: : CCDS62 EEVIQKGHRKAREFEKMNQSLRLFREVCLASERSTVDAE---AVHKLLTLIKEL 1010 1020 1030 1040 1050 910 920 930 pF1KB8 DPDSLRIYLSNLKKKYKEDFPRTEQVPEKTEE >>CCDS62906.1 MSH6 gene_id:2956|Hs108|chr2 (1230 aa) initn: 480 init1: 309 opt: 408 Z-score: 343.7 bits: 75.3 E(32554): 8e-13 Smith-Waterman score: 543; 25.8% identity (56.3% similar) in 679 aa overlap (276-893:570-1225) 250 260 270 280 290 300 pF1KB8 NETKGLEYIEQLCIAEFSTVLMEVQSKYYCLAAVAALLKYVEFIQNSVYAPKSLKICFQG : ..: . .:. . ...: . .: : : CCDS62 GLTPGEKSELALSALGGCVFYLKKCLIDQELLSMANFEEYIPLDSDTVSTTRSGAI-FTK 540 550 560 570 580 590 310 320 330 340 350 360 pF1KB8 SEQTAMIDSSSAQNLELLINNQDYRNNHTLFGVLNYTKTPGGSRRLRSNILEPLVDIETV . : ..:. . .:::...:. . .. ::. .. .:: :.: :.. . :: . .. CCDS62 AYQRMVLDAVTLNNLEIFLNGTNGSTEGTLLERVDTCHTPFGKRLLKQWLCAPLCNHYAI 600 610 620 630 640 650 370 380 390 400 410 420 pF1KB8 NMRLDCVQELLQDEELFFGLQSVISRFLDTEQLLSVLVQIPKQ-DTVNAAESKITNLIYL : ::: ...:. . . . ..... : :.::: . .. . . : .:. ..: CCDS62 NDRLDAIEDLMVVPDKISEVVELLKKLPDLERLLSKIHNVGSPLKSQNHPDSR--AIMYE 660 670 680 690 700 710 430 440 450 460 470 480 pF1KB8 KHTL---ELVDPLKIAMKNCNTPLLRAYYGSLEDKRFGIILEKIKTVINDDARYMKGCLN . : ...: :. :... . .. : .:. :. . .: ::. ... .: CCDS62 ETTYSKKKIIDFLS-ALEGFK--VMCKIIGIMEEVADGFKSKILKQVISLQTKNPEG--- 720 730 740 750 760 770 490 500 510 520 530 540 pF1KB8 MRTQKCYAVRSNINEFLDIARRTYTEIVDDIAGMISQLGEKYSLPLRTSFSSARGFFIQM : . . . .: . : .. ::. :. . . .: . .: .. .. CCDS62 -RFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQALA-DIRENEQSLLEYLEKQ 780 790 800 810 820 550 560 570 pF1KB8 TT--DC--------------IALPSD----QLPSEF-IKISKVKNSYSFTS------ADL . : . .: . .:: :. .: .: . .:. :.: CCDS62 RNRIGCRTIVYWGIGRNRYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKLANL 830 840 850 860 870 880 580 590 600 610 620 630 pF1KB8 IKMNERCQESLREIYHMTYMIVCKLLSEIYEHIHCLYKLSDTVSMLDMLLSFAHACTLSD :. .:: . ::.. .. .. : .. ..: ...::.:: .:. .: CCDS62 INAEERRDVSLKDCMRRLFYNFDKNYKDWQSAVEC-------IAVLDVLLCLANYSRGGD 890 900 910 920 930 940 640 650 660 670 pF1KB8 --YVRPEFT---DT---LAIKQGWHPILEK-ISAEKPIANNTYV-------TEGSNF-LI . :: . :: : .: . :: . : . .. : :. . .:. . .. CCDS62 GPMCRPVILLPEDTPPFLELKGSRHPCITKTFFGDDFIPNDILIGCEEEEQENGKAYCVL 950 960 970 980 990 1000 680 690 700 710 720 730 pF1KB8 ITGPNMSGKSTYLKQIALCQIMAQIGSYVPAEYSSFRIAKQIFTRISTDDDIETNSSTFM .:::::.:::: ..: .: .:::.: ::::: . ..:::....: : .. :::. CCDS62 VTGPNMGGKSTLMRQAGLLAVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFF 1010 1020 1030 1040 1050 1060 740 750 760 770 780 790 pF1KB8 KEMKEIAYILHNANDKSLILIDELGRGTNTEEGIGICYAVCEYLL-SLKAFTLFATHFLE :..: : :: .:. .::.:.::::::: : .: .: :: . : ..: :::.::. CCDS62 VELSETASILMHATAHSLVLVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHS 1070 1080 1090 1100 1110 1120 800 810 820 830 840 850 pF1KB8 LCHIDALYPNVENMHFEVQHVKNTSRN--KEAILYTYKLSKGLTEEKNYGLKAAEVSSLP : . . :. :. . :.: .. .:.: . ::. :: :.::..::....:: CCDS62 LVEDYSQNVAVRLGHMACM-VENECEDPSQETITFLYKFIKGACP-KSYGFNAARLANLP 1130 1140 1150 1160 1170 860 870 880 890 900 pF1KB8 PSIVLD----AKEI-----TTQITRQI-LQNQRSTPEMERQRAVYHLATRLVQTARNSQL .. :.:. . .. :.. : ..::: . : ::..: : CCDS62 EEVIQKGHRKAREFEKMNQSLRLFREVCLASERSTVDAE---AVHKLLTLIKEL 1180 1190 1200 1210 1220 1230 910 920 930 pF1KB8 DPDSLRIYLSNLKKKYKEDFPRTEQVPEKTEE >>CCDS1836.1 MSH6 gene_id:2956|Hs108|chr2 (1360 aa) initn: 480 init1: 309 opt: 408 Z-score: 343.0 bits: 75.3 E(32554): 8.7e-13 Smith-Waterman score: 543; 25.8% identity (56.3% similar) in 679 aa overlap (276-893:700-1355) 250 260 270 280 290 300 pF1KB8 NETKGLEYIEQLCIAEFSTVLMEVQSKYYCLAAVAALLKYVEFIQNSVYAPKSLKICFQG : ..: . .:. . ...: . .: : : CCDS18 GLTPGEKSELALSALGGCVFYLKKCLIDQELLSMANFEEYIPLDSDTVSTTRSGAI-FTK 670 680 690 700 710 720 310 320 330 340 350 360 pF1KB8 SEQTAMIDSSSAQNLELLINNQDYRNNHTLFGVLNYTKTPGGSRRLRSNILEPLVDIETV . : ..:. . .:::...:. . .. ::. .. .:: :.: :.. . :: . .. CCDS18 AYQRMVLDAVTLNNLEIFLNGTNGSTEGTLLERVDTCHTPFGKRLLKQWLCAPLCNHYAI 730 740 750 760 770 780 370 380 390 400 410 420 pF1KB8 NMRLDCVQELLQDEELFFGLQSVISRFLDTEQLLSVLVQIPKQ-DTVNAAESKITNLIYL : ::: ...:. . . . ..... : :.::: . .. . . : .:. ..: CCDS18 NDRLDAIEDLMVVPDKISEVVELLKKLPDLERLLSKIHNVGSPLKSQNHPDSR--AIMYE 790 800 810 820 830 840 430 440 450 460 470 480 pF1KB8 KHTL---ELVDPLKIAMKNCNTPLLRAYYGSLEDKRFGIILEKIKTVINDDARYMKGCLN . : ...: :. :... . .. : .:. :. . .: ::. ... .: CCDS18 ETTYSKKKIIDFLS-ALEGFK--VMCKIIGIMEEVADGFKSKILKQVISLQTKNPEG--- 850 860 870 880 890 900 490 500 510 520 530 540 pF1KB8 MRTQKCYAVRSNINEFLDIARRTYTEIVDDIAGMISQLGEKYSLPLRTSFSSARGFFIQM : . . . .: . : .. ::. :. . . .: . .: .. .. CCDS18 -RFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQALA-DIRENEQSLLEYLEKQ 910 920 930 940 950 550 560 570 pF1KB8 TT--DC--------------IALPSD----QLPSEF-IKISKVKNSYSFTS------ADL . : . .: . .:: :. .: .: . .:. :.: CCDS18 RNRIGCRTIVYWGIGRNRYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKLANL 960 970 980 990 1000 1010 580 590 600 610 620 630 pF1KB8 IKMNERCQESLREIYHMTYMIVCKLLSEIYEHIHCLYKLSDTVSMLDMLLSFAHACTLSD :. .:: . ::.. .. .. : .. ..: ...::.:: .:. .: CCDS18 INAEERRDVSLKDCMRRLFYNFDKNYKDWQSAVEC-------IAVLDVLLCLANYSRGGD 1020 1030 1040 1050 1060 1070 640 650 660 670 pF1KB8 --YVRPEFT---DT---LAIKQGWHPILEK-ISAEKPIANNTYV-------TEGSNF-LI . :: . :: : .: . :: . : . .. : :. . .:. . .. CCDS18 GPMCRPVILLPEDTPPFLELKGSRHPCITKTFFGDDFIPNDILIGCEEEEQENGKAYCVL 1080 1090 1100 1110 1120 1130 680 690 700 710 720 730 pF1KB8 ITGPNMSGKSTYLKQIALCQIMAQIGSYVPAEYSSFRIAKQIFTRISTDDDIETNSSTFM .:::::.:::: ..: .: .:::.: ::::: . ..:::....: : .. :::. CCDS18 VTGPNMGGKSTLMRQAGLLAVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFF 1140 1150 1160 1170 1180 1190 740 750 760 770 780 790 pF1KB8 KEMKEIAYILHNANDKSLILIDELGRGTNTEEGIGICYAVCEYLL-SLKAFTLFATHFLE :..: : :: .:. .::.:.::::::: : .: .: :: . : ..: :::.::. CCDS18 VELSETASILMHATAHSLVLVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHS 1200 1210 1220 1230 1240 1250 800 810 820 830 840 850 pF1KB8 LCHIDALYPNVENMHFEVQHVKNTSRN--KEAILYTYKLSKGLTEEKNYGLKAAEVSSLP : . . :. :. . :.: .. .:.: . ::. :: :.::..::....:: CCDS18 LVEDYSQNVAVRLGHMACM-VENECEDPSQETITFLYKFIKGACP-KSYGFNAARLANLP 1260 1270 1280 1290 1300 860 870 880 890 900 pF1KB8 PSIVLD----AKEI-----TTQITRQI-LQNQRSTPEMERQRAVYHLATRLVQTARNSQL .. :.:. . .. :.. : ..::: . : ::..: : CCDS18 EEVIQKGHRKAREFEKMNQSLRLFREVCLASERSTVDAE---AVHKLLTLIKEL 1310 1320 1330 1340 1350 1360 910 920 930 pF1KB8 DPDSLRIYLSNLKKKYKEDFPRTEQVPEKTEE 936 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 08:11:03 2016 done: Sat Nov 5 08:11:04 2016 Total Scan time: 4.430 Total Display time: 0.280 Function used was FASTA [36.3.4 Apr, 2011]