FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB3091, 934 aa
1>>>pF1KB3091 934 - 934 aa - 934 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.2950+/-0.00139; mu= 16.0279+/- 0.083
mean_var=77.0764+/-14.973, 0's: 0 Z-trim(99.3): 40 B-trim: 0 in 0/49
Lambda= 0.146088
statistics sampled from 5652 (5673) to 5652 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.509), E-opt: 0.2 (0.174), width: 16
Scan time: 3.730
The best scores are: opt bits E(32554)
CCDS1834.1 MSH2 gene_id:4436|Hs108|chr2 ( 934) 6015 1278.4 0
CCDS58709.1 MSH2 gene_id:4436|Hs108|chr2 ( 868) 5587 1188.1 0
CCDS34195.1 MSH3 gene_id:4437|Hs108|chr5 (1137) 778 174.6 9.3e-43
CCDS670.1 MSH4 gene_id:4438|Hs108|chr1 ( 936) 752 169.1 3.5e-41
CCDS62907.1 MSH6 gene_id:2956|Hs108|chr2 (1058) 590 135.0 7.4e-31
CCDS62906.1 MSH6 gene_id:2956|Hs108|chr2 (1230) 590 135.0 8.5e-31
CCDS1836.1 MSH6 gene_id:2956|Hs108|chr2 (1360) 590 135.0 9.3e-31
CCDS4720.1 MSH5 gene_id:4439|Hs108|chr6 ( 834) 554 127.4 1.1e-28
CCDS34410.1 MSH5 gene_id:4439|Hs108|chr6 ( 835) 544 125.3 4.9e-28
CCDS34409.2 MSH5 gene_id:4439|Hs108|chr6 ( 822) 500 116.0 3e-25
>>CCDS1834.1 MSH2 gene_id:4436|Hs108|chr2 (934 aa)
initn: 6015 init1: 6015 opt: 6015 Z-score: 6847.7 bits: 1278.4 E(32554): 0
Smith-Waterman score: 6015; 100.0% identity (100.0% similar) in 934 aa overlap (1-934:1-934)
10 20 30 40 50 60
pF1KB3 MAVQPKETLQLESAAEVGFVRFFQGMPEKPTTTVRLFDRGDFYTAHGEDALLAAREVFKT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 MAVQPKETLQLESAAEVGFVRFFQGMPEKPTTTVRLFDRGDFYTAHGEDALLAAREVFKT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB3 QGVIKYMGPAGAKNLQSVVLSKMNFESFVKDLLLVRQYRVEVYKNRAGNKASKENDWYLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 QGVIKYMGPAGAKNLQSVVLSKMNFESFVKDLLLVRQYRVEVYKNRAGNKASKENDWYLA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB3 YKASPGNLSQFEDILFGNNDMSASIGVVGVKMSAVDGQRQVGVGYVDSIQRKLGLCEFPD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 YKASPGNLSQFEDILFGNNDMSASIGVVGVKMSAVDGQRQVGVGYVDSIQRKLGLCEFPD
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB3 NDQFSNLEALLIQIGPKECVLPGGETAGDMGKLRQIIQRGGILITERKKADFSTKDIYQD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 NDQFSNLEALLIQIGPKECVLPGGETAGDMGKLRQIIQRGGILITERKKADFSTKDIYQD
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB3 LNRLLKGKKGEQMNSAVLPEMENQVAVSSLSAVIKFLELLSDDSNFGQFELTTFDFSQYM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 LNRLLKGKKGEQMNSAVLPEMENQVAVSSLSAVIKFLELLSDDSNFGQFELTTFDFSQYM
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB3 KLDIAAVRALNLFQGSVEDTTGSQSLAALLNKCKTPQGQRLVNQWIKQPLMDKNRIEERL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 KLDIAAVRALNLFQGSVEDTTGSQSLAALLNKCKTPQGQRLVNQWIKQPLMDKNRIEERL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB3 NLVEAFVEDAELRQTLQEDLLRRFPDLNRLAKKFQRQAANLQDCYRLYQGINQLPNVIQA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 NLVEAFVEDAELRQTLQEDLLRRFPDLNRLAKKFQRQAANLQDCYRLYQGINQLPNVIQA
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB3 LEKHEGKHQKLLLAVFVTPLTDLRSDFSKFQEMIETTLDMDQVENHEFLVKPSFDPNLSE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 LEKHEGKHQKLLLAVFVTPLTDLRSDFSKFQEMIETTLDMDQVENHEFLVKPSFDPNLSE
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB3 LREIMNDLEKKMQSTLISAARDLGLDPGKQIKLDSSAQFGYYFRVTCKEEKVLRNNKNFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 LREIMNDLEKKMQSTLISAARDLGLDPGKQIKLDSSAQFGYYFRVTCKEEKVLRNNKNFS
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB3 TVDIQKNGVKFTNSKLTSLNEEYTKNKTEYEEAQDAIVKEIVNISSGYVEPMQTLNDVLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 TVDIQKNGVKFTNSKLTSLNEEYTKNKTEYEEAQDAIVKEIVNISSGYVEPMQTLNDVLA
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB3 QLDAVVSFAHVSNGAPVPYVRPAILEKGQGRIILKASRHACVEVQDEIAFIPNDVYFEKD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 QLDAVVSFAHVSNGAPVPYVRPAILEKGQGRIILKASRHACVEVQDEIAFIPNDVYFEKD
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB3 KQMFHIITGPNMGGKSTYIRQTGVIVLMAQIGCFVPCESAEVSIVDCILARVGAGDSQLK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 KQMFHIITGPNMGGKSTYIRQTGVIVLMAQIGCFVPCESAEVSIVDCILARVGAGDSQLK
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB3 GVSTFMAEMLETASILRSATKDSLIIIDELGRGTSTYDGFGLAWAISEYIATKIGAFCMF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 GVSTFMAEMLETASILRSATKDSLIIIDELGRGTSTYDGFGLAWAISEYIATKIGAFCMF
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB3 ATHFHELTALANQIPTVNNLHVTALTTEETLTMLYQVKKGVCDQSFGIHVAELANFPKHV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 ATHFHELTALANQIPTVNNLHVTALTTEETLTMLYQVKKGVCDQSFGIHVAELANFPKHV
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB3 IECAKQKALELEEFQYIGESQGYDIMEPAAKKCYLEREQGEKIIQEFLSKVKQMPFTEMS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 IECAKQKALELEEFQYIGESQGYDIMEPAAKKCYLEREQGEKIIQEFLSKVKQMPFTEMS
850 860 870 880 890 900
910 920 930
pF1KB3 EENITIKLKQLKAEVIAKNNSFVNEIISRIKVTT
::::::::::::::::::::::::::::::::::
CCDS18 EENITIKLKQLKAEVIAKNNSFVNEIISRIKVTT
910 920 930
>>CCDS58709.1 MSH2 gene_id:4436|Hs108|chr2 (868 aa)
initn: 5587 init1: 5587 opt: 5587 Z-score: 6360.7 bits: 1188.1 E(32554): 0
Smith-Waterman score: 5587; 100.0% identity (100.0% similar) in 868 aa overlap (67-934:1-868)
40 50 60 70 80 90
pF1KB3 FDRGDFYTAHGEDALLAAREVFKTQGVIKYMGPAGAKNLQSVVLSKMNFESFVKDLLLVR
::::::::::::::::::::::::::::::
CCDS58 MGPAGAKNLQSVVLSKMNFESFVKDLLLVR
10 20 30
100 110 120 130 140 150
pF1KB3 QYRVEVYKNRAGNKASKENDWYLAYKASPGNLSQFEDILFGNNDMSASIGVVGVKMSAVD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 QYRVEVYKNRAGNKASKENDWYLAYKASPGNLSQFEDILFGNNDMSASIGVVGVKMSAVD
40 50 60 70 80 90
160 170 180 190 200 210
pF1KB3 GQRQVGVGYVDSIQRKLGLCEFPDNDQFSNLEALLIQIGPKECVLPGGETAGDMGKLRQI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 GQRQVGVGYVDSIQRKLGLCEFPDNDQFSNLEALLIQIGPKECVLPGGETAGDMGKLRQI
100 110 120 130 140 150
220 230 240 250 260 270
pF1KB3 IQRGGILITERKKADFSTKDIYQDLNRLLKGKKGEQMNSAVLPEMENQVAVSSLSAVIKF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 IQRGGILITERKKADFSTKDIYQDLNRLLKGKKGEQMNSAVLPEMENQVAVSSLSAVIKF
160 170 180 190 200 210
280 290 300 310 320 330
pF1KB3 LELLSDDSNFGQFELTTFDFSQYMKLDIAAVRALNLFQGSVEDTTGSQSLAALLNKCKTP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 LELLSDDSNFGQFELTTFDFSQYMKLDIAAVRALNLFQGSVEDTTGSQSLAALLNKCKTP
220 230 240 250 260 270
340 350 360 370 380 390
pF1KB3 QGQRLVNQWIKQPLMDKNRIEERLNLVEAFVEDAELRQTLQEDLLRRFPDLNRLAKKFQR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 QGQRLVNQWIKQPLMDKNRIEERLNLVEAFVEDAELRQTLQEDLLRRFPDLNRLAKKFQR
280 290 300 310 320 330
400 410 420 430 440 450
pF1KB3 QAANLQDCYRLYQGINQLPNVIQALEKHEGKHQKLLLAVFVTPLTDLRSDFSKFQEMIET
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 QAANLQDCYRLYQGINQLPNVIQALEKHEGKHQKLLLAVFVTPLTDLRSDFSKFQEMIET
340 350 360 370 380 390
460 470 480 490 500 510
pF1KB3 TLDMDQVENHEFLVKPSFDPNLSELREIMNDLEKKMQSTLISAARDLGLDPGKQIKLDSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 TLDMDQVENHEFLVKPSFDPNLSELREIMNDLEKKMQSTLISAARDLGLDPGKQIKLDSS
400 410 420 430 440 450
520 530 540 550 560 570
pF1KB3 AQFGYYFRVTCKEEKVLRNNKNFSTVDIQKNGVKFTNSKLTSLNEEYTKNKTEYEEAQDA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 AQFGYYFRVTCKEEKVLRNNKNFSTVDIQKNGVKFTNSKLTSLNEEYTKNKTEYEEAQDA
460 470 480 490 500 510
580 590 600 610 620 630
pF1KB3 IVKEIVNISSGYVEPMQTLNDVLAQLDAVVSFAHVSNGAPVPYVRPAILEKGQGRIILKA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 IVKEIVNISSGYVEPMQTLNDVLAQLDAVVSFAHVSNGAPVPYVRPAILEKGQGRIILKA
520 530 540 550 560 570
640 650 660 670 680 690
pF1KB3 SRHACVEVQDEIAFIPNDVYFEKDKQMFHIITGPNMGGKSTYIRQTGVIVLMAQIGCFVP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 SRHACVEVQDEIAFIPNDVYFEKDKQMFHIITGPNMGGKSTYIRQTGVIVLMAQIGCFVP
580 590 600 610 620 630
700 710 720 730 740 750
pF1KB3 CESAEVSIVDCILARVGAGDSQLKGVSTFMAEMLETASILRSATKDSLIIIDELGRGTST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 CESAEVSIVDCILARVGAGDSQLKGVSTFMAEMLETASILRSATKDSLIIIDELGRGTST
640 650 660 670 680 690
760 770 780 790 800 810
pF1KB3 YDGFGLAWAISEYIATKIGAFCMFATHFHELTALANQIPTVNNLHVTALTTEETLTMLYQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 YDGFGLAWAISEYIATKIGAFCMFATHFHELTALANQIPTVNNLHVTALTTEETLTMLYQ
700 710 720 730 740 750
820 830 840 850 860 870
pF1KB3 VKKGVCDQSFGIHVAELANFPKHVIECAKQKALELEEFQYIGESQGYDIMEPAAKKCYLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 VKKGVCDQSFGIHVAELANFPKHVIECAKQKALELEEFQYIGESQGYDIMEPAAKKCYLE
760 770 780 790 800 810
880 890 900 910 920 930
pF1KB3 REQGEKIIQEFLSKVKQMPFTEMSEENITIKLKQLKAEVIAKNNSFVNEIISRIKVTT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 REQGEKIIQEFLSKVKQMPFTEMSEENITIKLKQLKAEVIAKNNSFVNEIISRIKVTT
820 830 840 850 860
>>CCDS34195.1 MSH3 gene_id:4437|Hs108|chr5 (1137 aa)
initn: 742 init1: 476 opt: 778 Z-score: 881.1 bits: 174.6 E(32554): 9.3e-43
Smith-Waterman score: 871; 28.2% identity (61.2% similar) in 735 aa overlap (161-852:388-1094)
140 150 160 170 180 190
pF1KB3 FEDILFGNNDMSASIGVVGVKMSAVDGQRQVGVGYVDSIQRKLGLCEFPDNDQFSNLEAL
.:. :. .. . : :. . :.::.
CCDS34 EIMTDTSTSYLLCISENKENVRDKKKGNIFIGIVGVQPATGEVVFDSFQDSASRSELETR
360 370 380 390 400 410
200 210 220 230 240
pF1KB3 LIQIGPKECVLPGG---ETAGDMGKLRQI-IQRGGILITERKKADFSTKDIYQDLNRLLK
. .. : : .::.. .: . . . .. .: : . . . : . .: ....
CCDS34 MSSLQPVELLLPSALSEQTEALIHRATSVSVQDDRIRVERMDNIYFEYSHAFQAVTEFYA
420 430 440 450 460 470
250 260 270 280 290
pF1KB3 GK----KGEQMNSAVLPEMENQVAVSSLSAVIKFLE------LLSDDSNFGQFELTTFDF
:: :. :... ..:. : . ::.:.::.:. .:: :: :. . ..:
CCDS34 KDTVDIKGSQIISGIV-NLEKPV-ICSLAAIIKYLKEFNLEKMLSKPENFKQLS-SKMEF
480 490 500 510 520 530
300 310 320 330 340 350
pF1KB3 SQYMKLDIAAVRALNLFQGSVEDTTGSQSLAALLNKCKTPQGQRLVNQWIKQPLMDKNRI
: .. ...: :...:... : . :: .:.. :: :.: ...:. :::. .:
CCDS34 ---MTINGTTLRNLEILQNQT-DMKTKGSLLWVLDHTKTSFGRRKLKKWVTQPLLKLREI
540 550 560 570 580 590
360 370 380 390 400 410
pF1KB3 EERLNLVEAFVEDAELRQTLQEDLLRRFPDLNRLAKKFQRQAANLQDCYRLYQGINQLPN
. ::. : ... :. ::..::..: .. .. . :. . . . . .: .
CCDS34 NARLDAVSEVLHSESSVFGQIENHLRKLPDIERGLCSIYHKKCSTQEFFLIVKTLYHLKS
600 610 620 630 640 650
420 430 440 450 460 470
pF1KB3 VIQALEKHEGKH-QKLLLAVFVTPLTDLRSDFSKFQEMIETTLDMDQVENHEFLVKPSFD
.::. ..: :. :: . . . .: : .. .... . .: .. : :
CCDS34 EFQAIIPAVNSHIQSDLLRTVILEIPELLSPVEHYLKILNE--QAAKVGDKTELFK----
660 670 680 690 700
480 490 500 510 520 530
pF1KB3 PNLSELREIMNDLEKKMQSTLISAARDLGLDPGKQIKLDSSAQFGYYFRVTCKEEKVLRN
.::.. ... . ..:. .:. : . :. ..: . :::. :: . .. . .
CCDS34 -DLSDF-PLIKKRKDEIQG-VIDEIR-MHLQEIRKILKNPSAQY-----VTVSGQEFMIE
710 720 730 740 750
540 550 560 570 580
pF1KB3 NKNFSTVDIQKNGVKFTNSKLTS-LNEEY-TKNKTEYEEAQDAIV----KEIVNISSGYV
:: .. : . :: ..: .: .. . ..: . .. .. .: : ... .
CCDS34 IKNSAVSCIPTDWVKVGSTKAVSRFHSPFIVENYRHLNQLREQLVLDCSAEWLDFLEKFS
760 770 780 790 800 810
590 600 610 620 630 640
pF1KB3 EPMQTLNDV---LAQLDAVVSFAHVSNGAPVPYVRPAILEKGQGRIILKASRHACVEV--
: ...: . :: .: . :.:.:.. . : ::.. : . .:..: .:: ..:
CCDS34 EHYHSLCKAVHHLATVDCIFSLAKVAKQGD--YCRPTVQE--ERKIVIKNGRHPVIDVLL
820 830 840 850 860 870
650 660 670 680 690 700
pF1KB3 --QDEIAFIPNDVYFEKDKQMFHIITGPNMGGKSTYIRQTGVIVLMAQIGCFVPCESAEV
::. ..::.. . .:.. :::::::::::.::.:...:..::::: .:: : : .
CCDS34 GEQDQ--YVPNNTDLSEDSERVMIITGPNMGGKSSYIKQVALITIMAQIGSYVPAEEATI
880 890 900 910 920
710 720 730 740 750 760
pF1KB3 SIVDCILARVGAGDSQLKGVSTFMAEMLETASILRSATKDSLIIIDELGRGTSTYDGFGL
.::: :..:.::.:. :: :::: :. .:: :.:.::..::.:.:::::::::.::...
CCDS34 GIVDGIFTRMGAADNIYKGQSTFMEELTDTAEIIRKATSQSLVILDELGRGTSTHDGIAI
930 940 950 960 970 980
770 780 790 800 810
pF1KB3 AWAISEYIATKIGAFCMFATHFHELTALA-NQIPTVNNLHVTALTTEET-----------
:.: ::. . .. .:.::. . : : :.: :. :..:.
CCDS34 AYATLEYFIRDVKSLTLFVTHYPPVCELEKNYSHQVGNYHMGFLVSEDESKLDPGAAEQV
990 1000 1010 1020 1030 1040
820 830 840 850 860
pF1KB3 ---LTMLYQVKKGVCDQSFGIHVAELANFPKHVIECAKQKALELEEFQYIGESQGYDIME
.:.:::. .:. .:.:..::.::. : .... : .:. :::
CCDS34 PDFVTFLYQITRGIAARSYGLNVAKLADVPGEILKKAAHKSKELEGLINTKRKRLKYFAK
1050 1060 1070 1080 1090 1100
870 880 890 900 910 920
pF1KB3 PAAKKCYLEREQGEKIIQEFLSKVKQMPFTEMSEENITIKLKQLKAEVIAKNNSFVNEII
CCDS34 LWTMHNAQDLQKWTEEFNMEETQTSLLH
1110 1120 1130
>>CCDS670.1 MSH4 gene_id:4438|Hs108|chr1 (936 aa)
initn: 564 init1: 329 opt: 752 Z-score: 852.9 bits: 169.1 E(32554): 3.5e-41
Smith-Waterman score: 752; 27.1% identity (60.1% similar) in 716 aa overlap (160-846:170-863)
130 140 150 160 170 180
pF1KB3 QFEDILFGNNDMSASIGVVGVKMSAVDGQRQVGVGYVDSIQRKLGLCEFPDNDQFSNLEA
..:.. .: . .. : .: :: .... .
CCDS67 GYSASSSSAISAHSPSVIVAVVEGRGLARGEIGMASIDLKNPQIILSQFADNTTYAKVIT
140 150 160 170 180 190
190 200 210 220 230 240
pF1KB3 LLIQIGPKECVLPGGETAGDMGKLRQIIQRGGILITER-KKADFSTKDIYQDLNRLLKGK
: ..: : .. ..:: .:. ... :::: :...:.: : . ::
CCDS67 KLKILSPLEIIM--SNTACAVGNSTKLFT----LITENFKNVNFTT--IQRKYFNETKGL
200 210 220 230 240 250
250 260 270 280 290 300
pF1KB3 KG-EQMN----SAVLPEMENQV-AVSSLSAVIKFLELLSDDSNFGQFELTTFDFS-QYMK
. ::. :.:: :.... .....:..:..:..... . :. : :
CCDS67 EYIEQLCIAEFSTVLMEVQSKYYCLAAVAALLKYVEFIQNSVYAPKSLKICFQGSEQTAM
260 270 280 290 300 310
310 320 330 340 350 360
pF1KB3 LDIAAVRALNLFQGSVEDTTGSQSLAALLNKCKTPQGQRLVNQWIKQPLMDKNRIEERLN
.: .... :.:. .. .: ....: ..:: ::: :.: . . : .::.: . :. ::.
CCDS67 IDSSSAQNLELLINN-QDYRNNHTLFGVLNYTKTPGGSRRLRSNILEPLVDIETINMRLD
320 330 340 350 360 370
370 380 390 400 410
pF1KB3 LVEAFVEDAELRQTLQEDLLRRFPDLNRLAK---KFQRQ----AANLQDCYRLYQGINQL
:. ...: :: :: ... :: : ..: . .. .: ::. . .: ...
CCDS67 CVQELLQDEELFFGLQ-SVISRFLDTEQLLSVLVQIPKQDTVNAAESKITNLIY--LKHT
380 390 400 410 420
420 430 440 450 460
pF1KB3 PNVIQALEKHEGKHQKLLLAVFVTPLTDLRSDFSKFQEMIETTLD-----MDQVENHEFL
.... :. . . :: .. : : : :. . : :.:... : : .
CCDS67 LELVDPLKIAMKNCNTPLLRAYYGSLEDKR--FGIILEKIKTVINDDARYMKGCLNMRTQ
430 440 450 460 470 480
470 480 490 500 510 520
pF1KB3 VKPSFDPNLSELREIMNDLEKKMQSTLISAARDLGLDPGKQIKLDSSAQFGYYFRVT--C
. :..:. .: .. . . . .:: . .. . :. :.....: :
CCDS67 KCYAVRSNINEFLDIARRTYTEIVDDIAGMISQLGEKYSLPLRTSFSSARGFFIQMTTDC
490 500 510 520 530 540
530 540 550 560 570 580
pF1KB3 KEEKVLRNNKNFSTVDIQKNGVKFTNSKLTSLNEEYTKNKTEYEEAQDAIVKEIVNISSG
. ..: .. ::. .::.. : ..::. .. : . :: ....
CCDS67 IALPSDQLPSEFIKISKVKNSYSFTSADLIKMNERCQESLREIYHMTYMIVCKLLSEIYE
550 560 570 580 590 600
590 600 610 620 630 640
pF1KB3 YVEPMQTLNDVLAQLDAVVSFAHVSNGAPVPYVRPAILEKGQGRIILKASRHACVEVQDE
... . :.:....:: ..::::. . . :::: . . . .: . : .: .
CCDS67 HIHCLYKLSDTVSMLDMLLSFAHACTLS--DYVRPEFTDT----LAIKQGWHPILEKISA
610 620 630 640 650
650 660 670 680 690 700
pF1KB3 IAFIPNDVYFEKDKQMFHIITGPNMGGKSTYIRQTGVIVLMAQIGCFVPCESAEVSIVDC
: :..: . .. : :::::::.:::::..: .. .::::: .:: : . :.
CCDS67 EKPIANNTYVTEGSN-FLIITGPNMSGKSTYLKQIALCQIMAQIGSYVPAEYSSFRIAKQ
660 670 680 690 700 710
710 720 730 740 750 760
pF1KB3 ILARVGAGDSQLKGVSTFMAEMLETASILRSATKDSLIIIDELGRGTSTYDGFGLAWAIS
:..:... :. . :::: :: : : ::..:. :::.::::::::.: .:.:. .:.
CCDS67 IFTRISTDDDIETNSSTFMKEMKEIAYILHNANDKSLILIDELGRGTNTEEGIGICYAVC
720 730 740 750 760 770
770 780 790 800 810 820
pF1KB3 EYIATKIGAFCMFATHFHELTALANQIPTVNNLHVTAL------TTEETLTMLYQVKKGV
::. . . :: .::::: :: . :.:.:.: . ..:.. . :...::.
CCDS67 EYLLS-LKAFTLFATHFLELCHIDALYPNVENMHFEVQHVKNTSRNKEAILYTYKLSKGL
780 790 800 810 820 830
830 840 850 860 870 880
pF1KB3 CDQ-SFGIHVAELANFPKHVIECAKQKALELEEFQYIGESQGYDIMEPAAKKCYLEREQG
.. ..:...::....: .. ::.
CCDS67 TEEKNYGLKAAEVSSLPPSIVLDAKEITTQITRQILQNQRSTPEMERQRAVYHLATRLVQ
840 850 860 870 880 890
>>CCDS62907.1 MSH6 gene_id:2956|Hs108|chr2 (1058 aa)
initn: 678 init1: 428 opt: 590 Z-score: 667.5 bits: 135.0 E(32554): 7.4e-31
Smith-Waterman score: 833; 27.8% identity (57.7% similar) in 823 aa overlap (129-853:219-1023)
100 110 120 130 140 150
pF1KB3 RVEVYKNRAGNKASKENDWYLAYKASPGNLSQFEDILFGNNDMSASIGVVGVKMSAVDGQ
.: ..: :. . . : ....: . :..
CCDS62 MMEARCRKMAHISKYDRVVRREICRIITKGTQTYSVLEGDPSENYSKYLLSLKEKEEDSS
190 200 210 220 230 240
160 170 180 190 200 210
pF1KB3 ---RQVGVGYVDSIQRKLGLCEFPDNDQFSNLEALLIQIGPKECVLPGGETAGDM-----
: :: .::. :. . .: :. . : ...:. . : . .. :. . .
CCDS62 GHTRAYGVCFVDTSLGKFFIGQFSDDRHCSRFRTLVAHYPPVQVLFEKGNLSKETKTILK
250 260 270 280 290 300
220 230 240 250
pF1KB3 GKLRQIIQRGGILITERKKADFSTKDIYQD--------------LNRLLKGKKGEQMNSA
..: .:.: : .. :. . . . .. : ..::: .:. . .
CCDS62 SSLSCSLQEGLIPGSQFWDASKTLRTLLEEEYFREKLSDGIGVMLPQVLKGMTSESDSIG
310 320 330 340 350 360
260 270 280 290
pF1KB3 VLPEMENQVAVSSLSAVIKFL-------ELLSDDSNFGQFELTTFD----------FS--
. : ....:.:.:.. . .: :::: .:: .. : :.
CCDS62 LTPGEKSELALSALGGCVFYLKKCLIDQELLSM-ANFEEYIPLDSDTVSTTRSGAIFTKA
370 380 390 400 410 420
300 310 320 330 340 350
pF1KB3 -QYMKLDIAAVRALNLF-QGSVEDTTGSQSLAALLNKCKTPQGQRLVNQWIKQPLMDKNR
: : :: ... :..: .:. .: :. : .. :.:: :.::..::. :: ..
CCDS62 YQRMVLDAVTLNNLEIFLNGTNGSTEGT--LLERVDTCHTPFGKRLLKQWLCAPLCNHYA
430 440 450 460 470 480
360 370 380 390 400 410
pF1KB3 IEERLNLVEAF-VEDAELRQTLQEDLLRRFPDLNRLAKKFQRQAANLQDCYRLYQGINQL
:..::. .: . : .. ... .::...:::.:: .:.. .. :.. ..
CCDS62 INDRLDAIEDLMVVPDKISEVV--ELLKKLPDLERLLSKIHNVGSPLKS--------QNH
490 500 510 520 530
420 430 440 450 460
pF1KB3 PNVIQALEKHEGKHQKLLLAVFVTPLTDLRSDFSKFQEMIETTLD------MDQVENHEF
:. .:. .: ..: . :.. : .. . :. ..: . : . :: . .
CCDS62 PDS-RAIMYEETTYSKKKIIDFLSALEGFKV-MCKIIGIMEEVADGFKSKILKQVISLQT
540 550 560 570 580 590
470 480 490 500 510 520
pF1KB3 LVKPSFDPNLS-ELR--EIMNDLEKKMQSTLIS--AARDLGLDPG-KQIKLDSSAQFGYY
. :.:. :: . : :: .. ::. :. : : . .:. . .. . :
CCDS62 KNPEGRFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQALADIRENEQSLLEYL
600 610 620 630 640 650
530 540 550 560
pF1KB3 F----RVTCKE---EKVLRNN------KNFSTVDIQ-----KNGVKFTNSKLTSLNEEYT
:. :. . :: .::.: .. :. : . :. :.
CCDS62 EKQRNRIGCRTIVYWGIGRNRYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKL
660 670 680 690 700 710
570 580 590 600 610
pF1KB3 KNKTEYEEAQDAIVKEIV-----NISSGYVEPMQTLNDVLAQLDAVVSFAHVSNGAPVPY
: . :: .:. .:. . :....: . :. . .: ::... .:. : :. :.
CCDS62 ANLINAEERRDVSLKDCMRRLFYNFDKNY-KDWQSAVECIAVLDVLLCLANYSRGGDGPM
720 730 740 750 760 770
620 630 640 650 660
pF1KB3 VRPAIL--EKGQGRIILKASRHACVE---VQDEIAFIPNDVYF-------EKDKQMFHII
::.:: : . ::.::: :. :. :::::. . :. : . ..
CCDS62 CRPVILLPEDTPPFLELKGSRHPCITKTFFGDD--FIPNDILIGCEEEEQENGKAYCVLV
780 790 800 810 820 830
670 680 690 700 710 720
pF1KB3 TGPNMGGKSTYIRQTGVIVLMAQIGCFVPCESAEVSIVDCILARVGAGDSQLKGVSTFMA
:::::::::: .::.:....:::.::.:: : ... .: ...:.::.: ..: :::..
CCDS62 TGPNMGGKSTLMRQAGLLAVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFFV
840 850 860 870 880 890
730 740 750 760 770 780
pF1KB3 EMLETASILRSATKDSLIIIDELGRGTSTYDGFGLAWAISEYIATKIGAFCMFATHFHEL
:. :::::: :: ::...:::::::.:.:: ..: :. . .: : .:.::.: :
CCDS62 ELSETASILMHATAHSLVLVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHSL
900 910 920 930 940 950
790 800 810 820 830 840
pF1KB3 TALANQIPTVNNLHVTALT-------TEETLTMLYQVKKGVCDQSFGIHVAELANFPKHV
. .: .: :.. .. ..::.:.::. ::.: .:.:...:.:::.:..:
CCDS62 VEDYSQNVAVRLGHMACMVENECEDPSQETITFLYKFIKGACPKSYGFNAARLANLPEEV
960 970 980 990 1000 1010
850 860 870 880 890 900
pF1KB3 IECAKQKALELEEFQYIGESQGYDIMEPAAKKCYLEREQGEKIIQEFLSKVKQMPFTEMS
:. ...:: :.:.
CCDS62 IQKGHRKAREFEKMNQSLRLFREVCLASERSTVDAEAVHKLLTLIKEL
1020 1030 1040 1050
>>CCDS62906.1 MSH6 gene_id:2956|Hs108|chr2 (1230 aa)
initn: 678 init1: 428 opt: 590 Z-score: 666.4 bits: 135.0 E(32554): 8.5e-31
Smith-Waterman score: 833; 27.8% identity (57.7% similar) in 823 aa overlap (129-853:391-1195)
100 110 120 130 140 150
pF1KB3 RVEVYKNRAGNKASKENDWYLAYKASPGNLSQFEDILFGNNDMSASIGVVGVKMSAVDGQ
.: ..: :. . . : ....: . :..
CCDS62 MMEARCRKMAHISKYDRVVRREICRIITKGTQTYSVLEGDPSENYSKYLLSLKEKEEDSS
370 380 390 400 410 420
160 170 180 190 200 210
pF1KB3 ---RQVGVGYVDSIQRKLGLCEFPDNDQFSNLEALLIQIGPKECVLPGGETAGDM-----
: :: .::. :. . .: :. . : ...:. . : . .. :. . .
CCDS62 GHTRAYGVCFVDTSLGKFFIGQFSDDRHCSRFRTLVAHYPPVQVLFEKGNLSKETKTILK
430 440 450 460 470 480
220 230 240 250
pF1KB3 GKLRQIIQRGGILITERKKADFSTKDIYQD--------------LNRLLKGKKGEQMNSA
..: .:.: : .. :. . . . .. : ..::: .:. . .
CCDS62 SSLSCSLQEGLIPGSQFWDASKTLRTLLEEEYFREKLSDGIGVMLPQVLKGMTSESDSIG
490 500 510 520 530 540
260 270 280 290
pF1KB3 VLPEMENQVAVSSLSAVIKFL-------ELLSDDSNFGQFELTTFD----------FS--
. : ....:.:.:.. . .: :::: .:: .. : :.
CCDS62 LTPGEKSELALSALGGCVFYLKKCLIDQELLSM-ANFEEYIPLDSDTVSTTRSGAIFTKA
550 560 570 580 590
300 310 320 330 340 350
pF1KB3 -QYMKLDIAAVRALNLF-QGSVEDTTGSQSLAALLNKCKTPQGQRLVNQWIKQPLMDKNR
: : :: ... :..: .:. .: :. : .. :.:: :.::..::. :: ..
CCDS62 YQRMVLDAVTLNNLEIFLNGTNGSTEGT--LLERVDTCHTPFGKRLLKQWLCAPLCNHYA
600 610 620 630 640 650
360 370 380 390 400 410
pF1KB3 IEERLNLVEAF-VEDAELRQTLQEDLLRRFPDLNRLAKKFQRQAANLQDCYRLYQGINQL
:..::. .: . : .. ... .::...:::.:: .:.. .. :.. ..
CCDS62 INDRLDAIEDLMVVPDKISEVV--ELLKKLPDLERLLSKIHNVGSPLKS--------QNH
660 670 680 690 700
420 430 440 450 460
pF1KB3 PNVIQALEKHEGKHQKLLLAVFVTPLTDLRSDFSKFQEMIETTLD------MDQVENHEF
:. .:. .: ..: . :.. : .. . :. ..: . : . :: . .
CCDS62 PDS-RAIMYEETTYSKKKIIDFLSALEGFKV-MCKIIGIMEEVADGFKSKILKQVISLQT
710 720 730 740 750 760
470 480 490 500 510 520
pF1KB3 LVKPSFDPNLS-ELR--EIMNDLEKKMQSTLIS--AARDLGLDPG-KQIKLDSSAQFGYY
. :.:. :: . : :: .. ::. :. : : . .:. . .. . :
CCDS62 KNPEGRFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQALADIRENEQSLLEYL
770 780 790 800 810 820
530 540 550 560
pF1KB3 F----RVTCKE---EKVLRNN------KNFSTVDIQ-----KNGVKFTNSKLTSLNEEYT
:. :. . :: .::.: .. :. : . :. :.
CCDS62 EKQRNRIGCRTIVYWGIGRNRYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKL
830 840 850 860 870 880
570 580 590 600 610
pF1KB3 KNKTEYEEAQDAIVKEIV-----NISSGYVEPMQTLNDVLAQLDAVVSFAHVSNGAPVPY
: . :: .:. .:. . :....: . :. . .: ::... .:. : :. :.
CCDS62 ANLINAEERRDVSLKDCMRRLFYNFDKNY-KDWQSAVECIAVLDVLLCLANYSRGGDGPM
890 900 910 920 930 940
620 630 640 650 660
pF1KB3 VRPAIL--EKGQGRIILKASRHACVE---VQDEIAFIPNDVYF-------EKDKQMFHII
::.:: : . ::.::: :. :. :::::. . :. : . ..
CCDS62 CRPVILLPEDTPPFLELKGSRHPCITKTFFGDD--FIPNDILIGCEEEEQENGKAYCVLV
950 960 970 980 990 1000
670 680 690 700 710 720
pF1KB3 TGPNMGGKSTYIRQTGVIVLMAQIGCFVPCESAEVSIVDCILARVGAGDSQLKGVSTFMA
:::::::::: .::.:....:::.::.:: : ... .: ...:.::.: ..: :::..
CCDS62 TGPNMGGKSTLMRQAGLLAVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFFV
1010 1020 1030 1040 1050 1060
730 740 750 760 770 780
pF1KB3 EMLETASILRSATKDSLIIIDELGRGTSTYDGFGLAWAISEYIATKIGAFCMFATHFHEL
:. :::::: :: ::...:::::::.:.:: ..: :. . .: : .:.::.: :
CCDS62 ELSETASILMHATAHSLVLVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHSL
1070 1080 1090 1100 1110 1120
790 800 810 820 830 840
pF1KB3 TALANQIPTVNNLHVTALT-------TEETLTMLYQVKKGVCDQSFGIHVAELANFPKHV
. .: .: :.. .. ..::.:.::. ::.: .:.:...:.:::.:..:
CCDS62 VEDYSQNVAVRLGHMACMVENECEDPSQETITFLYKFIKGACPKSYGFNAARLANLPEEV
1130 1140 1150 1160 1170 1180
850 860 870 880 890 900
pF1KB3 IECAKQKALELEEFQYIGESQGYDIMEPAAKKCYLEREQGEKIIQEFLSKVKQMPFTEMS
:. ...:: :.:.
CCDS62 IQKGHRKAREFEKMNQSLRLFREVCLASERSTVDAEAVHKLLTLIKEL
1190 1200 1210 1220 1230
>>CCDS1836.1 MSH6 gene_id:2956|Hs108|chr2 (1360 aa)
initn: 678 init1: 428 opt: 590 Z-score: 665.7 bits: 135.0 E(32554): 9.3e-31
Smith-Waterman score: 833; 27.8% identity (57.7% similar) in 823 aa overlap (129-853:521-1325)
100 110 120 130 140 150
pF1KB3 RVEVYKNRAGNKASKENDWYLAYKASPGNLSQFEDILFGNNDMSASIGVVGVKMSAVDGQ
.: ..: :. . . : ....: . :..
CCDS18 MMEARCRKMAHISKYDRVVRREICRIITKGTQTYSVLEGDPSENYSKYLLSLKEKEEDSS
500 510 520 530 540 550
160 170 180 190 200 210
pF1KB3 ---RQVGVGYVDSIQRKLGLCEFPDNDQFSNLEALLIQIGPKECVLPGGETAGDM-----
: :: .::. :. . .: :. . : ...:. . : . .. :. . .
CCDS18 GHTRAYGVCFVDTSLGKFFIGQFSDDRHCSRFRTLVAHYPPVQVLFEKGNLSKETKTILK
560 570 580 590 600 610
220 230 240 250
pF1KB3 GKLRQIIQRGGILITERKKADFSTKDIYQD--------------LNRLLKGKKGEQMNSA
..: .:.: : .. :. . . . .. : ..::: .:. . .
CCDS18 SSLSCSLQEGLIPGSQFWDASKTLRTLLEEEYFREKLSDGIGVMLPQVLKGMTSESDSIG
620 630 640 650 660 670
260 270 280 290
pF1KB3 VLPEMENQVAVSSLSAVIKFL-------ELLSDDSNFGQFELTTFD----------FS--
. : ....:.:.:.. . .: :::: .:: .. : :.
CCDS18 LTPGEKSELALSALGGCVFYLKKCLIDQELLSM-ANFEEYIPLDSDTVSTTRSGAIFTKA
680 690 700 710 720
300 310 320 330 340 350
pF1KB3 -QYMKLDIAAVRALNLF-QGSVEDTTGSQSLAALLNKCKTPQGQRLVNQWIKQPLMDKNR
: : :: ... :..: .:. .: :. : .. :.:: :.::..::. :: ..
CCDS18 YQRMVLDAVTLNNLEIFLNGTNGSTEGT--LLERVDTCHTPFGKRLLKQWLCAPLCNHYA
730 740 750 760 770 780
360 370 380 390 400 410
pF1KB3 IEERLNLVEAF-VEDAELRQTLQEDLLRRFPDLNRLAKKFQRQAANLQDCYRLYQGINQL
:..::. .: . : .. ... .::...:::.:: .:.. .. :.. ..
CCDS18 INDRLDAIEDLMVVPDKISEVV--ELLKKLPDLERLLSKIHNVGSPLKS--------QNH
790 800 810 820 830
420 430 440 450 460
pF1KB3 PNVIQALEKHEGKHQKLLLAVFVTPLTDLRSDFSKFQEMIETTLD------MDQVENHEF
:. .:. .: ..: . :.. : .. . :. ..: . : . :: . .
CCDS18 PDS-RAIMYEETTYSKKKIIDFLSALEGFKV-MCKIIGIMEEVADGFKSKILKQVISLQT
840 850 860 870 880 890
470 480 490 500 510 520
pF1KB3 LVKPSFDPNLS-ELR--EIMNDLEKKMQSTLIS--AARDLGLDPG-KQIKLDSSAQFGYY
. :.:. :: . : :: .. ::. :. : : . .:. . .. . :
CCDS18 KNPEGRFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQALADIRENEQSLLEYL
900 910 920 930 940 950
530 540 550 560
pF1KB3 F----RVTCKE---EKVLRNN------KNFSTVDIQ-----KNGVKFTNSKLTSLNEEYT
:. :. . :: .::.: .. :. : . :. :.
CCDS18 EKQRNRIGCRTIVYWGIGRNRYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKL
960 970 980 990 1000 1010
570 580 590 600 610
pF1KB3 KNKTEYEEAQDAIVKEIV-----NISSGYVEPMQTLNDVLAQLDAVVSFAHVSNGAPVPY
: . :: .:. .:. . :....: . :. . .: ::... .:. : :. :.
CCDS18 ANLINAEERRDVSLKDCMRRLFYNFDKNY-KDWQSAVECIAVLDVLLCLANYSRGGDGPM
1020 1030 1040 1050 1060 1070
620 630 640 650 660
pF1KB3 VRPAIL--EKGQGRIILKASRHACVE---VQDEIAFIPNDVYF-------EKDKQMFHII
::.:: : . ::.::: :. :. :::::. . :. : . ..
CCDS18 CRPVILLPEDTPPFLELKGSRHPCITKTFFGDD--FIPNDILIGCEEEEQENGKAYCVLV
1080 1090 1100 1110 1120 1130
670 680 690 700 710 720
pF1KB3 TGPNMGGKSTYIRQTGVIVLMAQIGCFVPCESAEVSIVDCILARVGAGDSQLKGVSTFMA
:::::::::: .::.:....:::.::.:: : ... .: ...:.::.: ..: :::..
CCDS18 TGPNMGGKSTLMRQAGLLAVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFFV
1140 1150 1160 1170 1180 1190
730 740 750 760 770 780
pF1KB3 EMLETASILRSATKDSLIIIDELGRGTSTYDGFGLAWAISEYIATKIGAFCMFATHFHEL
:. :::::: :: ::...:::::::.:.:: ..: :. . .: : .:.::.: :
CCDS18 ELSETASILMHATAHSLVLVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHSL
1200 1210 1220 1230 1240 1250
790 800 810 820 830 840
pF1KB3 TALANQIPTVNNLHVTALT-------TEETLTMLYQVKKGVCDQSFGIHVAELANFPKHV
. .: .: :.. .. ..::.:.::. ::.: .:.:...:.:::.:..:
CCDS18 VEDYSQNVAVRLGHMACMVENECEDPSQETITFLYKFIKGACPKSYGFNAARLANLPEEV
1260 1270 1280 1290 1300 1310
850 860 870 880 890 900
pF1KB3 IECAKQKALELEEFQYIGESQGYDIMEPAAKKCYLEREQGEKIIQEFLSKVKQMPFTEMS
:. ...:: :.:.
CCDS18 IQKGHRKAREFEKMNQSLRLFREVCLASERSTVDAEAVHKLLTLIKEL
1320 1330 1340 1350 1360
>>CCDS4720.1 MSH5 gene_id:4439|Hs108|chr6 (834 aa)
initn: 392 init1: 345 opt: 554 Z-score: 628.2 bits: 127.4 E(32554): 1.1e-28
Smith-Waterman score: 581; 23.4% identity (57.8% similar) in 734 aa overlap (161-846:61-773)
140 150 160 170 180
pF1KB3 FEDILFGNNDMSASIGVVGVKMSAVDGQRQVGVGYVDSIQRKLGLC-EFPDNDQFSNLEA
.:..: :. . . . . ::..... :.
CCDS47 PGPREAEEEEVEEEEELAEIHLCVLWNSGYLGIAYYDTSDSTIHFMPDAPDHESLKLLQR
40 50 60 70 80 90
190 200 210 220 230 240
pF1KB3 LLIQIGPKECVLPGGETAGD---MGKLRQIIQRGGIL--ITERKKADFSTKDIYQDLNRL
.: .:.:. : . . . .::: . .: : ..::. . : ::
CCDS47 VLDEINPQSVVTSAKQDENMTRFLGKLASQEHREPKRPEIIFLPSVDFGLEISKQ---RL
100 110 120 130 140
250 260 270 280
pF1KB3 LKGKKG---EQMN--------SAVLPEMENQVAVSSLSAVIKFL-------ELLSDDSNF
:.:. . . :. :...: .. ..: .:....::: :: . . .
CCDS47 LSGNYSFIPDAMTATEKILFLSSIIP-FDCLLTVRALGGLLKFLGRRRIGVELEDYNVSV
150 160 170 180 190 200
290 300 310 320 330
pF1KB3 GQFELTTFDFSQYMKLDIAAVRALNLFQGSVEDT-----TGSQ---SLAALLNKCKTPQG
. . : ... ...: . .:..:.. . . .: . :: ..::.:. :
CCDS47 PILGFKKFMLTHLVNIDQDTYSVLQIFKSESHPSVYKVASGLKEGLSLFGILNRCHCKWG
210 220 230 240 250 260
340 350 360 370 380 390
pF1KB3 QRLVNQWIKQPLMDKNRIEERLNLVEAFV--EDAELRQTLQEDLLRRFPDLNRLAKKFQR
..:. :. .: : ... ::.... :. .. .. : :.. :: .. .. . :...
CCDS47 EKLLRLWFTRPTHDLGELSSRLDVIQFFLLPQNLDMAQMLHR-LLGHIKNVPLILKRMKL
270 280 290 300 310 320
400 410 420 430 440 450
pF1KB3 QAANLQDCYRLYQGINQLPNVIQALEKHEG-KHQKLLLAVFVTPLTDLRSDFSKFQEMIE
. ....: ::. .: .:: ... . . .: .. .:. .. .:
CCDS47 SHTKVSDWQVLYK------TVYSALGLRDACRSLPQSIQLFRDIAQEFSDDLHHIASLIG
330 340 350 360 370
460 470 480 490 500 510
pF1KB3 TTLDMD-QVENHEFLVKPSFDPNLSEL-REIMNDLEKKMQSTLISAARDLGLDPGKQIKL
..:.. .. ...: : :..::...: :..:. . : : .:: . ..:
CCDS47 KVVDFEGSLAENRFTVLPNIDPEIDEKKRRLMG-----LPSFLTEVARKELENLDSRIPS
380 390 400 410 420 430
520 530 540 550 560
pF1KB3 DSSAQF---GYYFRVTCKEEKVLRNNKNFSTVD---IQKNGVKFTNSKLTSLNEEYTKNK
: . :. . . : .. ... .: .... ... ... :. .
CCDS47 CSVIYIPLIGFLLSIPRLPSMVEASDFEINGLDFMFLSEEKLHYRSARTKELDALLGDLH
440 450 460 470 480 490
570 580 590 600 610 620
pF1KB3 TEYEEAQDAIVKEIVNISSGYVEPMQTLNDVLAQLDAVVSFAHVSNGAPVPYVRPAILEK
: .. . .. .. . . . . :. ..::.....: : . : :: .
CCDS47 CEIRDQETLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALA--SAARDYGYSRPRYSPQ
500 510 520 530 540 550
630 640 650 660 670 680
pF1KB3 GQGRIILKASRHACVEVQDEIAFIPNDVYFEKDKQMFHIITGPNMGGKSTYIRQTGVIVL
: . .. .:: .:. . .:.::.. :: ..::::: .::: :..:.:.:..
CCDS47 VLG-VRIQNGRHPLMELCAR-TFVPNSTECGGDKGRVKVITGPNSSGKSIYLKQVGLITF
560 570 580 590 600 610
690 700 710 720 730 740
pF1KB3 MAQIGCFVPCESAEVSIVDCILARVGAGDSQLKGVSTFMAEMLETASILRSATKDSLIII
:: .: ::: : ::.. :: :..:. . .: :.:::: .. ..:. . .:: .::..:
CCDS47 MALVGSFVPAEEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQVAKAVNNATAQSLVLI
620 630 640 650 660 670
750 760 770 780 790 800
pF1KB3 DELGRGTSTYDGFGLAWAISEYIATKIGAFC--MF-ATHFHELTALA--NQIPTVNNLHV
::.:.::.: ::..: :. .. .. : : .: ::.: :. : : : :. : .
CCDS47 DEFGKGTNTVDGLALLAAVLRHWLAR-GPTCPHIFVATNFLSLVQLQLLPQGPLVQYLTM
680 690 700 710 720
810 820 830 840 850 860
pF1KB3 TALTTEETLTMLYQVKKGVCDQSFGIHVAELANFPKHVIECAKQKALELEEFQYIGESQG
. . :...::: .:: : . :.: :..: ... .:.
CCDS47 ETCEDGNDLVFFYQVCEGVAKASHASHTAAQAGLPDKLVARGKEVSDLIRSGKPIKPVKD
730 740 750 760 770 780
870 880 890 900 910 920
pF1KB3 YDIMEPAAKKCYLEREQGEKIIQEFLSKVKQMPFTEMSEENITIKLKQLKAEVIAKNNSF
CCDS47 LLKKNQMENCQTLVDKFMKLDLEDPNLDLNVFMSQEVLPAATSIL
790 800 810 820 830
>>CCDS34410.1 MSH5 gene_id:4439|Hs108|chr6 (835 aa)
initn: 382 init1: 242 opt: 544 Z-score: 616.8 bits: 125.3 E(32554): 4.9e-28
Smith-Waterman score: 571; 23.4% identity (57.7% similar) in 735 aa overlap (161-846:61-774)
140 150 160 170 180
pF1KB3 FEDILFGNNDMSASIGVVGVKMSAVDGQRQVGVGYVDSIQRKLGLC-EFPDNDQFSNLEA
.:..: :. . . . . ::..... :.
CCDS34 PGPREAEEEEVEEEEELAEIHLCVLWNSGYLGIAYYDTSDSTIHFMPDAPDHESLKLLQR
40 50 60 70 80 90
190 200 210 220 230 240
pF1KB3 LLIQIGPKECVLPGGETAGD---MGKLRQIIQRGGIL--ITERKKADFSTKDIYQDLNRL
.: .:.:. : . . . .::: . .: : ..::. . : ::
CCDS34 VLDEINPQSVVTSAKQDENMTRFLGKLASQEHREPKRPEIIFLPSVDFGLEISKQ---RL
100 110 120 130 140
250 260 270 280
pF1KB3 LKGKKG---EQMN--------SAVLPEMENQVAVSSLSAVIKFL-------ELLSDDSNF
:.:. . . :. :...: .. ..: .:....::: :: . . .
CCDS34 LSGNYSFIPDAMTATEKILFLSSIIP-FDCLLTVRALGGLLKFLGRRRIGVELEDYNVSV
150 160 170 180 190 200
290 300 310 320 330
pF1KB3 GQFELTTFDFSQYMKLDIAAVRALNLFQGSVEDT-----TGSQ---SLAALLNKCKTPQG
. . : ... ...: . .:..:.. . . .: . :: ..::.:. :
CCDS34 PILGFKKFMLTHLVNIDQDTYSVLQIFKSESHPSVYKVASGLKEGLSLFGILNRCHCKWG
210 220 230 240 250 260
340 350 360 370 380 390
pF1KB3 QRLVNQWIKQPLMDKNRIEERLNLVEAFV--EDAELRQTLQEDLLRRFPDLNRLAKKFQR
..:. :. .: : ... ::.... :. .. .. : :.. :: .. .. . :...
CCDS34 EKLLRLWFTRPTHDLGELSSRLDVIQFFLLPQNLDMAQMLHR-LLGHIKNVPLILKRMKL
270 280 290 300 310 320
400 410 420 430 440 450
pF1KB3 QAANLQDCYRLYQGINQLPNVIQALEKHEG-KHQKLLLAVFVTPLTDLRSDFSKFQEMIE
. ....: ::. .: .:: ... . . .: .. .:. .. .:
CCDS34 SHTKVSDWQVLYK------TVYSALGLRDACRSLPQSIQLFRDIAQEFSDDLHHIASLIG
330 340 350 360 370
460 470 480 490 500 510
pF1KB3 TTLDMD-QVENHEFLVKPSFDPNLSEL-REIMNDLEKKMQSTLISAARDLGLDPGKQIKL
..:.. .. ...: : :..::...: :..:. . : : .:: . ..:
CCDS34 KVVDFEGSLAENRFTVLPNIDPEIDEKKRRLMG-----LPSFLTEVARKELENLDSRIPS
380 390 400 410 420 430
520 530 540 550 560
pF1KB3 DSSAQF---GYYFRVTCKEEKVLRNNKNFSTVD---IQKNGVKFTNSKLTSLNEEYTKNK
: . :. . . : .. ... .: .... ... ... :. .
CCDS34 CSVIYIPLIGFLLSIPRLPSMVEASDFEINGLDFMFLSEEKLHYRSARTKELDALLGDLH
440 450 460 470 480 490
570 580 590 600 610 620
pF1KB3 TEYEEAQDAIVKEIVNISSGYVEPMQTLNDVLAQLDAVVSFAHVSNGAPVPYVRPAILEK
: .. . .. .. . . . . :. ..::.....: : . : :: .
CCDS34 CEIRDQETLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALA--SAARDYGYSRPRYSPQ
500 510 520 530 540 550
630 640 650 660 670 680
pF1KB3 GQGRIILKASRHACVEVQDEIAFIPNDVYFEKDKQMFHIITGPNMGGKSTYIRQTGVIVL
: . .. .:: .:. . .:.::.. :: ..::::: .::: :..:.:.:..
CCDS34 VLG-VRIQNGRHPLMELCAR-TFVPNSTECGGDKGRVKVITGPNSSGKSIYLKQVGLITF
560 570 580 590 600 610
690 700 710 720 730 740
pF1KB3 MAQIGCFVPCESAEVSIVDCILARVGAGDSQLKGVSTFMAEM-LETASILRSATKDSLII
:: .: ::: : ::.. :: :..:. . .: :.:::: .. ..:. . .:: .::..
CCDS34 MALVGSFVPAEEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQQVAKAVNNATAQSLVL
620 630 640 650 660 670
750 760 770 780 790 800
pF1KB3 IDELGRGTSTYDGFGLAWAISEYIATKIGAFC--MF-ATHFHELTALA--NQIPTVNNLH
:::.:.::.: ::..: :. .. .. : : .: ::.: :. : : : :. :
CCDS34 IDEFGKGTNTVDGLALLAAVLRHWLAR-GPTCPHIFVATNFLSLVQLQLLPQGPLVQYLT
680 690 700 710 720
810 820 830 840 850 860
pF1KB3 VTALTTEETLTMLYQVKKGVCDQSFGIHVAELANFPKHVIECAKQKALELEEFQYIGESQ
. . . :...::: .:: : . :.: :..: ... .:.
CCDS34 METCEDGNDLVFFYQVCEGVAKASHASHTAAQAGLPDKLVARGKEVSDLIRSGKPIKPVK
730 740 750 760 770 780
870 880 890 900 910 920
pF1KB3 GYDIMEPAAKKCYLEREQGEKIIQEFLSKVKQMPFTEMSEENITIKLKQLKAEVIAKNNS
CCDS34 DLLKKNQMENCQTLVDKFMKLDLEDPNLDLNVFMSQEVLPAATSIL
790 800 810 820 830
>>CCDS34409.2 MSH5 gene_id:4439|Hs108|chr6 (822 aa)
initn: 324 init1: 242 opt: 500 Z-score: 566.8 bits: 116.0 E(32554): 3e-25
Smith-Waterman score: 504; 23.8% identity (58.5% similar) in 583 aa overlap (267-817:197-762)
240 250 260 270 280
pF1KB3 IYQDLNRLLKGKKGEQMNSAVLPEMENQVAVSSLSAVIKFL-------ELLSDDSNFGQF
: .:....::: :: . . . .
CCDS34 FLSSIIPFDCLLTPPGDLRFTPIPLLIPSQVRALGGLLKFLGRRRIGVELEDYNVSVPIL
170 180 190 200 210 220
290 300 310 320 330 340
pF1KB3 ELTTFDFSQYMKLDIAAVRALNLFQGSVEDT-----TGSQ---SLAALLNKCKTPQGQRL
. : ... ...: . .:..:.. . . .: . :: ..::.:. :..:
CCDS34 GFKKFMLTHLVNIDQDTYSVLQIFKSESHPSVYKVASGLKEGLSLFGILNRCHCKWGEKL
230 240 250 260 270 280
350 360 370 380 390
pF1KB3 VNQWIKQPLMDKNRIEERLNLVEAFV--EDAELRQTLQEDLLRRFPDLNRLAKKFQRQAA
. :. .: : ... ::.... :. .. .. : :.. :: .. .. . :... . .
CCDS34 LRLWFTRPTHDLGELSSRLDVIQFFLLPQNLDMAQMLHR-LLGHIKNVPLILKRMKLSHT
290 300 310 320 330 340
400 410 420 430 440 450
pF1KB3 NLQDCYRLYQGINQLPNVIQALEKHEG-KHQKLLLAVFVTPLTDLRSDFSKFQEMIETTL
...: ::. .: .:: ... . . .: .. .:. .. .: ..
CCDS34 KVSDWQVLYK------TVYSALGLRDACRSLPQSIQLFRDIAQEFSDDLHHIASLIGKVV
350 360 370 380 390
460 470 480 490 500 510
pF1KB3 DMD-QVENHEFLVKPSFDPNLSEL-REIMNDLEKKMQSTLISAARDLGLDPGKQIKLDSS
:.. .. ...: : :..::...: :..:. . : : .:: . ..: :
CCDS34 DFEGSLAENRFTVLPNIDPEIDEKKRRLMG-----LPSFLTEVARKELENLDSRIPSCSV
400 410 420 430 440 450
520 530 540 550 560 570
pF1KB3 AQF---GYYFRVTCKEEKVLRNNKNFSTVD---IQKNGVKFTNSKLTSLNEEYTKNKTEY
. :. . . : .. ... .: .... ... ... :. . :
CCDS34 IYIPLIGFLLSIPRLPSMVEASDFEINGLDFMFLSEEKLHYRSARTKELDALLGDLHCEI
460 470 480 490 500 510
580 590 600 610 620 630
pF1KB3 EEAQDAIVKEIVNISSGYVEPMQTLNDVLAQLDAVVSFAHVSNGAPVPYVRPAILEKGQG
.. . .. .. . . . . :. ..::.....: : . : :: . :
CCDS34 RDQETLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALA--SAARDYGYSRPRYSPQVLG
520 530 540 550 560 570
640 650 660 670 680 690
pF1KB3 RIILKASRHACVEVQDEIAFIPNDVYFEKDKQMFHIITGPNMGGKSTYIRQTGVIVLMAQ
. .. .:: .:. . .:.::.. :: ..::::: .::: :..:.:.:..::
CCDS34 -VRIQNGRHPLMELCAR-TFVPNSTECGGDKGRVKVITGPNSSGKSIYLKQVGLITFMAL
580 590 600 610 620 630
700 710 720 730 740
pF1KB3 IGCFVPCESAEVSIVDCILARVGAGDSQLKGVSTFMAEM-LETASILRSATKDSLIIIDE
.: ::: : ::.. :: :..:. . .: :.:::: .. ..:. . .:: .::..:::
CCDS34 VGSFVPAEEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQQVAKAVNNATAQSLVLIDE
640 650 660 670 680 690
750 760 770 780 790 800
pF1KB3 LGRGTSTYDGFGLAWAISEYIATKIGAFC--MF-ATHFHELTALA--NQIPTVNNLHVTA
.:.::.: ::..: :. .. .. : : .: ::.: :. : : : :. : . .
CCDS34 FGKGTNTVDGLALLAAVLRHWLAR-GPTCPHIFVATNFLSLVQLQLLPQGPLVQYLTMET
700 710 720 730 740
810 820 830 840 850 860
pF1KB3 LTTEETLTMLYQVKKGVCDQSFGIHVAELANFPKHVIECAKQKALELEEFQYIGESQGYD
. :...:::
CCDS34 CEDGNDLVFFYQVSDLIRSGKPIKPVKDLLKKNQMENCQTLVDKFMKLDLEDPNLDLNVF
750 760 770 780 790 800
934 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 02:25:20 2016 done: Sat Nov 5 02:25:20 2016
Total Scan time: 3.730 Total Display time: 0.250
Function used was FASTA [36.3.4 Apr, 2011]