FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB8501, 936 aa
1>>>pF1KB8501 936 - 936 aa - 936 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.9071+/-0.00125; mu= 9.7553+/- 0.075
mean_var=145.8917+/-29.679, 0's: 0 Z-trim(105.4): 34 B-trim: 125 in 1/51
Lambda= 0.106184
statistics sampled from 8374 (8395) to 8374 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.595), E-opt: 0.2 (0.258), width: 16
Scan time: 4.430
The best scores are: opt bits E(32554)
CCDS670.1 MSH4 gene_id:4438|Hs108|chr1 ( 936) 6010 933.4 0
CCDS58709.1 MSH2 gene_id:4436|Hs108|chr2 ( 868) 751 127.8 9.1e-29
CCDS1834.1 MSH2 gene_id:4436|Hs108|chr2 ( 934) 751 127.8 9.7e-29
CCDS34195.1 MSH3 gene_id:4437|Hs108|chr5 (1137) 613 106.7 2.6e-22
CCDS4720.1 MSH5 gene_id:4439|Hs108|chr6 ( 834) 501 89.5 3e-17
CCDS34410.1 MSH5 gene_id:4439|Hs108|chr6 ( 835) 491 87.9 8.6e-17
CCDS34409.2 MSH5 gene_id:4439|Hs108|chr6 ( 822) 452 82.0 5.3e-15
CCDS62907.1 MSH6 gene_id:2956|Hs108|chr2 (1058) 408 75.3 7e-13
CCDS62906.1 MSH6 gene_id:2956|Hs108|chr2 (1230) 408 75.3 8e-13
CCDS1836.1 MSH6 gene_id:2956|Hs108|chr2 (1360) 408 75.3 8.7e-13
>>CCDS670.1 MSH4 gene_id:4438|Hs108|chr1 (936 aa)
initn: 6010 init1: 6010 opt: 6010 Z-score: 4983.5 bits: 933.4 E(32554): 0
Smith-Waterman score: 6010; 99.9% identity (100.0% similar) in 936 aa overlap (1-936:1-936)
10 20 30 40 50 60
pF1KB8 MLRPEISSTSPSAPAVSPSSGETRSPQGPRYNFGLQETPQSRPSVQVVSASTCPGTSGAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 MLRPEISSTSPSAPAVSPSSGETRSPQGPRYNFGLQETPQSRPSVQVVSASTCPGTSGAA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB8 GDRSSSSSSLPCPAPNSRPAQGSYFGNKRAYAENTVASNFTFGASSSSARDTNYPQTLKT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 GDRSSSSSSLPCPAPNSRPAQGSYFGNKRAYAENTVASNFTFGASSSSARDTNYPQTLKT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB8 PLSTGNPQRSGYKSWTPQVGYSASSSSAISAHSPSVIVAVVEGRGLARGEIGMASIDLKN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 PLSTGNPQRSGYKSWTPQVGYSASSSSAISAHSPSVIVAVVEGRGLARGEIGMASIDLKN
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB8 PQIILSQFADNTTYAKVITKLKILSPLEIIMSNTACAVGNSTKLFTLITENFKNVNFTTI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 PQIILSQFADNTTYAKVITKLKILSPLEIIMSNTACAVGNSTKLFTLITENFKNVNFTTI
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB8 QRKYFNETKGLEYIEQLCIAEFSTVLMEVQSKYYCLAAVAALLKYVEFIQNSVYAPKSLK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 QRKYFNETKGLEYIEQLCIAEFSTVLMEVQSKYYCLAAVAALLKYVEFIQNSVYAPKSLK
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB8 ICFQGSEQTAMIDSSSAQNLELLINNQDYRNNHTLFGVLNYTKTPGGSRRLRSNILEPLV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 ICFQGSEQTAMIDSSSAQNLELLINNQDYRNNHTLFGVLNYTKTPGGSRRLRSNILEPLV
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB8 DIETVNMRLDCVQELLQDEELFFGLQSVISRFLDTEQLLSVLVQIPKQDTVNAAESKITN
::::.:::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 DIETINMRLDCVQELLQDEELFFGLQSVISRFLDTEQLLSVLVQIPKQDTVNAAESKITN
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB8 LIYLKHTLELVDPLKIAMKNCNTPLLRAYYGSLEDKRFGIILEKIKTVINDDARYMKGCL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 LIYLKHTLELVDPLKIAMKNCNTPLLRAYYGSLEDKRFGIILEKIKTVINDDARYMKGCL
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB8 NMRTQKCYAVRSNINEFLDIARRTYTEIVDDIAGMISQLGEKYSLPLRTSFSSARGFFIQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 NMRTQKCYAVRSNINEFLDIARRTYTEIVDDIAGMISQLGEKYSLPLRTSFSSARGFFIQ
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB8 MTTDCIALPSDQLPSEFIKISKVKNSYSFTSADLIKMNERCQESLREIYHMTYMIVCKLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 MTTDCIALPSDQLPSEFIKISKVKNSYSFTSADLIKMNERCQESLREIYHMTYMIVCKLL
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB8 SEIYEHIHCLYKLSDTVSMLDMLLSFAHACTLSDYVRPEFTDTLAIKQGWHPILEKISAE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 SEIYEHIHCLYKLSDTVSMLDMLLSFAHACTLSDYVRPEFTDTLAIKQGWHPILEKISAE
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB8 KPIANNTYVTEGSNFLIITGPNMSGKSTYLKQIALCQIMAQIGSYVPAEYSSFRIAKQIF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 KPIANNTYVTEGSNFLIITGPNMSGKSTYLKQIALCQIMAQIGSYVPAEYSSFRIAKQIF
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB8 TRISTDDDIETNSSTFMKEMKEIAYILHNANDKSLILIDELGRGTNTEEGIGICYAVCEY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 TRISTDDDIETNSSTFMKEMKEIAYILHNANDKSLILIDELGRGTNTEEGIGICYAVCEY
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB8 LLSLKAFTLFATHFLELCHIDALYPNVENMHFEVQHVKNTSRNKEAILYTYKLSKGLTEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 LLSLKAFTLFATHFLELCHIDALYPNVENMHFEVQHVKNTSRNKEAILYTYKLSKGLTEE
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB8 KNYGLKAAEVSSLPPSIVLDAKEITTQITRQILQNQRSTPEMERQRAVYHLATRLVQTAR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 KNYGLKAAEVSSLPPSIVLDAKEITTQITRQILQNQRSTPEMERQRAVYHLATRLVQTAR
850 860 870 880 890 900
910 920 930
pF1KB8 NSQLDPDSLRIYLSNLKKKYKEDFPRTEQVPEKTEE
::::::::::::::::::::::::::::::::::::
CCDS67 NSQLDPDSLRIYLSNLKKKYKEDFPRTEQVPEKTEE
910 920 930
>>CCDS58709.1 MSH2 gene_id:4436|Hs108|chr2 (868 aa)
initn: 563 init1: 329 opt: 751 Z-score: 630.0 bits: 127.8 E(32554): 9.1e-29
Smith-Waterman score: 751; 27.0% identity (60.2% similar) in 716 aa overlap (170-863:94-780)
140 150 160 170 180 190
pF1KB8 GYSASSSSAISAHSPSVIVAVVEGRGLARGEIGMASIDLKNPQIILSQFADNTTYAKVIT
..:.. .: . .. : .: :: .... .
CCDS58 QFEDILFGNNDMSASIGVVGVKMSAVDGQRQVGVGYVDSIQRKLGLCEFPDNDQFSNLEA
70 80 90 100 110 120
200 210 220 230 240 250
pF1KB8 KLKILSPLEIIM--SNTACAVGNSTKLFT----LITENFKNVNFTT--IQRKYFNETKGL
: ..: : .. ..:: .:. ... :::: :...:.: : . ::
CCDS58 LLIQIGPKECVLPGGETAGDMGKLRQIIQRGGILITER-KKADFSTKDIYQDLNRLLKG-
130 140 150 160 170 180
260 270 280 290 300 310
pF1KB8 EYIEQLCIAEFSTVLMEVQSKYYCLAAVAALLKYVEFIQNSVYAPKSLKICFQGSEQTAM
. ::. :.:: :.... .....:..:..:..... . :. : :
CCDS58 KKGEQMN----SAVLPEMENQV-AVSSLSAVIKFLELLSDDSNFGQFELTTFDFS-QYMK
190 200 210 220 230
320 330 340 350 360 370
pF1KB8 IDSSSAQNLELLINN-QDYRNNHTLFGVLNYTKTPGGSRRLRSNILEPLVDIETVNMRLD
.: .... :.:. .. .: ....: ..:: ::: :.: . . : .::.: . .. ::.
CCDS58 LDIAAVRALNLFQGSVEDTTGSQSLAALLNKCKTPQGQRLVNQWIKQPLMDKNRIEERLN
240 250 260 270 280 290
380 390 400 410 420
pF1KB8 CVQELLQDEELFFGLQ-SVISRFLDTEQLLSVLVQIPKQDTVNAAESKITNLIY--LKHT
:. ...: :: :: ... :: : ..: . .. .: ::. . .: ...
CCDS58 LVEAFVEDAELRQTLQEDLLRRFPDLNRLAK---KFQRQ----AANLQDCYRLYQGINQL
300 310 320 330 340
430 440 450 460 470 480
pF1KB8 LELVDPLKIAMKNCNTPLLRAYYGSLEDKR--FGIILEKIKTVINDDARYMKGCLNMRTQ
.... :. . . :: .. : : : :. . : :.:... : : .
CCDS58 PNVIQALEKHEGKHQKLLLAVFVTPLTDLRSDFSKFQEMIETTLD-----MDQVENHEFL
350 360 370 380 390 400
490 500 510 520 530 540
pF1KB8 KCYAVRSNINEFLDIARRTYTEIVDDIAGMISQLGEKYSLPLRTSFSSARGFFIQMTTDC
. :..:. .: .. . . . .:: . .. . :. :.....: :
CCDS58 VKPSFDPNLSELREIMNDLEKKMQSTLISAARDLGLDPGKQIKLDSSAQFGYYFRVT--C
410 420 430 440 450 460
550 560 570 580 590 600
pF1KB8 IALPSDQLPSEFIKISKVKNSYSFTSADLIKMNERCQESLREIYHMTYMIVCKLLSEIYE
. ..: .. ::. .::.. : ..::. .. : . :: ....
CCDS58 KEEKVLRNNKNFSTVDIQKNGVKFTNSKLTSLNEEYTKNKTEYEEAQDAIVKEIVNISSG
470 480 490 500 510 520
610 620 630 640 650
pF1KB8 HIHCLYKLSDTVSMLDMLLSFAHACTLSD--YVRPEFTDT----LAIKQGWHPILEKISA
... . :.:....:: ..::::. . . :::: . . . .: . : .: .
CCDS58 YVEPMQTLNDVLAQLDAVVSFAHVSNGAPVPYVRPAILEKGQGRIILKASRHACVEVQDE
530 540 550 560 570 580
660 670 680 690 700 710
pF1KB8 EKPIANNTYVTEGSN-FLIITGPNMSGKSTYLKQIALCQIMAQIGSYVPAEYSSFRIAKQ
: :..: . .. : :::::::.:::::..: .. .::::: .:: : . :.
CCDS58 IAFIPNDVYFEKDKQMFHIITGPNMGGKSTYIRQTGVIVLMAQIGCFVPCESAEVSIVDC
590 600 610 620 630 640
720 730 740 750 760 770
pF1KB8 IFTRISTDDDIETNSSTFMKEMKEIAYILHNANDKSLILIDELGRGTNTEEGIGICYAVC
:..:... :. . :::: :: : : ::..:. :::.::::::::.: .:.:. .:.
CCDS58 ILARVGAGDSQLKGVSTFMAEMLETASILRSATKDSLIIIDELGRGTSTYDGFGLAWAIS
650 660 670 680 690 700
780 790 800 810 820 830
pF1KB8 EYLLS-LKAFTLFATHFLELCHIDALYPNVENMHFEVQHVKNTSRNKEAILYTYKLSKGL
::. . . :: .::::: :: . :.:.:.: .. ..:.. . :...::.
CCDS58 EYIATKIGAFCMFATHFHELTALANQIPTVNNLHV------TALTTEETLTMLYQVKKGV
710 720 730 740 750
840 850 860 870 880 890
pF1KB8 TEEKNYGLKAAEVSSLPPSIVLDAKEITTQITRQILQNQRSTPEMERQRAVYHLATRLVQ
.. ..:...::....: .. ::.
CCDS58 CDQ-SFGIHVAELANFPKHVIECAKQKALELEEFQYIGESQGYDIMEPAAKKCYLEREQG
760 770 780 790 800 810
>>CCDS1834.1 MSH2 gene_id:4436|Hs108|chr2 (934 aa)
initn: 563 init1: 329 opt: 751 Z-score: 629.5 bits: 127.8 E(32554): 9.7e-29
Smith-Waterman score: 751; 27.0% identity (60.2% similar) in 716 aa overlap (170-863:160-846)
140 150 160 170 180 190
pF1KB8 GYSASSSSAISAHSPSVIVAVVEGRGLARGEIGMASIDLKNPQIILSQFADNTTYAKVIT
..:.. .: . .. : .: :: .... .
CCDS18 QFEDILFGNNDMSASIGVVGVKMSAVDGQRQVGVGYVDSIQRKLGLCEFPDNDQFSNLEA
130 140 150 160 170 180
200 210 220 230 240 250
pF1KB8 KLKILSPLEIIM--SNTACAVGNSTKLFT----LITENFKNVNFTT--IQRKYFNETKGL
: ..: : .. ..:: .:. ... :::: :...:.: : . ::
CCDS18 LLIQIGPKECVLPGGETAGDMGKLRQIIQRGGILITER-KKADFSTKDIYQDLNRLLKG-
190 200 210 220 230 240
260 270 280 290 300 310
pF1KB8 EYIEQLCIAEFSTVLMEVQSKYYCLAAVAALLKYVEFIQNSVYAPKSLKICFQGSEQTAM
. ::. :.:: :.... .....:..:..:..... . :. : :
CCDS18 KKGEQMN----SAVLPEMENQV-AVSSLSAVIKFLELLSDDSNFGQFELTTFDFS-QYMK
250 260 270 280 290 300
320 330 340 350 360 370
pF1KB8 IDSSSAQNLELLINN-QDYRNNHTLFGVLNYTKTPGGSRRLRSNILEPLVDIETVNMRLD
.: .... :.:. .. .: ....: ..:: ::: :.: . . : .::.: . .. ::.
CCDS18 LDIAAVRALNLFQGSVEDTTGSQSLAALLNKCKTPQGQRLVNQWIKQPLMDKNRIEERLN
310 320 330 340 350 360
380 390 400 410 420
pF1KB8 CVQELLQDEELFFGLQ-SVISRFLDTEQLLSVLVQIPKQDTVNAAESKITNLIY--LKHT
:. ...: :: :: ... :: : ..: . .. .: ::. . .: ...
CCDS18 LVEAFVEDAELRQTLQEDLLRRFPDLNRLAK---KFQRQ----AANLQDCYRLYQGINQL
370 380 390 400 410
430 440 450 460 470 480
pF1KB8 LELVDPLKIAMKNCNTPLLRAYYGSLEDKR--FGIILEKIKTVINDDARYMKGCLNMRTQ
.... :. . . :: .. : : : :. . : :.:... : : .
CCDS18 PNVIQALEKHEGKHQKLLLAVFVTPLTDLRSDFSKFQEMIETTLD-----MDQVENHEFL
420 430 440 450 460
490 500 510 520 530 540
pF1KB8 KCYAVRSNINEFLDIARRTYTEIVDDIAGMISQLGEKYSLPLRTSFSSARGFFIQMTTDC
. :..:. .: .. . . . .:: . .. . :. :.....: :
CCDS18 VKPSFDPNLSELREIMNDLEKKMQSTLISAARDLGLDPGKQIKLDSSAQFGYYFRVT--C
470 480 490 500 510 520
550 560 570 580 590 600
pF1KB8 IALPSDQLPSEFIKISKVKNSYSFTSADLIKMNERCQESLREIYHMTYMIVCKLLSEIYE
. ..: .. ::. .::.. : ..::. .. : . :: ....
CCDS18 KEEKVLRNNKNFSTVDIQKNGVKFTNSKLTSLNEEYTKNKTEYEEAQDAIVKEIVNISSG
530 540 550 560 570 580
610 620 630 640 650
pF1KB8 HIHCLYKLSDTVSMLDMLLSFAHACTLSD--YVRPEFTDT----LAIKQGWHPILEKISA
... . :.:....:: ..::::. . . :::: . . . .: . : .: .
CCDS18 YVEPMQTLNDVLAQLDAVVSFAHVSNGAPVPYVRPAILEKGQGRIILKASRHACVEVQDE
590 600 610 620 630 640
660 670 680 690 700 710
pF1KB8 EKPIANNTYVTEGSN-FLIITGPNMSGKSTYLKQIALCQIMAQIGSYVPAEYSSFRIAKQ
: :..: . .. : :::::::.:::::..: .. .::::: .:: : . :.
CCDS18 IAFIPNDVYFEKDKQMFHIITGPNMGGKSTYIRQTGVIVLMAQIGCFVPCESAEVSIVDC
650 660 670 680 690 700
720 730 740 750 760 770
pF1KB8 IFTRISTDDDIETNSSTFMKEMKEIAYILHNANDKSLILIDELGRGTNTEEGIGICYAVC
:..:... :. . :::: :: : : ::..:. :::.::::::::.: .:.:. .:.
CCDS18 ILARVGAGDSQLKGVSTFMAEMLETASILRSATKDSLIIIDELGRGTSTYDGFGLAWAIS
710 720 730 740 750 760
780 790 800 810 820 830
pF1KB8 EYLLS-LKAFTLFATHFLELCHIDALYPNVENMHFEVQHVKNTSRNKEAILYTYKLSKGL
::. . . :: .::::: :: . :.:.:.: .. ..:.. . :...::.
CCDS18 EYIATKIGAFCMFATHFHELTALANQIPTVNNLHV------TALTTEETLTMLYQVKKGV
770 780 790 800 810 820
840 850 860 870 880 890
pF1KB8 TEEKNYGLKAAEVSSLPPSIVLDAKEITTQITRQILQNQRSTPEMERQRAVYHLATRLVQ
.. ..:...::....: .. ::.
CCDS18 CDQ-SFGIHVAELANFPKHVIECAKQKALELEEFQYIGESQGYDIMEPAAKKCYLEREQG
830 840 850 860 870 880
>>CCDS34195.1 MSH3 gene_id:4437|Hs108|chr5 (1137 aa)
initn: 619 init1: 385 opt: 613 Z-score: 513.9 bits: 106.7 E(32554): 2.6e-22
Smith-Waterman score: 869; 26.2% identity (63.8% similar) in 740 aa overlap (171-868:388-1093)
150 160 170 180 190 200
pF1KB8 YSASSSSAISAHSPSVIVAVVEGRGLARGEIGMASIDLKNPQIILSQFADNTTYAKVITK
::..... . ......: :... ... :.
CCDS34 EIMTDTSTSYLLCISENKENVRDKKKGNIFIGIVGVQPATGEVVFDSFQDSASRSELETR
360 370 380 390 400 410
210 220 230 240 250
pF1KB8 LKILSPLEIIMSNTACAVGNSTKLF----TLITENFKNVNFTTIQRKYFNETKGLEYIEQ
.. :.:.:... . :....:. . : .. . . .. ::. ..... . .
CCDS34 MSSLQPVELLLPS---ALSEQTEALIHRATSVSVQDDRIRVERMDNIYFEYSHAFQAVTE
420 430 440 450 460 470
260 270 280 290 300
pF1KB8 LCIAEFSTV--------LMEVQSKYYCLAAVAALLKYV-EF-IQNSVYAPKSLKICFQGS
. . . ...... : ..::..::. :: ... . :...: ....
CCDS34 FYAKDTVDIKGSQIISGIVNLEKPVIC--SLAAIIKYLKEFNLEKMLSKPENFKQ-LSSK
480 490 500 510 520 530
310 320 330 340 350 360
pF1KB8 EQTAMIDSSSAQNLELLINNQDYRNNHTLFGVLNYTKTPGGSRRLRSNILEPLVDIETVN
. :.... .:::.: :. :.... .:. ::..::: : :.:.. . .::. .. .:
CCDS34 MEFMTINGTTLRNLEILQNQTDMKTKGSLLWVLDHTKTSFGRRKLKKWVTQPLLKLREIN
540 550 560 570 580 590
370 380 390 400 410 420
pF1KB8 MRLDCVQELLQDEELFFG-LQSVISRFLDTEQLLSVLVQIPKQDTVNAAESKITNLIYLK
::: :.:.:..: :: ... . .. : :. : . . :. ... . .: .::
CCDS34 ARLDAVSEVLHSESSVFGQIENHLRKLPDIERGLCSIYH--KKCSTQEFFLIVKTLYHLK
600 610 620 630 640
430 440 450 460 470 480
pF1KB8 HTLELVDPLKIAMKNCNTPLLRAYYGSLEDKRFGIILEKIKTVINDDARYMKGCLNMRTQ
.. . : . .. .. :::. .::: : ... .:.: :: ..
CCDS34 SEFQAIIP--AVNSHIQSDLLRT-----------VILE-IPELLSPVEHYLK-ILNEQAA
650 660 670 680 690
490 500 510 520 530
pF1KB8 KC---YAVRSNINEFLDIARRT--YTEIVDDIAGMISQLGEKYSLPLRTSFSSARG--FF
: . .....: : .: ..:.: .... . . : ... .. : :.
CCDS34 KVGDKTELFKDLSDFPLIKKRKDEIQGVIDEIRMHLQEIRKILKNP-SAQYVTVSGQEFM
700 710 720 730 740 750
540 550 560 570 580 590
pF1KB8 IQMTTDCIALPSDQLPSEFIKISKVKNSYSFTSADLIKMNERCQESLREIYHMTYMIVCK
:.. .. .. .:....:....: : : ... : : ..::: .. :.
CCDS34 IEIKNSAVSC----IPTDWVKVGSTKAVSRFHSPFIVE-NYRHLNQLRE----QLVLDCS
760 770 780 790 800
600 610 620 630 640 650
pF1KB8 -----LLSEIYEHIHCLYKLSDTVSMLDMLLSFAHACTLSDYVRPEFTDT--LAIKQGWH
.: .. :: : : : .. .: ..:.:.. .:: :: . ..::.: :
CCDS34 AEWLDFLEKFSEHYHSLCKAVHHLATVDCIFSLAKVAKQGDYCRPTVQEERKIVIKNGRH
810 820 830 840 850 860
660 670 680 690 700
pF1KB8 PILEKISAEKP--IANNTYVTEGSN-FLIITGPNMSGKSTYLKQIALCQIMAQIGSYVPA
:... . .:. . ::: ..: :. .:::::::.:::.:.::.:: :::::::::::
CCDS34 PVIDVLLGEQDQYVPNNTDLSEDSERVMIITGPNMGGKSSYIKQVALITIMAQIGSYVPA
870 880 890 900 910 920
710 720 730 740 750 760
pF1KB8 EYSSFRIAKQIFTRISTDDDIETNSSTFMKEMKEIAYILHNANDKSLILIDELGRGTNTE
: ... :. ::::... :.: ..::::.:. . : :...:...::...:::::::.:.
CCDS34 EEATIGIVDGIFTRMGAADNIYKGQSTFMEELTDTAEIIRKATSQSLVILDELGRGTSTH
930 940 950 960 970 980
770 780 790 800 810 820
pF1KB8 EGIGICYAVCEYLL-SLKAFTLFATHFLELCHIDALYPN-VENMHFEVQHVKNTSR----
.::.: ::. ::.. ..:..:::.::. .:... : . : :.:. .. :.
CCDS34 DGIAIAYATLEYFIRDVKSLTLFVTHYPPVCELEKNYSHQVGNYHMGFLVSEDESKLDPG
990 1000 1010 1020 1030 1040
830 840 850 860 870
pF1KB8 ----NKEAILYTYKLSKGLTEEKNYGLKAAEVSSLPPSIVLDAKEITTQITRQILQNQRS
. . . :....:.. ..:::..:.....: :. : . . ..
CCDS34 AAEQVPDFVTFLYQITRGIAA-RSYGLNVAKLADVPGEILKKAAHKSKELEGLINTKRKR
1050 1060 1070 1080 1090 1100
880 890 900 910 920 930
pF1KB8 TPEMERQRAVYHLATRLVQTARNSQLDPDSLRIYLSNLKKKYKEDFPRTEQVPEKTEE
CCDS34 LKYFAKLWTMHNAQDLQKWTEEFNMEETQTSLLH
1110 1120 1130
>>CCDS4720.1 MSH5 gene_id:4439|Hs108|chr6 (834 aa)
initn: 528 init1: 315 opt: 501 Z-score: 423.2 bits: 89.5 E(32554): 3e-17
Smith-Waterman score: 520; 24.3% identity (57.3% similar) in 602 aa overlap (334-914:253-823)
310 320 330 340 350 360
pF1KB8 QGSEQTAMIDSSSAQNLELLINNQDYRNNHTLFGVLNYTKTPGGSRRLRSNILEPLVDIE
.:::.:: . : . :: . .: :.
CCDS47 DQDTYSVLQIFKSESHPSVYKVASGLKEGLSLFGILNRCHCKWGEKLLRLWFTRPTHDLG
230 240 250 260 270 280
370 380 390 400 410 420
pF1KB8 TVNMRLDCVQELLQDEELFFGLQSVISRFLDTEQLLSVLVQIPKQDTVNAAESKITNLIY
.. ::: .: .: ..: . ... :.: . . .... .. ...:...
CCDS47 ELSSRLDVIQFFLLPQNL--DMAQMLHRLLGHIKNVPLILK-----RMKLSHTKVSDWQV
290 300 310 320 330
430 440 450 460 470 480
pF1KB8 LKHTLELVDPLKIAMKNCNTPLLRAYYGSLEDKRFGIILEKIKTVINDDARYMKGCLNMR
: .:. . :. : .. : . .. ..:. :..: ..:. . . .: :
CCDS47 LYKTVYSALGLRDACRS--LPQSIQLFRDIA-QEFSDDLHHIASLIGKVVDF-EGSL---
340 350 360 370 380
490 500 510 520 530 540
pF1KB8 TQKCYAVRSNINEFLDIARRTYTEIVDDIAGMISQLGEKYSLPLRTSFSSARGFFIQMTT
... ..: ::. .: .: . ........: : . . : ..: .
CCDS47 AENRFTVLPNIDPEIDEKKRRLM----GLPSFLTEVARKELENLDSRIPSCSVIYIPLIG
390 400 410 420 430 440
550 560 570 580 590
pF1KB8 DCIALPSDQLPSEFIKISKVK-NSYSFTSADLIKMNERCQESLR----------EIYHMT
...: .::: ... : . :. .: . :.. : .. . :: .
CCDS47 FLLSIP--RLPS-MVEASDFEINGLDFMFLSEEKLHYRSARTKELDALLGDLHCEIRDQE
450 460 470 480 490 500
600 610 620 630 640
pF1KB8 YMIVCKLLSEIYEHIHCLYKLSDTVSMLDMLLSFAHACTLSDYVRPEFTDTLA---IKQG
... .: .. . : .. : .: ::.::..: : : ::... . :..:
CCDS47 TLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALASAARDYGYSRPRYSPQVLGVRIQNG
510 520 530 540 550 560
650 660 670 680 690 700
pF1KB8 WHPILEKISAEKPIANNTYVT-EGSNFLIITGPNMSGKSTYLKQIALCQIMAQIGSYVPA
::..: . :. . :.: . . .::::: :::: ::::..: .:: .::.:::
CCDS47 RHPLME-LCARTFVPNSTECGGDKGRVKVITGPNSSGKSIYLKQVGLITFMALVGSFVPA
570 580 590 600 610 620
710 720 730 740 750 760
pF1KB8 EYSSFRIAKQIFTRISTDDDIETNSSTFMKEMKEIAYILHNANDKSLILIDELGRGTNTE
: . . . ::::: . ..: . :::: .....: ..::. .::.::::.:.::::
CCDS47 EEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQVAKAVNNATAQSLVLIDEFGKGTNTV
630 640 650 660 670 680
770 780 790 800 810 820
pF1KB8 EGIGICYAVCEYLLS---LKAFTLFATHFLELCHIDALY--PNVENMHFEVQHVKNTSRN
.:... :: .. :. . ::.:: : ... : : :. . .: : ..
CCDS47 DGLALLAAVLRHWLARGPTCPHIFVATNFLSLVQLQLLPQGPLVQYLTME------TCED
690 700 710 720 730
830 840 850 860 870 880
pF1KB8 KEAILYTYKLSKGLTEEKNYGLKAAEVSSLPPSIVLDAKEITTQITRQILQNQRSTPEME
. ... :.. .:... .. . ::. ..:: ..: .::.. : . . . ..
CCDS47 GNDLVFFYQVCEGVAKASHASHTAAQ-AGLPDKLVARGKEVSDLIRSG--KPIKPVKDLL
740 750 760 770 780 790
890 900 910 920 930
pF1KB8 RQRAVYHLATRLVQTARNSQLDPD-SLRIYLSNLKKKYKEDFPRTEQVPEKTEE
.. . . : . . . . ::. .: ...:
CCDS47 KKNQMENCQTLVDKFMKLDLEDPNLDLNVFMSQEVLPAATSIL
800 810 820 830
>>CCDS34410.1 MSH5 gene_id:4439|Hs108|chr6 (835 aa)
initn: 506 init1: 199 opt: 491 Z-score: 415.0 bits: 87.9 E(32554): 8.6e-17
Smith-Waterman score: 510; 24.2% identity (57.2% similar) in 603 aa overlap (334-914:253-824)
310 320 330 340 350 360
pF1KB8 QGSEQTAMIDSSSAQNLELLINNQDYRNNHTLFGVLNYTKTPGGSRRLRSNILEPLVDIE
.:::.:: . : . :: . .: :.
CCDS34 DQDTYSVLQIFKSESHPSVYKVASGLKEGLSLFGILNRCHCKWGEKLLRLWFTRPTHDLG
230 240 250 260 270 280
370 380 390 400 410 420
pF1KB8 TVNMRLDCVQELLQDEELFFGLQSVISRFLDTEQLLSVLVQIPKQDTVNAAESKITNLIY
.. ::: .: .: ..: . ... :.: . . .... .. ...:...
CCDS34 ELSSRLDVIQFFLLPQNL--DMAQMLHRLLGHIKNVPLILK-----RMKLSHTKVSDWQV
290 300 310 320 330
430 440 450 460 470 480
pF1KB8 LKHTLELVDPLKIAMKNCNTPLLRAYYGSLEDKRFGIILEKIKTVINDDARYMKGCLNMR
: .:. . :. : .. : . .. ..:. :..: ..:. . . .: :
CCDS34 LYKTVYSALGLRDACRS--LPQSIQLFRDIA-QEFSDDLHHIASLIGKVVDF-EGSL---
340 350 360 370 380
490 500 510 520 530 540
pF1KB8 TQKCYAVRSNINEFLDIARRTYTEIVDDIAGMISQLGEKYSLPLRTSFSSARGFFIQMTT
... ..: ::. .: .: . ........: : . . : ..: .
CCDS34 AENRFTVLPNIDPEIDEKKRRLM----GLPSFLTEVARKELENLDSRIPSCSVIYIPLIG
390 400 410 420 430 440
550 560 570 580 590
pF1KB8 DCIALPSDQLPSEFIKISKVK-NSYSFTSADLIKMNERCQESLR----------EIYHMT
...: .::: ... : . :. .: . :.. : .. . :: .
CCDS34 FLLSIP--RLPS-MVEASDFEINGLDFMFLSEEKLHYRSARTKELDALLGDLHCEIRDQE
450 460 470 480 490 500
600 610 620 630 640
pF1KB8 YMIVCKLLSEIYEHIHCLYKLSDTVSMLDMLLSFAHACTLSDYVRPEFTDTLA---IKQG
... .: .. . : .. : .: ::.::..: : : ::... . :..:
CCDS34 TLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALASAARDYGYSRPRYSPQVLGVRIQNG
510 520 530 540 550 560
650 660 670 680 690 700
pF1KB8 WHPILEKISAEKPIANNTYVT-EGSNFLIITGPNMSGKSTYLKQIALCQIMAQIGSYVPA
::..: . :. . :.: . . .::::: :::: ::::..: .:: .::.:::
CCDS34 RHPLME-LCARTFVPNSTECGGDKGRVKVITGPNSSGKSIYLKQVGLITFMALVGSFVPA
570 580 590 600 610 620
710 720 730 740 750 760
pF1KB8 EYSSFRIAKQIFTRISTDDDIETNSSTFMKEM-KEIAYILHNANDKSLILIDELGRGTNT
: . . . ::::: . ..: . :::: .. ...: ..::. .::.::::.:.::::
CCDS34 EEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQQVAKAVNNATAQSLVLIDEFGKGTNT
630 640 650 660 670 680
770 780 790 800 810 820
pF1KB8 EEGIGICYAVCEYLLS---LKAFTLFATHFLELCHIDALY--PNVENMHFEVQHVKNTSR
.:... :: .. :. . ::.:: : ... : : :. . .: : .
CCDS34 VDGLALLAAVLRHWLARGPTCPHIFVATNFLSLVQLQLLPQGPLVQYLTME------TCE
690 700 710 720 730
830 840 850 860 870 880
pF1KB8 NKEAILYTYKLSKGLTEEKNYGLKAAEVSSLPPSIVLDAKEITTQITRQILQNQRSTPEM
. . ... :.. .:... .. . ::. ..:: ..: .::.. : . . . ..
CCDS34 DGNDLVFFYQVCEGVAKASHASHTAAQ-AGLPDKLVARGKEVSDLIRSG--KPIKPVKDL
740 750 760 770 780 790
890 900 910 920 930
pF1KB8 ERQRAVYHLATRLVQTARNSQLDPD-SLRIYLSNLKKKYKEDFPRTEQVPEKTEE
.. . . : . . . . ::. .: ...:
CCDS34 LKKNQMENCQTLVDKFMKLDLEDPNLDLNVFMSQEVLPAATSIL
800 810 820 830
>>CCDS34409.2 MSH5 gene_id:4439|Hs108|chr6 (822 aa)
initn: 506 init1: 199 opt: 452 Z-score: 382.8 bits: 82.0 E(32554): 5.3e-15
Smith-Waterman score: 471; 25.5% identity (57.3% similar) in 522 aa overlap (334-834:270-763)
310 320 330 340 350 360
pF1KB8 QGSEQTAMIDSSSAQNLELLINNQDYRNNHTLFGVLNYTKTPGGSRRLRSNILEPLVDIE
.:::.:: . : . :: . .: :.
CCDS34 DQDTYSVLQIFKSESHPSVYKVASGLKEGLSLFGILNRCHCKWGEKLLRLWFTRPTHDLG
240 250 260 270 280 290
370 380 390 400 410 420
pF1KB8 TVNMRLDCVQELLQDEELFFGLQSVISRFLDTEQLLSVLVQIPKQDTVNAAESKITNLIY
.. ::: .: .: ..: . ... :.: . . .... .. ...:...
CCDS34 ELSSRLDVIQFFLLPQNL--DMAQMLHRLLGHIKNVPLILK-----RMKLSHTKVSDWQV
300 310 320 330 340 350
430 440 450 460 470 480
pF1KB8 LKHTLELVDPLKIAMKNCNTPLLRAYYGSLEDKRFGIILEKIKTVINDDARYMKGCLNMR
: .:. . :. : .. : . .. ..:. :..: ..:. . . .: :
CCDS34 LYKTVYSALGLRDACRS--LPQSIQLFRDIA-QEFSDDLHHIASLIGKVVDF-EGSL---
360 370 380 390 400
490 500 510 520 530 540
pF1KB8 TQKCYAVRSNINEFLDIARRTYTEIVDDIAGMISQLGEKYSLPLRTSFSSARGFFIQMTT
... ..: ::. .: .: . ........: : . . : ..: .
CCDS34 AENRFTVLPNIDPEIDEKKRRLM----GLPSFLTEVARKELENLDSRIPSCSVIYIPLIG
410 420 430 440 450 460
550 560 570 580 590
pF1KB8 DCIALPSDQLPSEFIKISKVK-NSYSFTSADLIKMNERCQESLR----------EIYHMT
...: .::: ... : . :. .: . :.. : .. . :: .
CCDS34 FLLSIP--RLPS-MVEASDFEINGLDFMFLSEEKLHYRSARTKELDALLGDLHCEIRDQE
470 480 490 500 510
600 610 620 630 640
pF1KB8 YMIVCKLLSEIYEHIHCLYKLSDTVSMLDMLLSFAHACTLSDYVRPEFTDTLA---IKQG
... .: .. . : .. : .: ::.::..: : : ::... . :..:
CCDS34 TLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALASAARDYGYSRPRYSPQVLGVRIQNG
520 530 540 550 560 570
650 660 670 680 690 700
pF1KB8 WHPILEKISAEKPIANNTYVT-EGSNFLIITGPNMSGKSTYLKQIALCQIMAQIGSYVPA
::..: . :. . :.: . . .::::: :::: ::::..: .:: .::.:::
CCDS34 RHPLME-LCARTFVPNSTECGGDKGRVKVITGPNSSGKSIYLKQVGLITFMALVGSFVPA
580 590 600 610 620 630
710 720 730 740 750 760
pF1KB8 EYSSFRIAKQIFTRISTDDDIETNSSTFMKEM-KEIAYILHNANDKSLILIDELGRGTNT
: . . . ::::: . ..: . :::: .. ...: ..::. .::.::::.:.::::
CCDS34 EEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQQVAKAVNNATAQSLVLIDEFGKGTNT
640 650 660 670 680 690
770 780 790 800 810 820
pF1KB8 EEGIGICYAVCEYLLS---LKAFTLFATHFLELCHIDALY--PNVENMHFEVQHVKNTSR
.:... :: .. :. . ::.:: : ... : : :. . .: : .
CCDS34 VDGLALLAAVLRHWLARGPTCPHIFVATNFLSLVQLQLLPQGPLVQYLTME------TCE
700 710 720 730 740 750
830 840 850 860 870 880
pF1KB8 NKEAILYTYKLSKGLTEEKNYGLKAAEVSSLPPSIVLDAKEITTQITRQILQNQRSTPEM
. . ... :..:
CCDS34 DGNDLVFFYQVSDLIRSGKPIKPVKDLLKKNQMENCQTLVDKFMKLDLEDPNLDLNVFMS
760 770 780 790 800 810
>>CCDS62907.1 MSH6 gene_id:2956|Hs108|chr2 (1058 aa)
initn: 480 init1: 309 opt: 408 Z-score: 344.7 bits: 75.3 E(32554): 7e-13
Smith-Waterman score: 543; 25.8% identity (56.3% similar) in 679 aa overlap (276-893:398-1053)
250 260 270 280 290 300
pF1KB8 NETKGLEYIEQLCIAEFSTVLMEVQSKYYCLAAVAALLKYVEFIQNSVYAPKSLKICFQG
: ..: . .:. . ...: . .: : :
CCDS62 GLTPGEKSELALSALGGCVFYLKKCLIDQELLSMANFEEYIPLDSDTVSTTRSGAI-FTK
370 380 390 400 410 420
310 320 330 340 350 360
pF1KB8 SEQTAMIDSSSAQNLELLINNQDYRNNHTLFGVLNYTKTPGGSRRLRSNILEPLVDIETV
. : ..:. . .:::...:. . .. ::. .. .:: :.: :.. . :: . ..
CCDS62 AYQRMVLDAVTLNNLEIFLNGTNGSTEGTLLERVDTCHTPFGKRLLKQWLCAPLCNHYAI
430 440 450 460 470 480
370 380 390 400 410 420
pF1KB8 NMRLDCVQELLQDEELFFGLQSVISRFLDTEQLLSVLVQIPKQ-DTVNAAESKITNLIYL
: ::: ...:. . . . ..... : :.::: . .. . . : .:. ..:
CCDS62 NDRLDAIEDLMVVPDKISEVVELLKKLPDLERLLSKIHNVGSPLKSQNHPDSR--AIMYE
490 500 510 520 530 540
430 440 450 460 470 480
pF1KB8 KHTL---ELVDPLKIAMKNCNTPLLRAYYGSLEDKRFGIILEKIKTVINDDARYMKGCLN
. : ...: :. :... . .. : .:. :. . .: ::. ... .:
CCDS62 ETTYSKKKIIDFLS-ALEGFK--VMCKIIGIMEEVADGFKSKILKQVISLQTKNPEG---
550 560 570 580 590
490 500 510 520 530 540
pF1KB8 MRTQKCYAVRSNINEFLDIARRTYTEIVDDIAGMISQLGEKYSLPLRTSFSSARGFFIQM
: . . . .: . : .. ::. :. . . .: . .: .. ..
CCDS62 -RFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQALA-DIRENEQSLLEYLEKQ
600 610 620 630 640 650
550 560 570
pF1KB8 TT--DC--------------IALPSD----QLPSEF-IKISKVKNSYSFTS------ADL
. : . .: . .:: :. .: .: . .:. :.:
CCDS62 RNRIGCRTIVYWGIGRNRYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKLANL
660 670 680 690 700 710
580 590 600 610 620 630
pF1KB8 IKMNERCQESLREIYHMTYMIVCKLLSEIYEHIHCLYKLSDTVSMLDMLLSFAHACTLSD
:. .:: . ::.. .. .. : .. ..: ...::.:: .:. .:
CCDS62 INAEERRDVSLKDCMRRLFYNFDKNYKDWQSAVEC-------IAVLDVLLCLANYSRGGD
720 730 740 750 760
640 650 660 670
pF1KB8 --YVRPEFT---DT---LAIKQGWHPILEK-ISAEKPIANNTYV-------TEGSNF-LI
. :: . :: : .: . :: . : . .. : :. . .:. . ..
CCDS62 GPMCRPVILLPEDTPPFLELKGSRHPCITKTFFGDDFIPNDILIGCEEEEQENGKAYCVL
770 780 790 800 810 820
680 690 700 710 720 730
pF1KB8 ITGPNMSGKSTYLKQIALCQIMAQIGSYVPAEYSSFRIAKQIFTRISTDDDIETNSSTFM
.:::::.:::: ..: .: .:::.: ::::: . ..:::....: : .. :::.
CCDS62 VTGPNMGGKSTLMRQAGLLAVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFF
830 840 850 860 870 880
740 750 760 770 780 790
pF1KB8 KEMKEIAYILHNANDKSLILIDELGRGTNTEEGIGICYAVCEYLL-SLKAFTLFATHFLE
:..: : :: .:. .::.:.::::::: : .: .: :: . : ..: :::.::.
CCDS62 VELSETASILMHATAHSLVLVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHS
890 900 910 920 930 940
800 810 820 830 840 850
pF1KB8 LCHIDALYPNVENMHFEVQHVKNTSRN--KEAILYTYKLSKGLTEEKNYGLKAAEVSSLP
: . . :. :. . :.: .. .:.: . ::. :: :.::..::....::
CCDS62 LVEDYSQNVAVRLGHMACM-VENECEDPSQETITFLYKFIKGACP-KSYGFNAARLANLP
950 960 970 980 990 1000
860 870 880 890 900
pF1KB8 PSIVLD----AKEI-----TTQITRQI-LQNQRSTPEMERQRAVYHLATRLVQTARNSQL
.. :.:. . .. :.. : ..::: . : ::..: :
CCDS62 EEVIQKGHRKAREFEKMNQSLRLFREVCLASERSTVDAE---AVHKLLTLIKEL
1010 1020 1030 1040 1050
910 920 930
pF1KB8 DPDSLRIYLSNLKKKYKEDFPRTEQVPEKTEE
>>CCDS62906.1 MSH6 gene_id:2956|Hs108|chr2 (1230 aa)
initn: 480 init1: 309 opt: 408 Z-score: 343.7 bits: 75.3 E(32554): 8e-13
Smith-Waterman score: 543; 25.8% identity (56.3% similar) in 679 aa overlap (276-893:570-1225)
250 260 270 280 290 300
pF1KB8 NETKGLEYIEQLCIAEFSTVLMEVQSKYYCLAAVAALLKYVEFIQNSVYAPKSLKICFQG
: ..: . .:. . ...: . .: : :
CCDS62 GLTPGEKSELALSALGGCVFYLKKCLIDQELLSMANFEEYIPLDSDTVSTTRSGAI-FTK
540 550 560 570 580 590
310 320 330 340 350 360
pF1KB8 SEQTAMIDSSSAQNLELLINNQDYRNNHTLFGVLNYTKTPGGSRRLRSNILEPLVDIETV
. : ..:. . .:::...:. . .. ::. .. .:: :.: :.. . :: . ..
CCDS62 AYQRMVLDAVTLNNLEIFLNGTNGSTEGTLLERVDTCHTPFGKRLLKQWLCAPLCNHYAI
600 610 620 630 640 650
370 380 390 400 410 420
pF1KB8 NMRLDCVQELLQDEELFFGLQSVISRFLDTEQLLSVLVQIPKQ-DTVNAAESKITNLIYL
: ::: ...:. . . . ..... : :.::: . .. . . : .:. ..:
CCDS62 NDRLDAIEDLMVVPDKISEVVELLKKLPDLERLLSKIHNVGSPLKSQNHPDSR--AIMYE
660 670 680 690 700 710
430 440 450 460 470 480
pF1KB8 KHTL---ELVDPLKIAMKNCNTPLLRAYYGSLEDKRFGIILEKIKTVINDDARYMKGCLN
. : ...: :. :... . .. : .:. :. . .: ::. ... .:
CCDS62 ETTYSKKKIIDFLS-ALEGFK--VMCKIIGIMEEVADGFKSKILKQVISLQTKNPEG---
720 730 740 750 760 770
490 500 510 520 530 540
pF1KB8 MRTQKCYAVRSNINEFLDIARRTYTEIVDDIAGMISQLGEKYSLPLRTSFSSARGFFIQM
: . . . .: . : .. ::. :. . . .: . .: .. ..
CCDS62 -RFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQALA-DIRENEQSLLEYLEKQ
780 790 800 810 820
550 560 570
pF1KB8 TT--DC--------------IALPSD----QLPSEF-IKISKVKNSYSFTS------ADL
. : . .: . .:: :. .: .: . .:. :.:
CCDS62 RNRIGCRTIVYWGIGRNRYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKLANL
830 840 850 860 870 880
580 590 600 610 620 630
pF1KB8 IKMNERCQESLREIYHMTYMIVCKLLSEIYEHIHCLYKLSDTVSMLDMLLSFAHACTLSD
:. .:: . ::.. .. .. : .. ..: ...::.:: .:. .:
CCDS62 INAEERRDVSLKDCMRRLFYNFDKNYKDWQSAVEC-------IAVLDVLLCLANYSRGGD
890 900 910 920 930 940
640 650 660 670
pF1KB8 --YVRPEFT---DT---LAIKQGWHPILEK-ISAEKPIANNTYV-------TEGSNF-LI
. :: . :: : .: . :: . : . .. : :. . .:. . ..
CCDS62 GPMCRPVILLPEDTPPFLELKGSRHPCITKTFFGDDFIPNDILIGCEEEEQENGKAYCVL
950 960 970 980 990 1000
680 690 700 710 720 730
pF1KB8 ITGPNMSGKSTYLKQIALCQIMAQIGSYVPAEYSSFRIAKQIFTRISTDDDIETNSSTFM
.:::::.:::: ..: .: .:::.: ::::: . ..:::....: : .. :::.
CCDS62 VTGPNMGGKSTLMRQAGLLAVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFF
1010 1020 1030 1040 1050 1060
740 750 760 770 780 790
pF1KB8 KEMKEIAYILHNANDKSLILIDELGRGTNTEEGIGICYAVCEYLL-SLKAFTLFATHFLE
:..: : :: .:. .::.:.::::::: : .: .: :: . : ..: :::.::.
CCDS62 VELSETASILMHATAHSLVLVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHS
1070 1080 1090 1100 1110 1120
800 810 820 830 840 850
pF1KB8 LCHIDALYPNVENMHFEVQHVKNTSRN--KEAILYTYKLSKGLTEEKNYGLKAAEVSSLP
: . . :. :. . :.: .. .:.: . ::. :: :.::..::....::
CCDS62 LVEDYSQNVAVRLGHMACM-VENECEDPSQETITFLYKFIKGACP-KSYGFNAARLANLP
1130 1140 1150 1160 1170
860 870 880 890 900
pF1KB8 PSIVLD----AKEI-----TTQITRQI-LQNQRSTPEMERQRAVYHLATRLVQTARNSQL
.. :.:. . .. :.. : ..::: . : ::..: :
CCDS62 EEVIQKGHRKAREFEKMNQSLRLFREVCLASERSTVDAE---AVHKLLTLIKEL
1180 1190 1200 1210 1220 1230
910 920 930
pF1KB8 DPDSLRIYLSNLKKKYKEDFPRTEQVPEKTEE
>>CCDS1836.1 MSH6 gene_id:2956|Hs108|chr2 (1360 aa)
initn: 480 init1: 309 opt: 408 Z-score: 343.0 bits: 75.3 E(32554): 8.7e-13
Smith-Waterman score: 543; 25.8% identity (56.3% similar) in 679 aa overlap (276-893:700-1355)
250 260 270 280 290 300
pF1KB8 NETKGLEYIEQLCIAEFSTVLMEVQSKYYCLAAVAALLKYVEFIQNSVYAPKSLKICFQG
: ..: . .:. . ...: . .: : :
CCDS18 GLTPGEKSELALSALGGCVFYLKKCLIDQELLSMANFEEYIPLDSDTVSTTRSGAI-FTK
670 680 690 700 710 720
310 320 330 340 350 360
pF1KB8 SEQTAMIDSSSAQNLELLINNQDYRNNHTLFGVLNYTKTPGGSRRLRSNILEPLVDIETV
. : ..:. . .:::...:. . .. ::. .. .:: :.: :.. . :: . ..
CCDS18 AYQRMVLDAVTLNNLEIFLNGTNGSTEGTLLERVDTCHTPFGKRLLKQWLCAPLCNHYAI
730 740 750 760 770 780
370 380 390 400 410 420
pF1KB8 NMRLDCVQELLQDEELFFGLQSVISRFLDTEQLLSVLVQIPKQ-DTVNAAESKITNLIYL
: ::: ...:. . . . ..... : :.::: . .. . . : .:. ..:
CCDS18 NDRLDAIEDLMVVPDKISEVVELLKKLPDLERLLSKIHNVGSPLKSQNHPDSR--AIMYE
790 800 810 820 830 840
430 440 450 460 470 480
pF1KB8 KHTL---ELVDPLKIAMKNCNTPLLRAYYGSLEDKRFGIILEKIKTVINDDARYMKGCLN
. : ...: :. :... . .. : .:. :. . .: ::. ... .:
CCDS18 ETTYSKKKIIDFLS-ALEGFK--VMCKIIGIMEEVADGFKSKILKQVISLQTKNPEG---
850 860 870 880 890 900
490 500 510 520 530 540
pF1KB8 MRTQKCYAVRSNINEFLDIARRTYTEIVDDIAGMISQLGEKYSLPLRTSFSSARGFFIQM
: . . . .: . : .. ::. :. . . .: . .: .. ..
CCDS18 -RFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQALA-DIRENEQSLLEYLEKQ
910 920 930 940 950
550 560 570
pF1KB8 TT--DC--------------IALPSD----QLPSEF-IKISKVKNSYSFTS------ADL
. : . .: . .:: :. .: .: . .:. :.:
CCDS18 RNRIGCRTIVYWGIGRNRYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKLANL
960 970 980 990 1000 1010
580 590 600 610 620 630
pF1KB8 IKMNERCQESLREIYHMTYMIVCKLLSEIYEHIHCLYKLSDTVSMLDMLLSFAHACTLSD
:. .:: . ::.. .. .. : .. ..: ...::.:: .:. .:
CCDS18 INAEERRDVSLKDCMRRLFYNFDKNYKDWQSAVEC-------IAVLDVLLCLANYSRGGD
1020 1030 1040 1050 1060 1070
640 650 660 670
pF1KB8 --YVRPEFT---DT---LAIKQGWHPILEK-ISAEKPIANNTYV-------TEGSNF-LI
. :: . :: : .: . :: . : . .. : :. . .:. . ..
CCDS18 GPMCRPVILLPEDTPPFLELKGSRHPCITKTFFGDDFIPNDILIGCEEEEQENGKAYCVL
1080 1090 1100 1110 1120 1130
680 690 700 710 720 730
pF1KB8 ITGPNMSGKSTYLKQIALCQIMAQIGSYVPAEYSSFRIAKQIFTRISTDDDIETNSSTFM
.:::::.:::: ..: .: .:::.: ::::: . ..:::....: : .. :::.
CCDS18 VTGPNMGGKSTLMRQAGLLAVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFF
1140 1150 1160 1170 1180 1190
740 750 760 770 780 790
pF1KB8 KEMKEIAYILHNANDKSLILIDELGRGTNTEEGIGICYAVCEYLL-SLKAFTLFATHFLE
:..: : :: .:. .::.:.::::::: : .: .: :: . : ..: :::.::.
CCDS18 VELSETASILMHATAHSLVLVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHS
1200 1210 1220 1230 1240 1250
800 810 820 830 840 850
pF1KB8 LCHIDALYPNVENMHFEVQHVKNTSRN--KEAILYTYKLSKGLTEEKNYGLKAAEVSSLP
: . . :. :. . :.: .. .:.: . ::. :: :.::..::....::
CCDS18 LVEDYSQNVAVRLGHMACM-VENECEDPSQETITFLYKFIKGACP-KSYGFNAARLANLP
1260 1270 1280 1290 1300
860 870 880 890 900
pF1KB8 PSIVLD----AKEI-----TTQITRQI-LQNQRSTPEMERQRAVYHLATRLVQTARNSQL
.. :.:. . .. :.. : ..::: . : ::..: :
CCDS18 EEVIQKGHRKAREFEKMNQSLRLFREVCLASERSTVDAE---AVHKLLTLIKEL
1310 1320 1330 1340 1350 1360
910 920 930
pF1KB8 DPDSLRIYLSNLKKKYKEDFPRTEQVPEKTEE
936 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 08:11:03 2016 done: Sat Nov 5 08:11:04 2016
Total Scan time: 4.430 Total Display time: 0.280
Function used was FASTA [36.3.4 Apr, 2011]