FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB5799, 834 aa
1>>>pF1KB5799 834 - 834 aa - 834 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.9470+/-0.000899; mu= 19.1976+/- 0.055
mean_var=95.5168+/-18.850, 0's: 0 Z-trim(108.3): 14 B-trim: 109 in 1/51
Lambda= 0.131230
statistics sampled from 10135 (10145) to 10135 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.661), E-opt: 0.2 (0.312), width: 16
Scan time: 4.170
The best scores are: opt bits E(32554)
CCDS4720.1 MSH5 gene_id:4439|Hs108|chr6 ( 834) 5468 1045.9 0
CCDS34410.1 MSH5 gene_id:4439|Hs108|chr6 ( 835) 5456 1043.7 0
CCDS34409.2 MSH5 gene_id:4439|Hs108|chr6 ( 822) 3687 708.8 9.8e-204
CCDS34195.1 MSH3 gene_id:4437|Hs108|chr5 (1137) 588 122.1 5.3e-27
CCDS58709.1 MSH2 gene_id:4436|Hs108|chr2 ( 868) 554 115.6 3.7e-25
CCDS1834.1 MSH2 gene_id:4436|Hs108|chr2 ( 934) 554 115.6 3.9e-25
CCDS670.1 MSH4 gene_id:4438|Hs108|chr1 ( 936) 502 105.8 3.6e-22
CCDS62907.1 MSH6 gene_id:2956|Hs108|chr2 (1058) 393 85.2 6.5e-16
CCDS62906.1 MSH6 gene_id:2956|Hs108|chr2 (1230) 393 85.2 7.3e-16
CCDS1836.1 MSH6 gene_id:2956|Hs108|chr2 (1360) 393 85.3 7.9e-16
>>CCDS4720.1 MSH5 gene_id:4439|Hs108|chr6 (834 aa)
initn: 5468 init1: 5468 opt: 5468 Z-score: 5593.4 bits: 1045.9 E(32554): 0
Smith-Waterman score: 5468; 100.0% identity (100.0% similar) in 834 aa overlap (1-834:1-834)
10 20 30 40 50 60
pF1KB5 MASLGANPRRTPQGPRPGAASSGFPSPAPVPGPREAEEEEVEEEEELAEIHLCVLWNSGY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 MASLGANPRRTPQGPRPGAASSGFPSPAPVPGPREAEEEEVEEEEELAEIHLCVLWNSGY
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB5 LGIAYYDTSDSTIHFMPDAPDHESLKLLQRVLDEINPQSVVTSAKQDENMTRFLGKLASQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 LGIAYYDTSDSTIHFMPDAPDHESLKLLQRVLDEINPQSVVTSAKQDENMTRFLGKLASQ
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB5 EHREPKRPEIIFLPSVDFGLEISKQRLLSGNYSFIPDAMTATEKILFLSSIIPFDCLLTV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 EHREPKRPEIIFLPSVDFGLEISKQRLLSGNYSFIPDAMTATEKILFLSSIIPFDCLLTV
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB5 RALGGLLKFLGRRRIGVELEDYNVSVPILGFKKFMLTHLVNIDQDTYSVLQIFKSESHPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 RALGGLLKFLGRRRIGVELEDYNVSVPILGFKKFMLTHLVNIDQDTYSVLQIFKSESHPS
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB5 VYKVASGLKEGLSLFGILNRCHCKWGEKLLRLWFTRPTHDLGELSSRLDVIQFFLLPQNL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 VYKVASGLKEGLSLFGILNRCHCKWGEKLLRLWFTRPTHDLGELSSRLDVIQFFLLPQNL
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB5 DMAQMLHRLLGHIKNVPLILKRMKLSHTKVSDWQVLYKTVYSALGLRDACRSLPQSIQLF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 DMAQMLHRLLGHIKNVPLILKRMKLSHTKVSDWQVLYKTVYSALGLRDACRSLPQSIQLF
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB5 RDIAQEFSDDLHHIASLIGKVVDFEGSLAENRFTVLPNIDPEIDEKKRRLMGLPSFLTEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 RDIAQEFSDDLHHIASLIGKVVDFEGSLAENRFTVLPNIDPEIDEKKRRLMGLPSFLTEV
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB5 ARKELENLDSRIPSCSVIYIPLIGFLLSIPRLPSMVEASDFEINGLDFMFLSEEKLHYRS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 ARKELENLDSRIPSCSVIYIPLIGFLLSIPRLPSMVEASDFEINGLDFMFLSEEKLHYRS
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB5 ARTKELDALLGDLHCEIRDQETLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALASAAR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 ARTKELDALLGDLHCEIRDQETLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALASAAR
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB5 DYGYSRPRYSPQVLGVRIQNGRHPLMELCARTFVPNSTECGGDKGRVKVITGPNSSGKSI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 DYGYSRPRYSPQVLGVRIQNGRHPLMELCARTFVPNSTECGGDKGRVKVITGPNSSGKSI
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB5 YLKQVGLITFMALVGSFVPAEEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQVAKAVN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 YLKQVGLITFMALVGSFVPAEEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQVAKAVN
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB5 NATAQSLVLIDEFGKGTNTVDGLALLAAVLRHWLARGPTCPHIFVATNFLSLVQLQLLPQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 NATAQSLVLIDEFGKGTNTVDGLALLAAVLRHWLARGPTCPHIFVATNFLSLVQLQLLPQ
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB5 GPLVQYLTMETCEDGNDLVFFYQVCEGVAKASHASHTAAQAGLPDKLVARGKEVSDLIRS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 GPLVQYLTMETCEDGNDLVFFYQVCEGVAKASHASHTAAQAGLPDKLVARGKEVSDLIRS
730 740 750 760 770 780
790 800 810 820 830
pF1KB5 GKPIKPVKDLLKKNQMENCQTLVDKFMKLDLEDPNLDLNVFMSQEVLPAATSIL
::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 GKPIKPVKDLLKKNQMENCQTLVDKFMKLDLEDPNLDLNVFMSQEVLPAATSIL
790 800 810 820 830
>>CCDS34410.1 MSH5 gene_id:4439|Hs108|chr6 (835 aa)
initn: 4297 init1: 4297 opt: 5456 Z-score: 5581.1 bits: 1043.7 E(32554): 0
Smith-Waterman score: 5456; 99.9% identity (99.9% similar) in 835 aa overlap (1-834:1-835)
10 20 30 40 50 60
pF1KB5 MASLGANPRRTPQGPRPGAASSGFPSPAPVPGPREAEEEEVEEEEELAEIHLCVLWNSGY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 MASLGANPRRTPQGPRPGAASSGFPSPAPVPGPREAEEEEVEEEEELAEIHLCVLWNSGY
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB5 LGIAYYDTSDSTIHFMPDAPDHESLKLLQRVLDEINPQSVVTSAKQDENMTRFLGKLASQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 LGIAYYDTSDSTIHFMPDAPDHESLKLLQRVLDEINPQSVVTSAKQDENMTRFLGKLASQ
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB5 EHREPKRPEIIFLPSVDFGLEISKQRLLSGNYSFIPDAMTATEKILFLSSIIPFDCLLTV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 EHREPKRPEIIFLPSVDFGLEISKQRLLSGNYSFIPDAMTATEKILFLSSIIPFDCLLTV
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB5 RALGGLLKFLGRRRIGVELEDYNVSVPILGFKKFMLTHLVNIDQDTYSVLQIFKSESHPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 RALGGLLKFLGRRRIGVELEDYNVSVPILGFKKFMLTHLVNIDQDTYSVLQIFKSESHPS
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB5 VYKVASGLKEGLSLFGILNRCHCKWGEKLLRLWFTRPTHDLGELSSRLDVIQFFLLPQNL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 VYKVASGLKEGLSLFGILNRCHCKWGEKLLRLWFTRPTHDLGELSSRLDVIQFFLLPQNL
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB5 DMAQMLHRLLGHIKNVPLILKRMKLSHTKVSDWQVLYKTVYSALGLRDACRSLPQSIQLF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 DMAQMLHRLLGHIKNVPLILKRMKLSHTKVSDWQVLYKTVYSALGLRDACRSLPQSIQLF
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB5 RDIAQEFSDDLHHIASLIGKVVDFEGSLAENRFTVLPNIDPEIDEKKRRLMGLPSFLTEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 RDIAQEFSDDLHHIASLIGKVVDFEGSLAENRFTVLPNIDPEIDEKKRRLMGLPSFLTEV
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB5 ARKELENLDSRIPSCSVIYIPLIGFLLSIPRLPSMVEASDFEINGLDFMFLSEEKLHYRS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 ARKELENLDSRIPSCSVIYIPLIGFLLSIPRLPSMVEASDFEINGLDFMFLSEEKLHYRS
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB5 ARTKELDALLGDLHCEIRDQETLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALASAAR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 ARTKELDALLGDLHCEIRDQETLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALASAAR
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB5 DYGYSRPRYSPQVLGVRIQNGRHPLMELCARTFVPNSTECGGDKGRVKVITGPNSSGKSI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 DYGYSRPRYSPQVLGVRIQNGRHPLMELCARTFVPNSTECGGDKGRVKVITGPNSSGKSI
550 560 570 580 590 600
610 620 630 640 650
pF1KB5 YLKQVGLITFMALVGSFVPAEEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQ-VAKAV
:::::::::::::::::::::::::::::::::::::::::::::::::::::: :::::
CCDS34 YLKQVGLITFMALVGSFVPAEEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQQVAKAV
610 620 630 640 650 660
660 670 680 690 700 710
pF1KB5 NNATAQSLVLIDEFGKGTNTVDGLALLAAVLRHWLARGPTCPHIFVATNFLSLVQLQLLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 NNATAQSLVLIDEFGKGTNTVDGLALLAAVLRHWLARGPTCPHIFVATNFLSLVQLQLLP
670 680 690 700 710 720
720 730 740 750 760 770
pF1KB5 QGPLVQYLTMETCEDGNDLVFFYQVCEGVAKASHASHTAAQAGLPDKLVARGKEVSDLIR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 QGPLVQYLTMETCEDGNDLVFFYQVCEGVAKASHASHTAAQAGLPDKLVARGKEVSDLIR
730 740 750 760 770 780
780 790 800 810 820 830
pF1KB5 SGKPIKPVKDLLKKNQMENCQTLVDKFMKLDLEDPNLDLNVFMSQEVLPAATSIL
:::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 SGKPIKPVKDLLKKNQMENCQTLVDKFMKLDLEDPNLDLNVFMSQEVLPAATSIL
790 800 810 820 830
>>CCDS34409.2 MSH5 gene_id:4439|Hs108|chr6 (822 aa)
initn: 3691 init1: 3107 opt: 3687 Z-score: 3771.1 bits: 708.8 E(32554): 9.8e-204
Smith-Waterman score: 5148; 94.4% identity (94.4% similar) in 852 aa overlap (1-834:1-822)
10 20 30 40 50 60
pF1KB5 MASLGANPRRTPQGPRPGAASSGFPSPAPVPGPREAEEEEVEEEEELAEIHLCVLWNSGY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 MASLGANPRRTPQGPRPGAASSGFPSPAPVPGPREAEEEEVEEEEELAEIHLCVLWNSGY
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB5 LGIAYYDTSDSTIHFMPDAPDHESLKLLQRVLDEINPQSVVTSAKQDENMTRFLGKLASQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 LGIAYYDTSDSTIHFMPDAPDHESLKLLQRVLDEINPQSVVTSAKQDENMTRFLGKLASQ
70 80 90 100 110 120
130 140 150 160 170
pF1KB5 EHREPKRPEIIFLPSVDFGLEISKQRLLSGNYSFIPDAMTATEKILFLSSIIPFDCLLT-
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 EHREPKRPEIIFLPSVDFGLEISKQRLLSGNYSFIPDAMTATEKILFLSSIIPFDCLLTP
130 140 150 160 170 180
180 190 200 210 220
pF1KB5 ----------------VRALGGLLKFLGRRRIGVELEDYNVSVPILGFKKFMLTHLVNID
::::::::::::::::::::::::::::::::::::::::::::
CCDS34 PGDLRFTPIPLLIPSQVRALGGLLKFLGRRRIGVELEDYNVSVPILGFKKFMLTHLVNID
190 200 210 220 230 240
230 240 250 260 270 280
pF1KB5 QDTYSVLQIFKSESHPSVYKVASGLKEGLSLFGILNRCHCKWGEKLLRLWFTRPTHDLGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 QDTYSVLQIFKSESHPSVYKVASGLKEGLSLFGILNRCHCKWGEKLLRLWFTRPTHDLGE
250 260 270 280 290 300
290 300 310 320 330 340
pF1KB5 LSSRLDVIQFFLLPQNLDMAQMLHRLLGHIKNVPLILKRMKLSHTKVSDWQVLYKTVYSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 LSSRLDVIQFFLLPQNLDMAQMLHRLLGHIKNVPLILKRMKLSHTKVSDWQVLYKTVYSA
310 320 330 340 350 360
350 360 370 380 390 400
pF1KB5 LGLRDACRSLPQSIQLFRDIAQEFSDDLHHIASLIGKVVDFEGSLAENRFTVLPNIDPEI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 LGLRDACRSLPQSIQLFRDIAQEFSDDLHHIASLIGKVVDFEGSLAENRFTVLPNIDPEI
370 380 390 400 410 420
410 420 430 440 450 460
pF1KB5 DEKKRRLMGLPSFLTEVARKELENLDSRIPSCSVIYIPLIGFLLSIPRLPSMVEASDFEI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 DEKKRRLMGLPSFLTEVARKELENLDSRIPSCSVIYIPLIGFLLSIPRLPSMVEASDFEI
430 440 450 460 470 480
470 480 490 500 510 520
pF1KB5 NGLDFMFLSEEKLHYRSARTKELDALLGDLHCEIRDQETLLMYQLQCQVLARAAVLTRVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 NGLDFMFLSEEKLHYRSARTKELDALLGDLHCEIRDQETLLMYQLQCQVLARAAVLTRVL
490 500 510 520 530 540
530 540 550 560 570 580
pF1KB5 DLASRLDVLLALASAARDYGYSRPRYSPQVLGVRIQNGRHPLMELCARTFVPNSTECGGD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 DLASRLDVLLALASAARDYGYSRPRYSPQVLGVRIQNGRHPLMELCARTFVPNSTECGGD
550 560 570 580 590 600
590 600 610 620 630 640
pF1KB5 KGRVKVITGPNSSGKSIYLKQVGLITFMALVGSFVPAEEAEIGAVDAIFTRIHSCESISL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 KGRVKVITGPNSSGKSIYLKQVGLITFMALVGSFVPAEEAEIGAVDAIFTRIHSCESISL
610 620 630 640 650 660
650 660 670 680 690 700
pF1KB5 GLSTFMIDLNQ-VAKAVNNATAQSLVLIDEFGKGTNTVDGLALLAAVLRHWLARGPTCPH
::::::::::: ::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 GLSTFMIDLNQQVAKAVNNATAQSLVLIDEFGKGTNTVDGLALLAAVLRHWLARGPTCPH
670 680 690 700 710 720
710 720 730 740 750 760
pF1KB5 IFVATNFLSLVQLQLLPQGPLVQYLTMETCEDGNDLVFFYQVCEGVAKASHASHTAAQAG
::::::::::::::::::::::::::::::::::::::::::
CCDS34 IFVATNFLSLVQLQLLPQGPLVQYLTMETCEDGNDLVFFYQV------------------
730 740 750 760
770 780 790 800 810 820
pF1KB5 LPDKLVARGKEVSDLIRSGKPIKPVKDLLKKNQMENCQTLVDKFMKLDLEDPNLDLNVFM
::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 ------------SDLIRSGKPIKPVKDLLKKNQMENCQTLVDKFMKLDLEDPNLDLNVFM
770 780 790 800 810
830
pF1KB5 SQEVLPAATSIL
::::::::::::
CCDS34 SQEVLPAATSIL
820
>>CCDS34195.1 MSH3 gene_id:4437|Hs108|chr5 (1137 aa)
initn: 485 init1: 416 opt: 588 Z-score: 598.3 bits: 122.1 E(32554): 5.3e-27
Smith-Waterman score: 649; 27.8% identity (59.9% similar) in 616 aa overlap (241-818:547-1135)
220 230 240 250 260 270
pF1KB5 FKKFMLTHLVNIDQDTYSVLQIFKSESHPSVYKVASGLKEGLSLFGILNRCHCKWGEKLL
. . . .: ::. .:.. . ..:.. :
CCDS34 KMLSKPENFKQLSSKMEFMTINGTTLRNLEILQNQTDMKTKGSLLWVLDHTKTSFGRRKL
520 530 540 550 560 570
280 290 300 310 320
pF1KB5 RLWFTRPTHDLGELSSRLDVIQFFLLPQNLDMAQMLHRLLGHIKNVPLILKRM-KLSHTK
. : :.: : :...:::... : .. ... .. .:....: : . . .. : :
CCDS34 KKWVTQPLLKLREINARLDAVSEVLHSES----SVFGQIENHLRKLPDIERGLCSIYHKK
580 590 600 610 620 630
330 340 350 360 370 380
pF1KB5 VSDWQ--VLYKTVYSA----LGLRDACRSLPQSIQLFRDIAQEFSDDLHHIASLIGKVVD
: . .. ::.: .. : : :: .:.: . :. . : . . :...
CCDS34 CSTQEFFLIVKTLYHLKSEFQAIIPAVNSHIQS-DLLRTVILEIPELLSPVEHYL-KILN
640 650 660 670 680 690
390 400 410 420 430 440
pF1KB5 FEGSLAENRFTVLPNID--PEIDEKKRRLMGLPSFLTEVARKELENLDSRIPSCSVIYIP
... . .. .. ... : : ..: ...:. . :. : .:... . . . :. :.
CCDS34 EQAAKVGDKTELFKDLSDFPLIKKRKDEIQGV---IDEI-RMHLQEIRKILKNPSAQYVT
700 710 720 730 740
450 460 470 480 490
pF1KB5 LIG--FLLSIPR-----LPS-MVEASDFE-INGLDFMFLSEEKLHYRSARTKELDALLGD
. : :.. : .:. :.... . .. . :. :. : . : . .
CCDS34 VSGQEFMIEIKNSAVSCIPTDWVKVGSTKAVSRFHSPFIVENYRHLNQLREQLV------
750 760 770 780 790 800
500 510 520 530 540 550
pF1KB5 LHCEIRDQETLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALASAARDYGYSRPRYSPQ
: : . . : .. . . : .: : ::. .: ...::..:.. : :: . .
CCDS34 LDCSAEWLDFLEKFSEHYHSLCKA-----VHHLAT-VDCIFSLAKVAKQGDYCRPTVQEE
810 820 830 840 850
560 570 580 590 600
pF1KB5 VLGVRIQNGRHPLMELC---ARTFVPNSTECGGDKGRVKVITGPNSSGKSIYLKQVGLIT
. :.:::::.... .:::.:. . :. :: .::::: .::: :.:::.:::
CCDS34 R-KIVIKNGRHPVIDVLLGEQDQYVPNNTDLSEDSERVMIITGPNMGGKSSYIKQVALIT
860 870 880 890 900 910
610 620 630 640 650 660
pF1KB5 FMALVGSFVPAEEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQVAKAVNNATAQSLVL
.:: .::.:::::: :: ::.::::. . ..: : :::: .:...:. . .::.::::.
CCDS34 IMAQIGSYVPAEEATIGIVDGIFTRMGAADNIYKGQSTFMEELTDTAEIIRKATSQSLVI
920 930 940 950 960 970
670 680 690 700 710 720
pF1KB5 IDEFGKGTNTVDGLALLAAVLRHWLARGPTCPHIFVATNFLSLVQLQL--------LPQG
.::.:.::.: ::.:. :.:.... : .:: :.. . .:. .:
CCDS34 LDELGRGTSTHDGIAIAYATLEYFI-RDVKSLTLFV-THYPPVCELEKNYSHQVGNYHMG
980 990 1000 1010 1020 1030
730 740 750 760 770
pF1KB5 PLVQY----LTMETCEDGNDLV-FFYQVCEGVAKASHASHTAAQAGLPDKLVARG----K
::. : . :. :.: :.::. .:.: :.. ..: : .: ... .. :
CCDS34 FLVSEDESKLDPGAAEQVPDFVTFLYQITRGIAARSYGLNVAKLADVPGEILKKAAHKSK
1040 1050 1060 1070 1080 1090
780 790 800 810 820 830
pF1KB5 EVSDLIRSGKPIKPVKDLLKKNQMENCQTLVDKFMKLDLEDPNLDLNVFMSQEVLPAATS
:. :: . . : .: . : :.: : : ....:. . .:
CCDS34 ELEGLINTKR--KRLKYFAKLWTMHNAQDLQKWTEEFNMEETQTSLLH
1100 1110 1120 1130
pF1KB5 IL
>>CCDS58709.1 MSH2 gene_id:4436|Hs108|chr2 (868 aa)
initn: 392 init1: 345 opt: 554 Z-score: 565.1 bits: 115.6 E(32554): 3.7e-25
Smith-Waterman score: 581; 23.4% identity (57.8% similar) in 734 aa overlap (61-773:95-780)
40 50 60 70 80 90
pF1KB5 PGPREAEEEEVEEEEELAEIHLCVLWNSGYLGIAYYDTSDSTIHFMPDAPDHESLKLLQR
.:..: :. . . . . ::..... :.
CCDS58 FEDILFGNNDMSASIGVVGVKMSAVDGQRQVGVGYVDSIQRKLGLC-EFPDNDQFSNLEA
70 80 90 100 110 120
100 110 120 130 140
pF1KB5 VLDEINPQSVVTSAKQDENMTRFLGKLASQEHREPKRPEIIFLPSVDFGLEISKQ---RL
.: .:.:. : . . . .::: . .: : ..::. . : ::
CCDS58 LLIQIGPKECVLPGGETAGD---MGKLRQIIQRGGI--LITERKKADFSTKDIYQDLNRL
130 140 150 160 170
150 160 170 180 190 200
pF1KB5 LSGNYSFIPDAMTATEKILFLSSIIP-FDCLLTVRALGGLLKFLGRRRIGVELEDYNVSV
:.:. . . :. :...: .. ..: .:....::: :: . . .
CCDS58 LKGKKG---EQMN--------SAVLPEMENQVAVSSLSAVIKFL-------ELLSDDSNF
180 190 200 210 220
210 220 230 240 250 260
pF1KB5 PILGFKKFMLTHLVNIDQDTYSVLQIFKSESHPSVYKVASGLKEGLSLFGILNRCHCKWG
. . : ... ...: . .:..:.. . . .: . :: ..::.:. :
CCDS58 GQFELTTFDFSQYMKLDIAAVRALNLFQGSVEDT-----TGSQ---SLAALLNKCKTPQG
230 240 250 260 270
270 280 290 300 310 320
pF1KB5 EKLLRLWFTRPTHDLGELSSRLDVIQFFLLPQNLDMAQMLHR-LLGHIKNVPLILKRMKL
..:. :. .: : ... ::.... :. .. .. : :.. :: .. .. . :...
CCDS58 QRLVNQWIKQPLMDKNRIEERLNLVEAFV--EDAELRQTLQEDLLRRFPDLNRLAKKFQR
280 290 300 310 320 330
330 340 350 360 370
pF1KB5 SHTKVSDWQVLYK------TVYSALGLRDACRSLPQSIQLFRDIAQEFSDDLHHIASLIG
. ....: ::. .: .:: ... . . .: .. .:. .. .:
CCDS58 QAANLQDCYRLYQGINQLPNVIQALEKHEG-KHQKLLLAVFVTPLTDLRSDFSKFQEMIE
340 350 360 370 380
380 390 400 410 420 430
pF1KB5 KVVDFEGSLAENRFTVLPNIDPEIDEKKRRLMG-----LPSFLTEVARKELENLDSRIPS
..:.. .. ...: : :..::...: :..:. . : : .:: . ..:
CCDS58 TTLDMD-QVENHEFLVKPSFDPNLSEL-REIMNDLEKKMQSTLISAARDLGLDPGKQIKL
390 400 410 420 430 440
440 450 460 470 480 490
pF1KB5 CSVIYIPLIGFLLSIPRLPSMVEASDFEINGLDFMFLSEEKLHYRSARTKELDALLGDLH
: . :. . . : .. ... .: .... ... ... :. .
CCDS58 DSSAQF---GYYFRVTCKEEKVLRNNKNFSTVD---IQKNGVKFTNSKLTSLNEEYTKNK
450 460 470 480 490 500
500 510 520 530 540 550
pF1KB5 CEIRDQETLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALA--SAARDYGYSRPRYSPQ
: .. . .. .. . . . . :. ..::.....: : . : :: .
CCDS58 TEYEEAQDAIVKEIVNISSGYVEPMQTLNDVLAQLDAVVSFAHVSNGAPVPYVRPAILEK
510 520 530 540 550 560
560 570 580 590 600 610
pF1KB5 VLG-VRIQNGRHPLMELCAR-TFVPNSTECGGDKGRVKVITGPNSSGKSIYLKQVGLITF
: . .. .:: .:. . .:.::.. :: ..::::: .::: :..:.:.:..
CCDS58 GQGRIILKASRHACVEVQDEIAFIPNDVYFEKDKQMFHIITGPNMGGKSTYIRQTGVIVL
570 580 590 600 610 620
620 630 640 650 660 670
pF1KB5 MALVGSFVPAEEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQVAKAVNNATAQSLVLI
:: .: ::: : ::.. :: :..:. . .: :.:::: .. ..:. . .:: .::..:
CCDS58 MAQIGCFVPCESAEVSIVDCILARVGAGDSQLKGVSTFMAEMLETASILRSATKDSLIII
630 640 650 660 670 680
680 690 700 710 720
pF1KB5 DEFGKGTNTVDGLALLAAVLRHWLAR-GPTCPHIFVATNFLSLVQLQLLPQGPLVQYLTM
::.:.::.: ::..: :. .. .. : : .: ::.: :. : : : :. : .
CCDS58 DELGRGTSTYDGFGLAWAISEYIATKIGAFC--MF-ATHFHELTALA--NQIPTVNNLHV
690 700 710 720 730
730 740 750 760 770 780
pF1KB5 ETCEDGNDLVFFYQVCEGVAKASHASHTAAQAGLPDKLVARGKEVSDLIRSGKPIKPVKD
. . :...::: .:: : . :.: :..: ... .:.
CCDS58 TALTTEETLTMLYQVKKGVCDQSFGIHVAELANFPKHVIECAKQKALELEEFQYIGESQG
740 750 760 770 780 790
790 800 810 820 830
pF1KB5 LLKKNQMENCQTLVDKFMKLDLEDPNLDLNVFMSQEVLPAATSIL
CCDS58 YDIMEPAAKKCYLEREQGEKIIQEFLSKVKQMPFTEMSEENITIKLKQLKAEVIAKNNSF
800 810 820 830 840 850
>>CCDS1834.1 MSH2 gene_id:4436|Hs108|chr2 (934 aa)
initn: 392 init1: 345 opt: 554 Z-score: 564.7 bits: 115.6 E(32554): 3.9e-25
Smith-Waterman score: 581; 23.4% identity (57.8% similar) in 734 aa overlap (61-773:161-846)
40 50 60 70 80 90
pF1KB5 PGPREAEEEEVEEEEELAEIHLCVLWNSGYLGIAYYDTSDSTIHFMPDAPDHESLKLLQR
.:..: :. . . . . ::..... :.
CCDS18 FEDILFGNNDMSASIGVVGVKMSAVDGQRQVGVGYVDSIQRKLGLC-EFPDNDQFSNLEA
140 150 160 170 180
100 110 120 130 140
pF1KB5 VLDEINPQSVVTSAKQDENMTRFLGKLASQEHREPKRPEIIFLPSVDFGLEISKQ---RL
.: .:.:. : . . . .::: . .: : ..::. . : ::
CCDS18 LLIQIGPKECVLPGGETAGD---MGKLRQIIQRGGI--LITERKKADFSTKDIYQDLNRL
190 200 210 220 230 240
150 160 170 180 190 200
pF1KB5 LSGNYSFIPDAMTATEKILFLSSIIP-FDCLLTVRALGGLLKFLGRRRIGVELEDYNVSV
:.:. . . :. :...: .. ..: .:....::: :: . . .
CCDS18 LKGKKG---EQMN--------SAVLPEMENQVAVSSLSAVIKFL-------ELLSDDSNF
250 260 270 280
210 220 230 240 250 260
pF1KB5 PILGFKKFMLTHLVNIDQDTYSVLQIFKSESHPSVYKVASGLKEGLSLFGILNRCHCKWG
. . : ... ...: . .:..:.. . . .: . :: ..::.:. :
CCDS18 GQFELTTFDFSQYMKLDIAAVRALNLFQGSVEDT-----TGSQ---SLAALLNKCKTPQG
290 300 310 320 330
270 280 290 300 310 320
pF1KB5 EKLLRLWFTRPTHDLGELSSRLDVIQFFLLPQNLDMAQMLHR-LLGHIKNVPLILKRMKL
..:. :. .: : ... ::.... :. .. .. : :.. :: .. .. . :...
CCDS18 QRLVNQWIKQPLMDKNRIEERLNLVEAFV--EDAELRQTLQEDLLRRFPDLNRLAKKFQR
340 350 360 370 380 390
330 340 350 360 370
pF1KB5 SHTKVSDWQVLYK------TVYSALGLRDACRSLPQSIQLFRDIAQEFSDDLHHIASLIG
. ....: ::. .: .:: ... . . .: .. .:. .. .:
CCDS18 QAANLQDCYRLYQGINQLPNVIQALEKHEG-KHQKLLLAVFVTPLTDLRSDFSKFQEMIE
400 410 420 430 440 450
380 390 400 410 420 430
pF1KB5 KVVDFEGSLAENRFTVLPNIDPEIDEKKRRLMG-----LPSFLTEVARKELENLDSRIPS
..:.. .. ...: : :..::...: :..:. . : : .:: . ..:
CCDS18 TTLDMD-QVENHEFLVKPSFDPNLSEL-REIMNDLEKKMQSTLISAARDLGLDPGKQIKL
460 470 480 490 500 510
440 450 460 470 480 490
pF1KB5 CSVIYIPLIGFLLSIPRLPSMVEASDFEINGLDFMFLSEEKLHYRSARTKELDALLGDLH
: . :. . . : .. ... .: .... ... ... :. .
CCDS18 DSSAQF---GYYFRVTCKEEKVLRNNKNFSTVD---IQKNGVKFTNSKLTSLNEEYTKNK
520 530 540 550 560
500 510 520 530 540 550
pF1KB5 CEIRDQETLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALA--SAARDYGYSRPRYSPQ
: .. . .. .. . . . . :. ..::.....: : . : :: .
CCDS18 TEYEEAQDAIVKEIVNISSGYVEPMQTLNDVLAQLDAVVSFAHVSNGAPVPYVRPAILEK
570 580 590 600 610 620
560 570 580 590 600 610
pF1KB5 VLG-VRIQNGRHPLMELCAR-TFVPNSTECGGDKGRVKVITGPNSSGKSIYLKQVGLITF
: . .. .:: .:. . .:.::.. :: ..::::: .::: :..:.:.:..
CCDS18 GQGRIILKASRHACVEVQDEIAFIPNDVYFEKDKQMFHIITGPNMGGKSTYIRQTGVIVL
630 640 650 660 670 680
620 630 640 650 660 670
pF1KB5 MALVGSFVPAEEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQVAKAVNNATAQSLVLI
:: .: ::: : ::.. :: :..:. . .: :.:::: .. ..:. . .:: .::..:
CCDS18 MAQIGCFVPCESAEVSIVDCILARVGAGDSQLKGVSTFMAEMLETASILRSATKDSLIII
690 700 710 720 730 740
680 690 700 710 720
pF1KB5 DEFGKGTNTVDGLALLAAVLRHWLAR-GPTCPHIFVATNFLSLVQLQLLPQGPLVQYLTM
::.:.::.: ::..: :. .. .. : : .: ::.: :. : : : :. : .
CCDS18 DELGRGTSTYDGFGLAWAISEYIATKIGAFC--MF-ATHFHELTALA--NQIPTVNNLHV
750 760 770 780 790 800
730 740 750 760 770 780
pF1KB5 ETCEDGNDLVFFYQVCEGVAKASHASHTAAQAGLPDKLVARGKEVSDLIRSGKPIKPVKD
. . :...::: .:: : . :.: :..: ... .:.
CCDS18 TALTTEETLTMLYQVKKGVCDQSFGIHVAELANFPKHVIECAKQKALELEEFQYIGESQG
810 820 830 840 850 860
790 800 810 820 830
pF1KB5 LLKKNQMENCQTLVDKFMKLDLEDPNLDLNVFMSQEVLPAATSIL
CCDS18 YDIMEPAAKKCYLEREQGEKIIQEFLSKVKQMPFTEMSEENITIKLKQLKAEVIAKNNSF
870 880 890 900 910 920
>>CCDS670.1 MSH4 gene_id:4438|Hs108|chr1 (936 aa)
initn: 529 init1: 315 opt: 502 Z-score: 511.5 bits: 105.8 E(32554): 3.6e-22
Smith-Waterman score: 521; 24.3% identity (57.3% similar) in 602 aa overlap (253-823:334-914)
230 240 250 260 270 280
pF1KB5 DQDTYSVLQIFKSESHPSVYKVASGLKEGLSLFGILNRCHCKWGEKLLRLWFTRPTHDLG
.:::.:: . : . :: . .: :.
CCDS67 QGSEQTAMIDSSSAQNLELLINNQDYRNNHTLFGVLNYTKTPGGSRRLRSNILEPLVDIE
310 320 330 340 350 360
290 300 310 320 330
pF1KB5 ELSSRLDVIQFFLLPQNL--DMAQMLHRLLGHIKNVPLILK-----RMKLSHTKVSDWQV
.. ::: .: .: ..: . ... :.: . . .... .. ...:...
CCDS67 TINMRLDCVQELLQDEELFFGLQSVISRFLDTEQLLSVLVQIPKQDTVNAAESKITNLIY
370 380 390 400 410 420
340 350 360 370 380
pF1KB5 LYKTVYSALGLRDACRS--LPQSIQLFRDIA-QEFSDDLHHIASLIGKVVDF-EGSL---
: .:. . :. : .. : . .. ..:. :..: ..:. . . .: :
CCDS67 LKHTLELVDPLKIAMKNCNTPLLRAYYGSLEDKRFGIILEKIKTVINDDARYMKGCLNMR
430 440 450 460 470 480
390 400 410 420 430 440
pF1KB5 AENRFTVLPNIDPEIDEKKRRLM----GLPSFLTEVARKELENLDSRIPSCSVIYIPLIG
... ..: ::. .: .: . ........: : . . : ..: .
CCDS67 TQKCYAVRSNINEFLDIARRTYTEIVDDIAGMISQLGEKYSLPLRTSFSSARGFFIQMTT
490 500 510 520 530 540
450 460 470 480 490 500
pF1KB5 FLLSIP--RLPS-MVEASDFEINGLDFMFLSEEKLHYRSARTKELDALLGDLHCEIRDQE
...: .::: ... : . :. .: . :.. : .. . :: .
CCDS67 DCIALPSDQLPSEFIKISKVK-NSYSFTSADLIKMNERCQESLR----------EIYHMT
550 560 570 580 590
510 520 530 540 550 560
pF1KB5 TLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALASAARDYGYSRPRYSPQVLGVRIQNG
... .: .. . : .. : .: ::.::..: : : ::... . :..:
CCDS67 YMIVCKLLSEIYEHIHCLYKLSDTVSMLDMLLSFAHACTLSDYVRPEFTDTLA---IKQG
600 610 620 630 640
570 580 590 600 610 620
pF1KB5 RHPLME-LCARTFVPNSTECGGDKGRVKVITGPNSSGKSIYLKQVGLITFMALVGSFVPA
::..: . :. . :.: . . .::::: :::: ::::..: .:: .::.:::
CCDS67 WHPILEKISAEKPIANNTYVT-EGSNFLIITGPNMSGKSTYLKQIALCQIMAQIGSYVPA
650 660 670 680 690 700
630 640 650 660 670 680
pF1KB5 EEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQVAKAVNNATAQSLVLIDEFGKGTNTV
: . . . ::::: . ..: . :::: .....: ..::. .::.::::.:.::::
CCDS67 EYSSFRIAKQIFTRISTDDDIETNSSTFMKEMKEIAYILHNANDKSLILIDELGRGTNTE
710 720 730 740 750 760
690 700 710 720 730
pF1KB5 DGLALLAAVLRHWLARGPTCPHIFVATNFLSLVQLQLLPQGPLVQYLTME------TCED
.:... :: .. :. . ::.:: : ... : : :. . .: : ..
CCDS67 EGIGICYAVCEYLLS---LKAFTLFATHFLELCHIDALY--PNVENMHFEVQHVKNTSRN
770 780 790 800 810 820
740 750 760 770 780 790
pF1KB5 GNDLVFFYQVCEGVAKASHASHTAAQ-AGLPDKLVARGKEVSDLIRSG--KPIKPVKDLL
. ... :.. .:... .. . ::. ..:: ..: .::.. : . . . ..
CCDS67 KEAILYTYKLSKGLTEEKNYGLKAAEVSSLPPSIVLDAKEITTQITRQILQNQRSTPEME
830 840 850 860 870 880
800 810 820 830
pF1KB5 KKNQMENCQTLVDKFMKLDLEDPNLDLNVFMSQEVLPAATSIL
.. . . : . . . . ::. .: ...:
CCDS67 RQRAVYHLATRLVQTARNSQLDPD-SLRIYLSNLKKKYKEDFPRTEQVPEKTEE
890 900 910 920 930
>>CCDS62907.1 MSH6 gene_id:2956|Hs108|chr2 (1058 aa)
initn: 416 init1: 311 opt: 393 Z-score: 399.2 bits: 85.2 E(32554): 6.5e-16
Smith-Waterman score: 538; 27.6% identity (56.2% similar) in 660 aa overlap (178-771:377-1014)
150 160 170 180 190 200
pF1KB5 LSGNYSFIPDAMTATEKILFLSSIIPFDCLLTVRALGGLLKFLGRRRIGVEL---EDYNV
:.. :::: . .: . : :: ...
CCDS62 DGIGVMLPQVLKGMTSESDSIGLTPGEKSELALSALGGCVFYLKKCLIDQELLSMANFEE
350 360 370 380 390 400
210 220 230 240 250 260
pF1KB5 SVPILGFKKFMLTHLVNIDQDTYS--VLQIFKSESHPSVYKVASGLKEGLSLFGILNRCH
.: : :. : .:. ::. .. . ..: :: .:. .. ::
CCDS62 YIP-LDSDTVSTTRSGAIFTKAYQRMVLDAVTLNNLEIFLNGTNGSTEG-TLLERVDTCH
410 420 430 440 450 460
270 280 290 300 310
pF1KB5 CKWGEKLLRLWFTRPTHDLGELSSRLDVIQ-FFLLPQNL-DMAQMLH------RLLGHIK
.:..::. :. : . ...:::.:. ....:... .....:. :::..:.
CCDS62 TPFGKRLLKQWLCAPLCNHYAINDRLDAIEDLMVVPDKISEVVELLKKLPDLERLLSKIH
470 480 490 500 510 520
320 330 340 350 360 370
pF1KB5 NVPLILKRMKLSHTKVSDWQVLYK-TVYSALGLRDACRSLPQSIQLFR--DIAQEFSDDL
:: :: :... .. ..:. :.:: . : .: . . : .: .: .
CCDS62 NVGSPLK----SQNHPDSRAIMYEETTYSKKKIIDFLSALEGFKVMCKIIGIMEEVADGF
530 540 550 560 570 580
380 390 400 410
pF1KB5 HHIASLIGKVVDFEGSLAENRF---TV-LPNIDPEIDEKKRRLMGL--PS--F-------
. .... .:.... . :.:: :: : : .:..: : :: :. :
CCDS62 K--SKILKQVISLQTKNPEGRFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQA
590 600 610 620 630
420 430 440 450 460
pF1KB5 LTEVARKE------LENLDSRIPSCSVIYIPLIG---FLLSIPRLPSMVEASDFEINGLD
:... ..: ::. .:: .: .: :: . : ::. .: .:
CCDS62 LADIRENEQSLLEYLEKQRNRI-GCRTIVYWGIGRNRYQLEIPE--------NFTTRNLP
640 650 660 670 680
470 480 490 500 510 520
pF1KB5 FMF-LSEEKLHYRSARTKELDALLGDL-HCEIRDQETL--LMYQLQCQVLARAAVLTRVL
. :. : . :: .. :..: . : : . .: : .: . ..
CCDS62 EEYELKSTKKGCKRYWTKTIEKKLANLINAEERRDVSLKDCMRRLFYNFDKNYKDWQSAV
690 700 710 720 730 740
530 540 550 560 570
pF1KB5 DLASRLDVLLALASAAR--DYGYSRP-----RYSPQVLGVRIQNGRHPLME--LCARTFV
. . ::::: ::. .: : . :: . .: : .....::: . . . :.
CCDS62 ECIAVLDVLLCLANYSRGGDGPMCRPVILLPEDTPPFL--ELKGSRHPCITKTFFGDDFI
750 760 770 780 790 800
580 590 600 610 620
pF1KB5 PNSTECGGD-------KGRVKVITGPNSSGKSIYLKQVGLITFMALVGSFVPAEEAEIGA
::. : . :. ..:::: .::: ..:.::.. :: .: .:::: ..
CCDS62 PNDILIGCEEEEQENGKAYCVLVTGPNMGGKSTLMRQAGLLAVMAQMGCYVPAEVCRLTP
810 820 830 840 850 860
630 640 650 660 670 680
pF1KB5 VDAIFTRIHSCESISLGLSTFMIDLNQVAKAVNNATAQSLVLIDEFGKGTNTVDGLALLA
.: .:::. . . : : :::...:...:. . .:::.::::.::.:.:: : :: :.
CCDS62 IDRVFTRLGASDRIMSGESTFFVELSETASILMHATAHSLVLVDELGRGTATFDGTAIAN
870 880 890 900 910 920
690 700 710 720 730 740
pF1KB5 AVLRHWLARGPTCPHIFVATNFLSLV----QLQLLPQGPLVQYLTMETCEDGND--LVFF
::... ::. : .: .:.. ::: : . : .. .. : ::: .. ..:.
CCDS62 AVVKE-LAETIKCRTLF-STHYHSLVEDYSQNVAVRLGHMACMVENE-CEDPSQETITFL
930 940 950 960 970 980
750 760 770 780 790 800
pF1KB5 YQVCEGVAKASHASHTAAQAGLPDKLVARGKEVSDLIRSGKPIKPVKDLLKKNQMENCQT
:. .:. :.. ..: :.::.... .:
CCDS62 YKFIKGACPKSYGFNAARLANLPEEVIQKGHRKAREFEKMNQSLRLFREVCLASERSTVD
990 1000 1010 1020 1030 1040
>>CCDS62906.1 MSH6 gene_id:2956|Hs108|chr2 (1230 aa)
initn: 456 init1: 311 opt: 393 Z-score: 398.3 bits: 85.2 E(32554): 7.3e-16
Smith-Waterman score: 538; 27.6% identity (56.2% similar) in 660 aa overlap (178-771:549-1186)
150 160 170 180 190 200
pF1KB5 LSGNYSFIPDAMTATEKILFLSSIIPFDCLLTVRALGGLLKFLGRRRIGVEL---EDYNV
:.. :::: . .: . : :: ...
CCDS62 DGIGVMLPQVLKGMTSESDSIGLTPGEKSELALSALGGCVFYLKKCLIDQELLSMANFEE
520 530 540 550 560 570
210 220 230 240 250 260
pF1KB5 SVPILGFKKFMLTHLVNIDQDTYS--VLQIFKSESHPSVYKVASGLKEGLSLFGILNRCH
.: : :. : .:. ::. .. . ..: :: .:. .. ::
CCDS62 YIP-LDSDTVSTTRSGAIFTKAYQRMVLDAVTLNNLEIFLNGTNGSTEG-TLLERVDTCH
580 590 600 610 620 630
270 280 290 300 310
pF1KB5 CKWGEKLLRLWFTRPTHDLGELSSRLDVIQ-FFLLPQNL-DMAQMLH------RLLGHIK
.:..::. :. : . ...:::.:. ....:... .....:. :::..:.
CCDS62 TPFGKRLLKQWLCAPLCNHYAINDRLDAIEDLMVVPDKISEVVELLKKLPDLERLLSKIH
640 650 660 670 680 690
320 330 340 350 360 370
pF1KB5 NVPLILKRMKLSHTKVSDWQVLYK-TVYSALGLRDACRSLPQSIQLFR--DIAQEFSDDL
:: :: :... .. ..:. :.:: . : .: . . : .: .: .
CCDS62 NVGSPLK----SQNHPDSRAIMYEETTYSKKKIIDFLSALEGFKVMCKIIGIMEEVADGF
700 710 720 730 740 750
380 390 400 410
pF1KB5 HHIASLIGKVVDFEGSLAENRF---TV-LPNIDPEIDEKKRRLMGL--PS--F-------
. .... .:.... . :.:: :: : : .:..: : :: :. :
CCDS62 K--SKILKQVISLQTKNPEGRFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQA
760 770 780 790 800 810
420 430 440 450 460
pF1KB5 LTEVARKE------LENLDSRIPSCSVIYIPLIG---FLLSIPRLPSMVEASDFEINGLD
:... ..: ::. .:: .: .: :: . : ::. .: .:
CCDS62 LADIRENEQSLLEYLEKQRNRI-GCRTIVYWGIGRNRYQLEIPE--------NFTTRNLP
820 830 840 850 860
470 480 490 500 510 520
pF1KB5 FMF-LSEEKLHYRSARTKELDALLGDL-HCEIRDQETL--LMYQLQCQVLARAAVLTRVL
. :. : . :: .. :..: . : : . .: : .: . ..
CCDS62 EEYELKSTKKGCKRYWTKTIEKKLANLINAEERRDVSLKDCMRRLFYNFDKNYKDWQSAV
870 880 890 900 910 920
530 540 550 560 570
pF1KB5 DLASRLDVLLALASAAR--DYGYSRP-----RYSPQVLGVRIQNGRHPLME--LCARTFV
. . ::::: ::. .: : . :: . .: : .....::: . . . :.
CCDS62 ECIAVLDVLLCLANYSRGGDGPMCRPVILLPEDTPPFL--ELKGSRHPCITKTFFGDDFI
930 940 950 960 970
580 590 600 610 620
pF1KB5 PNSTECGGD-------KGRVKVITGPNSSGKSIYLKQVGLITFMALVGSFVPAEEAEIGA
::. : . :. ..:::: .::: ..:.::.. :: .: .:::: ..
CCDS62 PNDILIGCEEEEQENGKAYCVLVTGPNMGGKSTLMRQAGLLAVMAQMGCYVPAEVCRLTP
980 990 1000 1010 1020 1030
630 640 650 660 670 680
pF1KB5 VDAIFTRIHSCESISLGLSTFMIDLNQVAKAVNNATAQSLVLIDEFGKGTNTVDGLALLA
.: .:::. . . : : :::...:...:. . .:::.::::.::.:.:: : :: :.
CCDS62 IDRVFTRLGASDRIMSGESTFFVELSETASILMHATAHSLVLVDELGRGTATFDGTAIAN
1040 1050 1060 1070 1080 1090
690 700 710 720 730 740
pF1KB5 AVLRHWLARGPTCPHIFVATNFLSLV----QLQLLPQGPLVQYLTMETCEDGND--LVFF
::... ::. : .: .:.. ::: : . : .. .. : ::: .. ..:.
CCDS62 AVVKE-LAETIKCRTLF-STHYHSLVEDYSQNVAVRLGHMACMVENE-CEDPSQETITFL
1100 1110 1120 1130 1140 1150
750 760 770 780 790 800
pF1KB5 YQVCEGVAKASHASHTAAQAGLPDKLVARGKEVSDLIRSGKPIKPVKDLLKKNQMENCQT
:. .:. :.. ..: :.::.... .:
CCDS62 YKFIKGACPKSYGFNAARLANLPEEVIQKGHRKAREFEKMNQSLRLFREVCLASERSTVD
1160 1170 1180 1190 1200 1210
>>CCDS1836.1 MSH6 gene_id:2956|Hs108|chr2 (1360 aa)
initn: 456 init1: 311 opt: 393 Z-score: 397.7 bits: 85.3 E(32554): 7.9e-16
Smith-Waterman score: 538; 27.6% identity (56.2% similar) in 660 aa overlap (178-771:679-1316)
150 160 170 180 190 200
pF1KB5 LSGNYSFIPDAMTATEKILFLSSIIPFDCLLTVRALGGLLKFLGRRRIGVEL---EDYNV
:.. :::: . .: . : :: ...
CCDS18 DGIGVMLPQVLKGMTSESDSIGLTPGEKSELALSALGGCVFYLKKCLIDQELLSMANFEE
650 660 670 680 690 700
210 220 230 240 250 260
pF1KB5 SVPILGFKKFMLTHLVNIDQDTYS--VLQIFKSESHPSVYKVASGLKEGLSLFGILNRCH
.: : :. : .:. ::. .. . ..: :: .:. .. ::
CCDS18 YIP-LDSDTVSTTRSGAIFTKAYQRMVLDAVTLNNLEIFLNGTNGSTEG-TLLERVDTCH
710 720 730 740 750 760
270 280 290 300 310
pF1KB5 CKWGEKLLRLWFTRPTHDLGELSSRLDVIQ-FFLLPQNL-DMAQMLH------RLLGHIK
.:..::. :. : . ...:::.:. ....:... .....:. :::..:.
CCDS18 TPFGKRLLKQWLCAPLCNHYAINDRLDAIEDLMVVPDKISEVVELLKKLPDLERLLSKIH
770 780 790 800 810 820
320 330 340 350 360 370
pF1KB5 NVPLILKRMKLSHTKVSDWQVLYK-TVYSALGLRDACRSLPQSIQLFR--DIAQEFSDDL
:: :: :... .. ..:. :.:: . : .: . . : .: .: .
CCDS18 NVGSPLK----SQNHPDSRAIMYEETTYSKKKIIDFLSALEGFKVMCKIIGIMEEVADGF
830 840 850 860 870 880
380 390 400 410
pF1KB5 HHIASLIGKVVDFEGSLAENRF---TV-LPNIDPEIDEKKRRLMGL--PS--F-------
. .... .:.... . :.:: :: : : .:..: : :: :. :
CCDS18 K--SKILKQVISLQTKNPEGRFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQA
890 900 910 920 930 940
420 430 440 450 460
pF1KB5 LTEVARKE------LENLDSRIPSCSVIYIPLIG---FLLSIPRLPSMVEASDFEINGLD
:... ..: ::. .:: .: .: :: . : ::. .: .:
CCDS18 LADIRENEQSLLEYLEKQRNRI-GCRTIVYWGIGRNRYQLEIPE--------NFTTRNLP
950 960 970 980 990
470 480 490 500 510 520
pF1KB5 FMF-LSEEKLHYRSARTKELDALLGDL-HCEIRDQETL--LMYQLQCQVLARAAVLTRVL
. :. : . :: .. :..: . : : . .: : .: . ..
CCDS18 EEYELKSTKKGCKRYWTKTIEKKLANLINAEERRDVSLKDCMRRLFYNFDKNYKDWQSAV
1000 1010 1020 1030 1040 1050
530 540 550 560 570
pF1KB5 DLASRLDVLLALASAAR--DYGYSRP-----RYSPQVLGVRIQNGRHPLME--LCARTFV
. . ::::: ::. .: : . :: . .: : .....::: . . . :.
CCDS18 ECIAVLDVLLCLANYSRGGDGPMCRPVILLPEDTPPFL--ELKGSRHPCITKTFFGDDFI
1060 1070 1080 1090 1100
580 590 600 610 620
pF1KB5 PNSTECGGD-------KGRVKVITGPNSSGKSIYLKQVGLITFMALVGSFVPAEEAEIGA
::. : . :. ..:::: .::: ..:.::.. :: .: .:::: ..
CCDS18 PNDILIGCEEEEQENGKAYCVLVTGPNMGGKSTLMRQAGLLAVMAQMGCYVPAEVCRLTP
1110 1120 1130 1140 1150 1160
630 640 650 660 670 680
pF1KB5 VDAIFTRIHSCESISLGLSTFMIDLNQVAKAVNNATAQSLVLIDEFGKGTNTVDGLALLA
.: .:::. . . : : :::...:...:. . .:::.::::.::.:.:: : :: :.
CCDS18 IDRVFTRLGASDRIMSGESTFFVELSETASILMHATAHSLVLVDELGRGTATFDGTAIAN
1170 1180 1190 1200 1210 1220
690 700 710 720 730 740
pF1KB5 AVLRHWLARGPTCPHIFVATNFLSLV----QLQLLPQGPLVQYLTMETCEDGND--LVFF
::... ::. : .: .:.. ::: : . : .. .. : ::: .. ..:.
CCDS18 AVVKE-LAETIKCRTLF-STHYHSLVEDYSQNVAVRLGHMACMVENE-CEDPSQETITFL
1230 1240 1250 1260 1270 1280
750 760 770 780 790 800
pF1KB5 YQVCEGVAKASHASHTAAQAGLPDKLVARGKEVSDLIRSGKPIKPVKDLLKKNQMENCQT
:. .:. :.. ..: :.::.... .:
CCDS18 YKFIKGACPKSYGFNAARLANLPEEVIQKGHRKAREFEKMNQSLRLFREVCLASERSTVD
1290 1300 1310 1320 1330 1340
834 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 15:36:04 2016 done: Sat Nov 5 15:36:05 2016
Total Scan time: 4.170 Total Display time: 0.250
Function used was FASTA [36.3.4 Apr, 2011]