FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5799, 834 aa 1>>>pF1KB5799 834 - 834 aa - 834 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.9470+/-0.000899; mu= 19.1976+/- 0.055 mean_var=95.5168+/-18.850, 0's: 0 Z-trim(108.3): 14 B-trim: 109 in 1/51 Lambda= 0.131230 statistics sampled from 10135 (10145) to 10135 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.661), E-opt: 0.2 (0.312), width: 16 Scan time: 4.170 The best scores are: opt bits E(32554) CCDS4720.1 MSH5 gene_id:4439|Hs108|chr6 ( 834) 5468 1045.9 0 CCDS34410.1 MSH5 gene_id:4439|Hs108|chr6 ( 835) 5456 1043.7 0 CCDS34409.2 MSH5 gene_id:4439|Hs108|chr6 ( 822) 3687 708.8 9.8e-204 CCDS34195.1 MSH3 gene_id:4437|Hs108|chr5 (1137) 588 122.1 5.3e-27 CCDS58709.1 MSH2 gene_id:4436|Hs108|chr2 ( 868) 554 115.6 3.7e-25 CCDS1834.1 MSH2 gene_id:4436|Hs108|chr2 ( 934) 554 115.6 3.9e-25 CCDS670.1 MSH4 gene_id:4438|Hs108|chr1 ( 936) 502 105.8 3.6e-22 CCDS62907.1 MSH6 gene_id:2956|Hs108|chr2 (1058) 393 85.2 6.5e-16 CCDS62906.1 MSH6 gene_id:2956|Hs108|chr2 (1230) 393 85.2 7.3e-16 CCDS1836.1 MSH6 gene_id:2956|Hs108|chr2 (1360) 393 85.3 7.9e-16 >>CCDS4720.1 MSH5 gene_id:4439|Hs108|chr6 (834 aa) initn: 5468 init1: 5468 opt: 5468 Z-score: 5593.4 bits: 1045.9 E(32554): 0 Smith-Waterman score: 5468; 100.0% identity (100.0% similar) in 834 aa overlap (1-834:1-834) 10 20 30 40 50 60 pF1KB5 MASLGANPRRTPQGPRPGAASSGFPSPAPVPGPREAEEEEVEEEEELAEIHLCVLWNSGY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 MASLGANPRRTPQGPRPGAASSGFPSPAPVPGPREAEEEEVEEEEELAEIHLCVLWNSGY 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 LGIAYYDTSDSTIHFMPDAPDHESLKLLQRVLDEINPQSVVTSAKQDENMTRFLGKLASQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 LGIAYYDTSDSTIHFMPDAPDHESLKLLQRVLDEINPQSVVTSAKQDENMTRFLGKLASQ 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 EHREPKRPEIIFLPSVDFGLEISKQRLLSGNYSFIPDAMTATEKILFLSSIIPFDCLLTV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 EHREPKRPEIIFLPSVDFGLEISKQRLLSGNYSFIPDAMTATEKILFLSSIIPFDCLLTV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 RALGGLLKFLGRRRIGVELEDYNVSVPILGFKKFMLTHLVNIDQDTYSVLQIFKSESHPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 RALGGLLKFLGRRRIGVELEDYNVSVPILGFKKFMLTHLVNIDQDTYSVLQIFKSESHPS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 VYKVASGLKEGLSLFGILNRCHCKWGEKLLRLWFTRPTHDLGELSSRLDVIQFFLLPQNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 VYKVASGLKEGLSLFGILNRCHCKWGEKLLRLWFTRPTHDLGELSSRLDVIQFFLLPQNL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 DMAQMLHRLLGHIKNVPLILKRMKLSHTKVSDWQVLYKTVYSALGLRDACRSLPQSIQLF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 DMAQMLHRLLGHIKNVPLILKRMKLSHTKVSDWQVLYKTVYSALGLRDACRSLPQSIQLF 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 RDIAQEFSDDLHHIASLIGKVVDFEGSLAENRFTVLPNIDPEIDEKKRRLMGLPSFLTEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 RDIAQEFSDDLHHIASLIGKVVDFEGSLAENRFTVLPNIDPEIDEKKRRLMGLPSFLTEV 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB5 ARKELENLDSRIPSCSVIYIPLIGFLLSIPRLPSMVEASDFEINGLDFMFLSEEKLHYRS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 ARKELENLDSRIPSCSVIYIPLIGFLLSIPRLPSMVEASDFEINGLDFMFLSEEKLHYRS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB5 ARTKELDALLGDLHCEIRDQETLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALASAAR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 ARTKELDALLGDLHCEIRDQETLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALASAAR 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB5 DYGYSRPRYSPQVLGVRIQNGRHPLMELCARTFVPNSTECGGDKGRVKVITGPNSSGKSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 DYGYSRPRYSPQVLGVRIQNGRHPLMELCARTFVPNSTECGGDKGRVKVITGPNSSGKSI 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB5 YLKQVGLITFMALVGSFVPAEEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQVAKAVN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 YLKQVGLITFMALVGSFVPAEEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQVAKAVN 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB5 NATAQSLVLIDEFGKGTNTVDGLALLAAVLRHWLARGPTCPHIFVATNFLSLVQLQLLPQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 NATAQSLVLIDEFGKGTNTVDGLALLAAVLRHWLARGPTCPHIFVATNFLSLVQLQLLPQ 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB5 GPLVQYLTMETCEDGNDLVFFYQVCEGVAKASHASHTAAQAGLPDKLVARGKEVSDLIRS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 GPLVQYLTMETCEDGNDLVFFYQVCEGVAKASHASHTAAQAGLPDKLVARGKEVSDLIRS 730 740 750 760 770 780 790 800 810 820 830 pF1KB5 GKPIKPVKDLLKKNQMENCQTLVDKFMKLDLEDPNLDLNVFMSQEVLPAATSIL :::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 GKPIKPVKDLLKKNQMENCQTLVDKFMKLDLEDPNLDLNVFMSQEVLPAATSIL 790 800 810 820 830 >>CCDS34410.1 MSH5 gene_id:4439|Hs108|chr6 (835 aa) initn: 4297 init1: 4297 opt: 5456 Z-score: 5581.1 bits: 1043.7 E(32554): 0 Smith-Waterman score: 5456; 99.9% identity (99.9% similar) in 835 aa overlap (1-834:1-835) 10 20 30 40 50 60 pF1KB5 MASLGANPRRTPQGPRPGAASSGFPSPAPVPGPREAEEEEVEEEEELAEIHLCVLWNSGY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 MASLGANPRRTPQGPRPGAASSGFPSPAPVPGPREAEEEEVEEEEELAEIHLCVLWNSGY 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 LGIAYYDTSDSTIHFMPDAPDHESLKLLQRVLDEINPQSVVTSAKQDENMTRFLGKLASQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 LGIAYYDTSDSTIHFMPDAPDHESLKLLQRVLDEINPQSVVTSAKQDENMTRFLGKLASQ 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 EHREPKRPEIIFLPSVDFGLEISKQRLLSGNYSFIPDAMTATEKILFLSSIIPFDCLLTV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 EHREPKRPEIIFLPSVDFGLEISKQRLLSGNYSFIPDAMTATEKILFLSSIIPFDCLLTV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 RALGGLLKFLGRRRIGVELEDYNVSVPILGFKKFMLTHLVNIDQDTYSVLQIFKSESHPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 RALGGLLKFLGRRRIGVELEDYNVSVPILGFKKFMLTHLVNIDQDTYSVLQIFKSESHPS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 VYKVASGLKEGLSLFGILNRCHCKWGEKLLRLWFTRPTHDLGELSSRLDVIQFFLLPQNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 VYKVASGLKEGLSLFGILNRCHCKWGEKLLRLWFTRPTHDLGELSSRLDVIQFFLLPQNL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 DMAQMLHRLLGHIKNVPLILKRMKLSHTKVSDWQVLYKTVYSALGLRDACRSLPQSIQLF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 DMAQMLHRLLGHIKNVPLILKRMKLSHTKVSDWQVLYKTVYSALGLRDACRSLPQSIQLF 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 RDIAQEFSDDLHHIASLIGKVVDFEGSLAENRFTVLPNIDPEIDEKKRRLMGLPSFLTEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 RDIAQEFSDDLHHIASLIGKVVDFEGSLAENRFTVLPNIDPEIDEKKRRLMGLPSFLTEV 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB5 ARKELENLDSRIPSCSVIYIPLIGFLLSIPRLPSMVEASDFEINGLDFMFLSEEKLHYRS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 ARKELENLDSRIPSCSVIYIPLIGFLLSIPRLPSMVEASDFEINGLDFMFLSEEKLHYRS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB5 ARTKELDALLGDLHCEIRDQETLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALASAAR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 ARTKELDALLGDLHCEIRDQETLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALASAAR 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB5 DYGYSRPRYSPQVLGVRIQNGRHPLMELCARTFVPNSTECGGDKGRVKVITGPNSSGKSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 DYGYSRPRYSPQVLGVRIQNGRHPLMELCARTFVPNSTECGGDKGRVKVITGPNSSGKSI 550 560 570 580 590 600 610 620 630 640 650 pF1KB5 YLKQVGLITFMALVGSFVPAEEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQ-VAKAV :::::::::::::::::::::::::::::::::::::::::::::::::::::: ::::: CCDS34 YLKQVGLITFMALVGSFVPAEEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQQVAKAV 610 620 630 640 650 660 660 670 680 690 700 710 pF1KB5 NNATAQSLVLIDEFGKGTNTVDGLALLAAVLRHWLARGPTCPHIFVATNFLSLVQLQLLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 NNATAQSLVLIDEFGKGTNTVDGLALLAAVLRHWLARGPTCPHIFVATNFLSLVQLQLLP 670 680 690 700 710 720 720 730 740 750 760 770 pF1KB5 QGPLVQYLTMETCEDGNDLVFFYQVCEGVAKASHASHTAAQAGLPDKLVARGKEVSDLIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 QGPLVQYLTMETCEDGNDLVFFYQVCEGVAKASHASHTAAQAGLPDKLVARGKEVSDLIR 730 740 750 760 770 780 780 790 800 810 820 830 pF1KB5 SGKPIKPVKDLLKKNQMENCQTLVDKFMKLDLEDPNLDLNVFMSQEVLPAATSIL ::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 SGKPIKPVKDLLKKNQMENCQTLVDKFMKLDLEDPNLDLNVFMSQEVLPAATSIL 790 800 810 820 830 >>CCDS34409.2 MSH5 gene_id:4439|Hs108|chr6 (822 aa) initn: 3691 init1: 3107 opt: 3687 Z-score: 3771.1 bits: 708.8 E(32554): 9.8e-204 Smith-Waterman score: 5148; 94.4% identity (94.4% similar) in 852 aa overlap (1-834:1-822) 10 20 30 40 50 60 pF1KB5 MASLGANPRRTPQGPRPGAASSGFPSPAPVPGPREAEEEEVEEEEELAEIHLCVLWNSGY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 MASLGANPRRTPQGPRPGAASSGFPSPAPVPGPREAEEEEVEEEEELAEIHLCVLWNSGY 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 LGIAYYDTSDSTIHFMPDAPDHESLKLLQRVLDEINPQSVVTSAKQDENMTRFLGKLASQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 LGIAYYDTSDSTIHFMPDAPDHESLKLLQRVLDEINPQSVVTSAKQDENMTRFLGKLASQ 70 80 90 100 110 120 130 140 150 160 170 pF1KB5 EHREPKRPEIIFLPSVDFGLEISKQRLLSGNYSFIPDAMTATEKILFLSSIIPFDCLLT- ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 EHREPKRPEIIFLPSVDFGLEISKQRLLSGNYSFIPDAMTATEKILFLSSIIPFDCLLTP 130 140 150 160 170 180 180 190 200 210 220 pF1KB5 ----------------VRALGGLLKFLGRRRIGVELEDYNVSVPILGFKKFMLTHLVNID :::::::::::::::::::::::::::::::::::::::::::: CCDS34 PGDLRFTPIPLLIPSQVRALGGLLKFLGRRRIGVELEDYNVSVPILGFKKFMLTHLVNID 190 200 210 220 230 240 230 240 250 260 270 280 pF1KB5 QDTYSVLQIFKSESHPSVYKVASGLKEGLSLFGILNRCHCKWGEKLLRLWFTRPTHDLGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 QDTYSVLQIFKSESHPSVYKVASGLKEGLSLFGILNRCHCKWGEKLLRLWFTRPTHDLGE 250 260 270 280 290 300 290 300 310 320 330 340 pF1KB5 LSSRLDVIQFFLLPQNLDMAQMLHRLLGHIKNVPLILKRMKLSHTKVSDWQVLYKTVYSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 LSSRLDVIQFFLLPQNLDMAQMLHRLLGHIKNVPLILKRMKLSHTKVSDWQVLYKTVYSA 310 320 330 340 350 360 350 360 370 380 390 400 pF1KB5 LGLRDACRSLPQSIQLFRDIAQEFSDDLHHIASLIGKVVDFEGSLAENRFTVLPNIDPEI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 LGLRDACRSLPQSIQLFRDIAQEFSDDLHHIASLIGKVVDFEGSLAENRFTVLPNIDPEI 370 380 390 400 410 420 410 420 430 440 450 460 pF1KB5 DEKKRRLMGLPSFLTEVARKELENLDSRIPSCSVIYIPLIGFLLSIPRLPSMVEASDFEI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 DEKKRRLMGLPSFLTEVARKELENLDSRIPSCSVIYIPLIGFLLSIPRLPSMVEASDFEI 430 440 450 460 470 480 470 480 490 500 510 520 pF1KB5 NGLDFMFLSEEKLHYRSARTKELDALLGDLHCEIRDQETLLMYQLQCQVLARAAVLTRVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 NGLDFMFLSEEKLHYRSARTKELDALLGDLHCEIRDQETLLMYQLQCQVLARAAVLTRVL 490 500 510 520 530 540 530 540 550 560 570 580 pF1KB5 DLASRLDVLLALASAARDYGYSRPRYSPQVLGVRIQNGRHPLMELCARTFVPNSTECGGD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 DLASRLDVLLALASAARDYGYSRPRYSPQVLGVRIQNGRHPLMELCARTFVPNSTECGGD 550 560 570 580 590 600 590 600 610 620 630 640 pF1KB5 KGRVKVITGPNSSGKSIYLKQVGLITFMALVGSFVPAEEAEIGAVDAIFTRIHSCESISL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 KGRVKVITGPNSSGKSIYLKQVGLITFMALVGSFVPAEEAEIGAVDAIFTRIHSCESISL 610 620 630 640 650 660 650 660 670 680 690 700 pF1KB5 GLSTFMIDLNQ-VAKAVNNATAQSLVLIDEFGKGTNTVDGLALLAAVLRHWLARGPTCPH ::::::::::: :::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 GLSTFMIDLNQQVAKAVNNATAQSLVLIDEFGKGTNTVDGLALLAAVLRHWLARGPTCPH 670 680 690 700 710 720 710 720 730 740 750 760 pF1KB5 IFVATNFLSLVQLQLLPQGPLVQYLTMETCEDGNDLVFFYQVCEGVAKASHASHTAAQAG :::::::::::::::::::::::::::::::::::::::::: CCDS34 IFVATNFLSLVQLQLLPQGPLVQYLTMETCEDGNDLVFFYQV------------------ 730 740 750 760 770 780 790 800 810 820 pF1KB5 LPDKLVARGKEVSDLIRSGKPIKPVKDLLKKNQMENCQTLVDKFMKLDLEDPNLDLNVFM :::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 ------------SDLIRSGKPIKPVKDLLKKNQMENCQTLVDKFMKLDLEDPNLDLNVFM 770 780 790 800 810 830 pF1KB5 SQEVLPAATSIL :::::::::::: CCDS34 SQEVLPAATSIL 820 >>CCDS34195.1 MSH3 gene_id:4437|Hs108|chr5 (1137 aa) initn: 485 init1: 416 opt: 588 Z-score: 598.3 bits: 122.1 E(32554): 5.3e-27 Smith-Waterman score: 649; 27.8% identity (59.9% similar) in 616 aa overlap (241-818:547-1135) 220 230 240 250 260 270 pF1KB5 FKKFMLTHLVNIDQDTYSVLQIFKSESHPSVYKVASGLKEGLSLFGILNRCHCKWGEKLL . . . .: ::. .:.. . ..:.. : CCDS34 KMLSKPENFKQLSSKMEFMTINGTTLRNLEILQNQTDMKTKGSLLWVLDHTKTSFGRRKL 520 530 540 550 560 570 280 290 300 310 320 pF1KB5 RLWFTRPTHDLGELSSRLDVIQFFLLPQNLDMAQMLHRLLGHIKNVPLILKRM-KLSHTK . : :.: : :...:::... : .. ... .. .:....: : . . .. : : CCDS34 KKWVTQPLLKLREINARLDAVSEVLHSES----SVFGQIENHLRKLPDIERGLCSIYHKK 580 590 600 610 620 630 330 340 350 360 370 380 pF1KB5 VSDWQ--VLYKTVYSA----LGLRDACRSLPQSIQLFRDIAQEFSDDLHHIASLIGKVVD : . .. ::.: .. : : :: .:.: . :. . : . . :... CCDS34 CSTQEFFLIVKTLYHLKSEFQAIIPAVNSHIQS-DLLRTVILEIPELLSPVEHYL-KILN 640 650 660 670 680 690 390 400 410 420 430 440 pF1KB5 FEGSLAENRFTVLPNID--PEIDEKKRRLMGLPSFLTEVARKELENLDSRIPSCSVIYIP ... . .. .. ... : : ..: ...:. . :. : .:... . . . :. :. CCDS34 EQAAKVGDKTELFKDLSDFPLIKKRKDEIQGV---IDEI-RMHLQEIRKILKNPSAQYVT 700 710 720 730 740 450 460 470 480 490 pF1KB5 LIG--FLLSIPR-----LPS-MVEASDFE-INGLDFMFLSEEKLHYRSARTKELDALLGD . : :.. : .:. :.... . .. . :. :. : . : . . CCDS34 VSGQEFMIEIKNSAVSCIPTDWVKVGSTKAVSRFHSPFIVENYRHLNQLREQLV------ 750 760 770 780 790 800 500 510 520 530 540 550 pF1KB5 LHCEIRDQETLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALASAARDYGYSRPRYSPQ : : . . : .. . . : .: : ::. .: ...::..:.. : :: . . CCDS34 LDCSAEWLDFLEKFSEHYHSLCKA-----VHHLAT-VDCIFSLAKVAKQGDYCRPTVQEE 810 820 830 840 850 560 570 580 590 600 pF1KB5 VLGVRIQNGRHPLMELC---ARTFVPNSTECGGDKGRVKVITGPNSSGKSIYLKQVGLIT . :.:::::.... .:::.:. . :. :: .::::: .::: :.:::.::: CCDS34 R-KIVIKNGRHPVIDVLLGEQDQYVPNNTDLSEDSERVMIITGPNMGGKSSYIKQVALIT 860 870 880 890 900 910 610 620 630 640 650 660 pF1KB5 FMALVGSFVPAEEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQVAKAVNNATAQSLVL .:: .::.:::::: :: ::.::::. . ..: : :::: .:...:. . .::.::::. CCDS34 IMAQIGSYVPAEEATIGIVDGIFTRMGAADNIYKGQSTFMEELTDTAEIIRKATSQSLVI 920 930 940 950 960 970 670 680 690 700 710 720 pF1KB5 IDEFGKGTNTVDGLALLAAVLRHWLARGPTCPHIFVATNFLSLVQLQL--------LPQG .::.:.::.: ::.:. :.:.... : .:: :.. . .:. .: CCDS34 LDELGRGTSTHDGIAIAYATLEYFI-RDVKSLTLFV-THYPPVCELEKNYSHQVGNYHMG 980 990 1000 1010 1020 1030 730 740 750 760 770 pF1KB5 PLVQY----LTMETCEDGNDLV-FFYQVCEGVAKASHASHTAAQAGLPDKLVARG----K ::. : . :. :.: :.::. .:.: :.. ..: : .: ... .. : CCDS34 FLVSEDESKLDPGAAEQVPDFVTFLYQITRGIAARSYGLNVAKLADVPGEILKKAAHKSK 1040 1050 1060 1070 1080 1090 780 790 800 810 820 830 pF1KB5 EVSDLIRSGKPIKPVKDLLKKNQMENCQTLVDKFMKLDLEDPNLDLNVFMSQEVLPAATS :. :: . . : .: . : :.: : : ....:. . .: CCDS34 ELEGLINTKR--KRLKYFAKLWTMHNAQDLQKWTEEFNMEETQTSLLH 1100 1110 1120 1130 pF1KB5 IL >>CCDS58709.1 MSH2 gene_id:4436|Hs108|chr2 (868 aa) initn: 392 init1: 345 opt: 554 Z-score: 565.1 bits: 115.6 E(32554): 3.7e-25 Smith-Waterman score: 581; 23.4% identity (57.8% similar) in 734 aa overlap (61-773:95-780) 40 50 60 70 80 90 pF1KB5 PGPREAEEEEVEEEEELAEIHLCVLWNSGYLGIAYYDTSDSTIHFMPDAPDHESLKLLQR .:..: :. . . . . ::..... :. CCDS58 FEDILFGNNDMSASIGVVGVKMSAVDGQRQVGVGYVDSIQRKLGLC-EFPDNDQFSNLEA 70 80 90 100 110 120 100 110 120 130 140 pF1KB5 VLDEINPQSVVTSAKQDENMTRFLGKLASQEHREPKRPEIIFLPSVDFGLEISKQ---RL .: .:.:. : . . . .::: . .: : ..::. . : :: CCDS58 LLIQIGPKECVLPGGETAGD---MGKLRQIIQRGGI--LITERKKADFSTKDIYQDLNRL 130 140 150 160 170 150 160 170 180 190 200 pF1KB5 LSGNYSFIPDAMTATEKILFLSSIIP-FDCLLTVRALGGLLKFLGRRRIGVELEDYNVSV :.:. . . :. :...: .. ..: .:....::: :: . . . CCDS58 LKGKKG---EQMN--------SAVLPEMENQVAVSSLSAVIKFL-------ELLSDDSNF 180 190 200 210 220 210 220 230 240 250 260 pF1KB5 PILGFKKFMLTHLVNIDQDTYSVLQIFKSESHPSVYKVASGLKEGLSLFGILNRCHCKWG . . : ... ...: . .:..:.. . . .: . :: ..::.:. : CCDS58 GQFELTTFDFSQYMKLDIAAVRALNLFQGSVEDT-----TGSQ---SLAALLNKCKTPQG 230 240 250 260 270 270 280 290 300 310 320 pF1KB5 EKLLRLWFTRPTHDLGELSSRLDVIQFFLLPQNLDMAQMLHR-LLGHIKNVPLILKRMKL ..:. :. .: : ... ::.... :. .. .. : :.. :: .. .. . :... CCDS58 QRLVNQWIKQPLMDKNRIEERLNLVEAFV--EDAELRQTLQEDLLRRFPDLNRLAKKFQR 280 290 300 310 320 330 330 340 350 360 370 pF1KB5 SHTKVSDWQVLYK------TVYSALGLRDACRSLPQSIQLFRDIAQEFSDDLHHIASLIG . ....: ::. .: .:: ... . . .: .. .:. .. .: CCDS58 QAANLQDCYRLYQGINQLPNVIQALEKHEG-KHQKLLLAVFVTPLTDLRSDFSKFQEMIE 340 350 360 370 380 380 390 400 410 420 430 pF1KB5 KVVDFEGSLAENRFTVLPNIDPEIDEKKRRLMG-----LPSFLTEVARKELENLDSRIPS ..:.. .. ...: : :..::...: :..:. . : : .:: . ..: CCDS58 TTLDMD-QVENHEFLVKPSFDPNLSEL-REIMNDLEKKMQSTLISAARDLGLDPGKQIKL 390 400 410 420 430 440 440 450 460 470 480 490 pF1KB5 CSVIYIPLIGFLLSIPRLPSMVEASDFEINGLDFMFLSEEKLHYRSARTKELDALLGDLH : . :. . . : .. ... .: .... ... ... :. . CCDS58 DSSAQF---GYYFRVTCKEEKVLRNNKNFSTVD---IQKNGVKFTNSKLTSLNEEYTKNK 450 460 470 480 490 500 500 510 520 530 540 550 pF1KB5 CEIRDQETLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALA--SAARDYGYSRPRYSPQ : .. . .. .. . . . . :. ..::.....: : . : :: . CCDS58 TEYEEAQDAIVKEIVNISSGYVEPMQTLNDVLAQLDAVVSFAHVSNGAPVPYVRPAILEK 510 520 530 540 550 560 560 570 580 590 600 610 pF1KB5 VLG-VRIQNGRHPLMELCAR-TFVPNSTECGGDKGRVKVITGPNSSGKSIYLKQVGLITF : . .. .:: .:. . .:.::.. :: ..::::: .::: :..:.:.:.. CCDS58 GQGRIILKASRHACVEVQDEIAFIPNDVYFEKDKQMFHIITGPNMGGKSTYIRQTGVIVL 570 580 590 600 610 620 620 630 640 650 660 670 pF1KB5 MALVGSFVPAEEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQVAKAVNNATAQSLVLI :: .: ::: : ::.. :: :..:. . .: :.:::: .. ..:. . .:: .::..: CCDS58 MAQIGCFVPCESAEVSIVDCILARVGAGDSQLKGVSTFMAEMLETASILRSATKDSLIII 630 640 650 660 670 680 680 690 700 710 720 pF1KB5 DEFGKGTNTVDGLALLAAVLRHWLAR-GPTCPHIFVATNFLSLVQLQLLPQGPLVQYLTM ::.:.::.: ::..: :. .. .. : : .: ::.: :. : : : :. : . CCDS58 DELGRGTSTYDGFGLAWAISEYIATKIGAFC--MF-ATHFHELTALA--NQIPTVNNLHV 690 700 710 720 730 730 740 750 760 770 780 pF1KB5 ETCEDGNDLVFFYQVCEGVAKASHASHTAAQAGLPDKLVARGKEVSDLIRSGKPIKPVKD . . :...::: .:: : . :.: :..: ... .:. CCDS58 TALTTEETLTMLYQVKKGVCDQSFGIHVAELANFPKHVIECAKQKALELEEFQYIGESQG 740 750 760 770 780 790 790 800 810 820 830 pF1KB5 LLKKNQMENCQTLVDKFMKLDLEDPNLDLNVFMSQEVLPAATSIL CCDS58 YDIMEPAAKKCYLEREQGEKIIQEFLSKVKQMPFTEMSEENITIKLKQLKAEVIAKNNSF 800 810 820 830 840 850 >>CCDS1834.1 MSH2 gene_id:4436|Hs108|chr2 (934 aa) initn: 392 init1: 345 opt: 554 Z-score: 564.7 bits: 115.6 E(32554): 3.9e-25 Smith-Waterman score: 581; 23.4% identity (57.8% similar) in 734 aa overlap (61-773:161-846) 40 50 60 70 80 90 pF1KB5 PGPREAEEEEVEEEEELAEIHLCVLWNSGYLGIAYYDTSDSTIHFMPDAPDHESLKLLQR .:..: :. . . . . ::..... :. CCDS18 FEDILFGNNDMSASIGVVGVKMSAVDGQRQVGVGYVDSIQRKLGLC-EFPDNDQFSNLEA 140 150 160 170 180 100 110 120 130 140 pF1KB5 VLDEINPQSVVTSAKQDENMTRFLGKLASQEHREPKRPEIIFLPSVDFGLEISKQ---RL .: .:.:. : . . . .::: . .: : ..::. . : :: CCDS18 LLIQIGPKECVLPGGETAGD---MGKLRQIIQRGGI--LITERKKADFSTKDIYQDLNRL 190 200 210 220 230 240 150 160 170 180 190 200 pF1KB5 LSGNYSFIPDAMTATEKILFLSSIIP-FDCLLTVRALGGLLKFLGRRRIGVELEDYNVSV :.:. . . :. :...: .. ..: .:....::: :: . . . CCDS18 LKGKKG---EQMN--------SAVLPEMENQVAVSSLSAVIKFL-------ELLSDDSNF 250 260 270 280 210 220 230 240 250 260 pF1KB5 PILGFKKFMLTHLVNIDQDTYSVLQIFKSESHPSVYKVASGLKEGLSLFGILNRCHCKWG . . : ... ...: . .:..:.. . . .: . :: ..::.:. : CCDS18 GQFELTTFDFSQYMKLDIAAVRALNLFQGSVEDT-----TGSQ---SLAALLNKCKTPQG 290 300 310 320 330 270 280 290 300 310 320 pF1KB5 EKLLRLWFTRPTHDLGELSSRLDVIQFFLLPQNLDMAQMLHR-LLGHIKNVPLILKRMKL ..:. :. .: : ... ::.... :. .. .. : :.. :: .. .. . :... CCDS18 QRLVNQWIKQPLMDKNRIEERLNLVEAFV--EDAELRQTLQEDLLRRFPDLNRLAKKFQR 340 350 360 370 380 390 330 340 350 360 370 pF1KB5 SHTKVSDWQVLYK------TVYSALGLRDACRSLPQSIQLFRDIAQEFSDDLHHIASLIG . ....: ::. .: .:: ... . . .: .. .:. .. .: CCDS18 QAANLQDCYRLYQGINQLPNVIQALEKHEG-KHQKLLLAVFVTPLTDLRSDFSKFQEMIE 400 410 420 430 440 450 380 390 400 410 420 430 pF1KB5 KVVDFEGSLAENRFTVLPNIDPEIDEKKRRLMG-----LPSFLTEVARKELENLDSRIPS ..:.. .. ...: : :..::...: :..:. . : : .:: . ..: CCDS18 TTLDMD-QVENHEFLVKPSFDPNLSEL-REIMNDLEKKMQSTLISAARDLGLDPGKQIKL 460 470 480 490 500 510 440 450 460 470 480 490 pF1KB5 CSVIYIPLIGFLLSIPRLPSMVEASDFEINGLDFMFLSEEKLHYRSARTKELDALLGDLH : . :. . . : .. ... .: .... ... ... :. . CCDS18 DSSAQF---GYYFRVTCKEEKVLRNNKNFSTVD---IQKNGVKFTNSKLTSLNEEYTKNK 520 530 540 550 560 500 510 520 530 540 550 pF1KB5 CEIRDQETLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALA--SAARDYGYSRPRYSPQ : .. . .. .. . . . . :. ..::.....: : . : :: . CCDS18 TEYEEAQDAIVKEIVNISSGYVEPMQTLNDVLAQLDAVVSFAHVSNGAPVPYVRPAILEK 570 580 590 600 610 620 560 570 580 590 600 610 pF1KB5 VLG-VRIQNGRHPLMELCAR-TFVPNSTECGGDKGRVKVITGPNSSGKSIYLKQVGLITF : . .. .:: .:. . .:.::.. :: ..::::: .::: :..:.:.:.. CCDS18 GQGRIILKASRHACVEVQDEIAFIPNDVYFEKDKQMFHIITGPNMGGKSTYIRQTGVIVL 630 640 650 660 670 680 620 630 640 650 660 670 pF1KB5 MALVGSFVPAEEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQVAKAVNNATAQSLVLI :: .: ::: : ::.. :: :..:. . .: :.:::: .. ..:. . .:: .::..: CCDS18 MAQIGCFVPCESAEVSIVDCILARVGAGDSQLKGVSTFMAEMLETASILRSATKDSLIII 690 700 710 720 730 740 680 690 700 710 720 pF1KB5 DEFGKGTNTVDGLALLAAVLRHWLAR-GPTCPHIFVATNFLSLVQLQLLPQGPLVQYLTM ::.:.::.: ::..: :. .. .. : : .: ::.: :. : : : :. : . CCDS18 DELGRGTSTYDGFGLAWAISEYIATKIGAFC--MF-ATHFHELTALA--NQIPTVNNLHV 750 760 770 780 790 800 730 740 750 760 770 780 pF1KB5 ETCEDGNDLVFFYQVCEGVAKASHASHTAAQAGLPDKLVARGKEVSDLIRSGKPIKPVKD . . :...::: .:: : . :.: :..: ... .:. CCDS18 TALTTEETLTMLYQVKKGVCDQSFGIHVAELANFPKHVIECAKQKALELEEFQYIGESQG 810 820 830 840 850 860 790 800 810 820 830 pF1KB5 LLKKNQMENCQTLVDKFMKLDLEDPNLDLNVFMSQEVLPAATSIL CCDS18 YDIMEPAAKKCYLEREQGEKIIQEFLSKVKQMPFTEMSEENITIKLKQLKAEVIAKNNSF 870 880 890 900 910 920 >>CCDS670.1 MSH4 gene_id:4438|Hs108|chr1 (936 aa) initn: 529 init1: 315 opt: 502 Z-score: 511.5 bits: 105.8 E(32554): 3.6e-22 Smith-Waterman score: 521; 24.3% identity (57.3% similar) in 602 aa overlap (253-823:334-914) 230 240 250 260 270 280 pF1KB5 DQDTYSVLQIFKSESHPSVYKVASGLKEGLSLFGILNRCHCKWGEKLLRLWFTRPTHDLG .:::.:: . : . :: . .: :. CCDS67 QGSEQTAMIDSSSAQNLELLINNQDYRNNHTLFGVLNYTKTPGGSRRLRSNILEPLVDIE 310 320 330 340 350 360 290 300 310 320 330 pF1KB5 ELSSRLDVIQFFLLPQNL--DMAQMLHRLLGHIKNVPLILK-----RMKLSHTKVSDWQV .. ::: .: .: ..: . ... :.: . . .... .. ...:... CCDS67 TINMRLDCVQELLQDEELFFGLQSVISRFLDTEQLLSVLVQIPKQDTVNAAESKITNLIY 370 380 390 400 410 420 340 350 360 370 380 pF1KB5 LYKTVYSALGLRDACRS--LPQSIQLFRDIA-QEFSDDLHHIASLIGKVVDF-EGSL--- : .:. . :. : .. : . .. ..:. :..: ..:. . . .: : CCDS67 LKHTLELVDPLKIAMKNCNTPLLRAYYGSLEDKRFGIILEKIKTVINDDARYMKGCLNMR 430 440 450 460 470 480 390 400 410 420 430 440 pF1KB5 AENRFTVLPNIDPEIDEKKRRLM----GLPSFLTEVARKELENLDSRIPSCSVIYIPLIG ... ..: ::. .: .: . ........: : . . : ..: . CCDS67 TQKCYAVRSNINEFLDIARRTYTEIVDDIAGMISQLGEKYSLPLRTSFSSARGFFIQMTT 490 500 510 520 530 540 450 460 470 480 490 500 pF1KB5 FLLSIP--RLPS-MVEASDFEINGLDFMFLSEEKLHYRSARTKELDALLGDLHCEIRDQE ...: .::: ... : . :. .: . :.. : .. . :: . CCDS67 DCIALPSDQLPSEFIKISKVK-NSYSFTSADLIKMNERCQESLR----------EIYHMT 550 560 570 580 590 510 520 530 540 550 560 pF1KB5 TLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALASAARDYGYSRPRYSPQVLGVRIQNG ... .: .. . : .. : .: ::.::..: : : ::... . :..: CCDS67 YMIVCKLLSEIYEHIHCLYKLSDTVSMLDMLLSFAHACTLSDYVRPEFTDTLA---IKQG 600 610 620 630 640 570 580 590 600 610 620 pF1KB5 RHPLME-LCARTFVPNSTECGGDKGRVKVITGPNSSGKSIYLKQVGLITFMALVGSFVPA ::..: . :. . :.: . . .::::: :::: ::::..: .:: .::.::: CCDS67 WHPILEKISAEKPIANNTYVT-EGSNFLIITGPNMSGKSTYLKQIALCQIMAQIGSYVPA 650 660 670 680 690 700 630 640 650 660 670 680 pF1KB5 EEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQVAKAVNNATAQSLVLIDEFGKGTNTV : . . . ::::: . ..: . :::: .....: ..::. .::.::::.:.:::: CCDS67 EYSSFRIAKQIFTRISTDDDIETNSSTFMKEMKEIAYILHNANDKSLILIDELGRGTNTE 710 720 730 740 750 760 690 700 710 720 730 pF1KB5 DGLALLAAVLRHWLARGPTCPHIFVATNFLSLVQLQLLPQGPLVQYLTME------TCED .:... :: .. :. . ::.:: : ... : : :. . .: : .. CCDS67 EGIGICYAVCEYLLS---LKAFTLFATHFLELCHIDALY--PNVENMHFEVQHVKNTSRN 770 780 790 800 810 820 740 750 760 770 780 790 pF1KB5 GNDLVFFYQVCEGVAKASHASHTAAQ-AGLPDKLVARGKEVSDLIRSG--KPIKPVKDLL . ... :.. .:... .. . ::. ..:: ..: .::.. : . . . .. CCDS67 KEAILYTYKLSKGLTEEKNYGLKAAEVSSLPPSIVLDAKEITTQITRQILQNQRSTPEME 830 840 850 860 870 880 800 810 820 830 pF1KB5 KKNQMENCQTLVDKFMKLDLEDPNLDLNVFMSQEVLPAATSIL .. . . : . . . . ::. .: ...: CCDS67 RQRAVYHLATRLVQTARNSQLDPD-SLRIYLSNLKKKYKEDFPRTEQVPEKTEE 890 900 910 920 930 >>CCDS62907.1 MSH6 gene_id:2956|Hs108|chr2 (1058 aa) initn: 416 init1: 311 opt: 393 Z-score: 399.2 bits: 85.2 E(32554): 6.5e-16 Smith-Waterman score: 538; 27.6% identity (56.2% similar) in 660 aa overlap (178-771:377-1014) 150 160 170 180 190 200 pF1KB5 LSGNYSFIPDAMTATEKILFLSSIIPFDCLLTVRALGGLLKFLGRRRIGVEL---EDYNV :.. :::: . .: . : :: ... CCDS62 DGIGVMLPQVLKGMTSESDSIGLTPGEKSELALSALGGCVFYLKKCLIDQELLSMANFEE 350 360 370 380 390 400 210 220 230 240 250 260 pF1KB5 SVPILGFKKFMLTHLVNIDQDTYS--VLQIFKSESHPSVYKVASGLKEGLSLFGILNRCH .: : :. : .:. ::. .. . ..: :: .:. .. :: CCDS62 YIP-LDSDTVSTTRSGAIFTKAYQRMVLDAVTLNNLEIFLNGTNGSTEG-TLLERVDTCH 410 420 430 440 450 460 270 280 290 300 310 pF1KB5 CKWGEKLLRLWFTRPTHDLGELSSRLDVIQ-FFLLPQNL-DMAQMLH------RLLGHIK .:..::. :. : . ...:::.:. ....:... .....:. :::..:. CCDS62 TPFGKRLLKQWLCAPLCNHYAINDRLDAIEDLMVVPDKISEVVELLKKLPDLERLLSKIH 470 480 490 500 510 520 320 330 340 350 360 370 pF1KB5 NVPLILKRMKLSHTKVSDWQVLYK-TVYSALGLRDACRSLPQSIQLFR--DIAQEFSDDL :: :: :... .. ..:. :.:: . : .: . . : .: .: . CCDS62 NVGSPLK----SQNHPDSRAIMYEETTYSKKKIIDFLSALEGFKVMCKIIGIMEEVADGF 530 540 550 560 570 580 380 390 400 410 pF1KB5 HHIASLIGKVVDFEGSLAENRF---TV-LPNIDPEIDEKKRRLMGL--PS--F------- . .... .:.... . :.:: :: : : .:..: : :: :. : CCDS62 K--SKILKQVISLQTKNPEGRFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQA 590 600 610 620 630 420 430 440 450 460 pF1KB5 LTEVARKE------LENLDSRIPSCSVIYIPLIG---FLLSIPRLPSMVEASDFEINGLD :... ..: ::. .:: .: .: :: . : ::. .: .: CCDS62 LADIRENEQSLLEYLEKQRNRI-GCRTIVYWGIGRNRYQLEIPE--------NFTTRNLP 640 650 660 670 680 470 480 490 500 510 520 pF1KB5 FMF-LSEEKLHYRSARTKELDALLGDL-HCEIRDQETL--LMYQLQCQVLARAAVLTRVL . :. : . :: .. :..: . : : . .: : .: . .. CCDS62 EEYELKSTKKGCKRYWTKTIEKKLANLINAEERRDVSLKDCMRRLFYNFDKNYKDWQSAV 690 700 710 720 730 740 530 540 550 560 570 pF1KB5 DLASRLDVLLALASAAR--DYGYSRP-----RYSPQVLGVRIQNGRHPLME--LCARTFV . . ::::: ::. .: : . :: . .: : .....::: . . . :. CCDS62 ECIAVLDVLLCLANYSRGGDGPMCRPVILLPEDTPPFL--ELKGSRHPCITKTFFGDDFI 750 760 770 780 790 800 580 590 600 610 620 pF1KB5 PNSTECGGD-------KGRVKVITGPNSSGKSIYLKQVGLITFMALVGSFVPAEEAEIGA ::. : . :. ..:::: .::: ..:.::.. :: .: .:::: .. CCDS62 PNDILIGCEEEEQENGKAYCVLVTGPNMGGKSTLMRQAGLLAVMAQMGCYVPAEVCRLTP 810 820 830 840 850 860 630 640 650 660 670 680 pF1KB5 VDAIFTRIHSCESISLGLSTFMIDLNQVAKAVNNATAQSLVLIDEFGKGTNTVDGLALLA .: .:::. . . : : :::...:...:. . .:::.::::.::.:.:: : :: :. CCDS62 IDRVFTRLGASDRIMSGESTFFVELSETASILMHATAHSLVLVDELGRGTATFDGTAIAN 870 880 890 900 910 920 690 700 710 720 730 740 pF1KB5 AVLRHWLARGPTCPHIFVATNFLSLV----QLQLLPQGPLVQYLTMETCEDGND--LVFF ::... ::. : .: .:.. ::: : . : .. .. : ::: .. ..:. CCDS62 AVVKE-LAETIKCRTLF-STHYHSLVEDYSQNVAVRLGHMACMVENE-CEDPSQETITFL 930 940 950 960 970 980 750 760 770 780 790 800 pF1KB5 YQVCEGVAKASHASHTAAQAGLPDKLVARGKEVSDLIRSGKPIKPVKDLLKKNQMENCQT :. .:. :.. ..: :.::.... .: CCDS62 YKFIKGACPKSYGFNAARLANLPEEVIQKGHRKAREFEKMNQSLRLFREVCLASERSTVD 990 1000 1010 1020 1030 1040 >>CCDS62906.1 MSH6 gene_id:2956|Hs108|chr2 (1230 aa) initn: 456 init1: 311 opt: 393 Z-score: 398.3 bits: 85.2 E(32554): 7.3e-16 Smith-Waterman score: 538; 27.6% identity (56.2% similar) in 660 aa overlap (178-771:549-1186) 150 160 170 180 190 200 pF1KB5 LSGNYSFIPDAMTATEKILFLSSIIPFDCLLTVRALGGLLKFLGRRRIGVEL---EDYNV :.. :::: . .: . : :: ... CCDS62 DGIGVMLPQVLKGMTSESDSIGLTPGEKSELALSALGGCVFYLKKCLIDQELLSMANFEE 520 530 540 550 560 570 210 220 230 240 250 260 pF1KB5 SVPILGFKKFMLTHLVNIDQDTYS--VLQIFKSESHPSVYKVASGLKEGLSLFGILNRCH .: : :. : .:. ::. .. . ..: :: .:. .. :: CCDS62 YIP-LDSDTVSTTRSGAIFTKAYQRMVLDAVTLNNLEIFLNGTNGSTEG-TLLERVDTCH 580 590 600 610 620 630 270 280 290 300 310 pF1KB5 CKWGEKLLRLWFTRPTHDLGELSSRLDVIQ-FFLLPQNL-DMAQMLH------RLLGHIK .:..::. :. : . ...:::.:. ....:... .....:. :::..:. CCDS62 TPFGKRLLKQWLCAPLCNHYAINDRLDAIEDLMVVPDKISEVVELLKKLPDLERLLSKIH 640 650 660 670 680 690 320 330 340 350 360 370 pF1KB5 NVPLILKRMKLSHTKVSDWQVLYK-TVYSALGLRDACRSLPQSIQLFR--DIAQEFSDDL :: :: :... .. ..:. :.:: . : .: . . : .: .: . CCDS62 NVGSPLK----SQNHPDSRAIMYEETTYSKKKIIDFLSALEGFKVMCKIIGIMEEVADGF 700 710 720 730 740 750 380 390 400 410 pF1KB5 HHIASLIGKVVDFEGSLAENRF---TV-LPNIDPEIDEKKRRLMGL--PS--F------- . .... .:.... . :.:: :: : : .:..: : :: :. : CCDS62 K--SKILKQVISLQTKNPEGRFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQA 760 770 780 790 800 810 420 430 440 450 460 pF1KB5 LTEVARKE------LENLDSRIPSCSVIYIPLIG---FLLSIPRLPSMVEASDFEINGLD :... ..: ::. .:: .: .: :: . : ::. .: .: CCDS62 LADIRENEQSLLEYLEKQRNRI-GCRTIVYWGIGRNRYQLEIPE--------NFTTRNLP 820 830 840 850 860 470 480 490 500 510 520 pF1KB5 FMF-LSEEKLHYRSARTKELDALLGDL-HCEIRDQETL--LMYQLQCQVLARAAVLTRVL . :. : . :: .. :..: . : : . .: : .: . .. CCDS62 EEYELKSTKKGCKRYWTKTIEKKLANLINAEERRDVSLKDCMRRLFYNFDKNYKDWQSAV 870 880 890 900 910 920 530 540 550 560 570 pF1KB5 DLASRLDVLLALASAAR--DYGYSRP-----RYSPQVLGVRIQNGRHPLME--LCARTFV . . ::::: ::. .: : . :: . .: : .....::: . . . :. CCDS62 ECIAVLDVLLCLANYSRGGDGPMCRPVILLPEDTPPFL--ELKGSRHPCITKTFFGDDFI 930 940 950 960 970 580 590 600 610 620 pF1KB5 PNSTECGGD-------KGRVKVITGPNSSGKSIYLKQVGLITFMALVGSFVPAEEAEIGA ::. : . :. ..:::: .::: ..:.::.. :: .: .:::: .. CCDS62 PNDILIGCEEEEQENGKAYCVLVTGPNMGGKSTLMRQAGLLAVMAQMGCYVPAEVCRLTP 980 990 1000 1010 1020 1030 630 640 650 660 670 680 pF1KB5 VDAIFTRIHSCESISLGLSTFMIDLNQVAKAVNNATAQSLVLIDEFGKGTNTVDGLALLA .: .:::. . . : : :::...:...:. . .:::.::::.::.:.:: : :: :. CCDS62 IDRVFTRLGASDRIMSGESTFFVELSETASILMHATAHSLVLVDELGRGTATFDGTAIAN 1040 1050 1060 1070 1080 1090 690 700 710 720 730 740 pF1KB5 AVLRHWLARGPTCPHIFVATNFLSLV----QLQLLPQGPLVQYLTMETCEDGND--LVFF ::... ::. : .: .:.. ::: : . : .. .. : ::: .. ..:. CCDS62 AVVKE-LAETIKCRTLF-STHYHSLVEDYSQNVAVRLGHMACMVENE-CEDPSQETITFL 1100 1110 1120 1130 1140 1150 750 760 770 780 790 800 pF1KB5 YQVCEGVAKASHASHTAAQAGLPDKLVARGKEVSDLIRSGKPIKPVKDLLKKNQMENCQT :. .:. :.. ..: :.::.... .: CCDS62 YKFIKGACPKSYGFNAARLANLPEEVIQKGHRKAREFEKMNQSLRLFREVCLASERSTVD 1160 1170 1180 1190 1200 1210 >>CCDS1836.1 MSH6 gene_id:2956|Hs108|chr2 (1360 aa) initn: 456 init1: 311 opt: 393 Z-score: 397.7 bits: 85.3 E(32554): 7.9e-16 Smith-Waterman score: 538; 27.6% identity (56.2% similar) in 660 aa overlap (178-771:679-1316) 150 160 170 180 190 200 pF1KB5 LSGNYSFIPDAMTATEKILFLSSIIPFDCLLTVRALGGLLKFLGRRRIGVEL---EDYNV :.. :::: . .: . : :: ... CCDS18 DGIGVMLPQVLKGMTSESDSIGLTPGEKSELALSALGGCVFYLKKCLIDQELLSMANFEE 650 660 670 680 690 700 210 220 230 240 250 260 pF1KB5 SVPILGFKKFMLTHLVNIDQDTYS--VLQIFKSESHPSVYKVASGLKEGLSLFGILNRCH .: : :. : .:. ::. .. . ..: :: .:. .. :: CCDS18 YIP-LDSDTVSTTRSGAIFTKAYQRMVLDAVTLNNLEIFLNGTNGSTEG-TLLERVDTCH 710 720 730 740 750 760 270 280 290 300 310 pF1KB5 CKWGEKLLRLWFTRPTHDLGELSSRLDVIQ-FFLLPQNL-DMAQMLH------RLLGHIK .:..::. :. : . ...:::.:. ....:... .....:. :::..:. CCDS18 TPFGKRLLKQWLCAPLCNHYAINDRLDAIEDLMVVPDKISEVVELLKKLPDLERLLSKIH 770 780 790 800 810 820 320 330 340 350 360 370 pF1KB5 NVPLILKRMKLSHTKVSDWQVLYK-TVYSALGLRDACRSLPQSIQLFR--DIAQEFSDDL :: :: :... .. ..:. :.:: . : .: . . : .: .: . CCDS18 NVGSPLK----SQNHPDSRAIMYEETTYSKKKIIDFLSALEGFKVMCKIIGIMEEVADGF 830 840 850 860 870 880 380 390 400 410 pF1KB5 HHIASLIGKVVDFEGSLAENRF---TV-LPNIDPEIDEKKRRLMGL--PS--F------- . .... .:.... . :.:: :: : : .:..: : :: :. : CCDS18 K--SKILKQVISLQTKNPEGRFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQA 890 900 910 920 930 940 420 430 440 450 460 pF1KB5 LTEVARKE------LENLDSRIPSCSVIYIPLIG---FLLSIPRLPSMVEASDFEINGLD :... ..: ::. .:: .: .: :: . : ::. .: .: CCDS18 LADIRENEQSLLEYLEKQRNRI-GCRTIVYWGIGRNRYQLEIPE--------NFTTRNLP 950 960 970 980 990 470 480 490 500 510 520 pF1KB5 FMF-LSEEKLHYRSARTKELDALLGDL-HCEIRDQETL--LMYQLQCQVLARAAVLTRVL . :. : . :: .. :..: . : : . .: : .: . .. CCDS18 EEYELKSTKKGCKRYWTKTIEKKLANLINAEERRDVSLKDCMRRLFYNFDKNYKDWQSAV 1000 1010 1020 1030 1040 1050 530 540 550 560 570 pF1KB5 DLASRLDVLLALASAAR--DYGYSRP-----RYSPQVLGVRIQNGRHPLME--LCARTFV . . ::::: ::. .: : . :: . .: : .....::: . . . :. CCDS18 ECIAVLDVLLCLANYSRGGDGPMCRPVILLPEDTPPFL--ELKGSRHPCITKTFFGDDFI 1060 1070 1080 1090 1100 580 590 600 610 620 pF1KB5 PNSTECGGD-------KGRVKVITGPNSSGKSIYLKQVGLITFMALVGSFVPAEEAEIGA ::. : . :. ..:::: .::: ..:.::.. :: .: .:::: .. CCDS18 PNDILIGCEEEEQENGKAYCVLVTGPNMGGKSTLMRQAGLLAVMAQMGCYVPAEVCRLTP 1110 1120 1130 1140 1150 1160 630 640 650 660 670 680 pF1KB5 VDAIFTRIHSCESISLGLSTFMIDLNQVAKAVNNATAQSLVLIDEFGKGTNTVDGLALLA .: .:::. . . : : :::...:...:. . .:::.::::.::.:.:: : :: :. CCDS18 IDRVFTRLGASDRIMSGESTFFVELSETASILMHATAHSLVLVDELGRGTATFDGTAIAN 1170 1180 1190 1200 1210 1220 690 700 710 720 730 740 pF1KB5 AVLRHWLARGPTCPHIFVATNFLSLV----QLQLLPQGPLVQYLTMETCEDGND--LVFF ::... ::. : .: .:.. ::: : . : .. .. : ::: .. ..:. CCDS18 AVVKE-LAETIKCRTLF-STHYHSLVEDYSQNVAVRLGHMACMVENE-CEDPSQETITFL 1230 1240 1250 1260 1270 1280 750 760 770 780 790 800 pF1KB5 YQVCEGVAKASHASHTAAQAGLPDKLVARGKEVSDLIRSGKPIKPVKDLLKKNQMENCQT :. .:. :.. ..: :.::.... .: CCDS18 YKFIKGACPKSYGFNAARLANLPEEVIQKGHRKAREFEKMNQSLRLFREVCLASERSTVD 1290 1300 1310 1320 1330 1340 834 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 15:36:04 2016 done: Sat Nov 5 15:36:05 2016 Total Scan time: 4.170 Total Display time: 0.250 Function used was FASTA [36.3.4 Apr, 2011]