FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE1305, 1360 aa 1>>>pF1KE1305 1360 - 1360 aa - 1360 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.0855+/-0.00112; mu= 11.2483+/- 0.067 mean_var=162.9410+/-32.970, 0's: 0 Z-trim(108.9): 41 B-trim: 19 in 1/51 Lambda= 0.100475 statistics sampled from 10489 (10521) to 10489 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.661), E-opt: 0.2 (0.323), width: 16 Scan time: 5.180 The best scores are: opt bits E(32554) CCDS1836.1 MSH6 gene_id:2956|Hs108|chr2 (1360) 9062 1326.8 0 CCDS62906.1 MSH6 gene_id:2956|Hs108|chr2 (1230) 7615 1117.0 0 CCDS62907.1 MSH6 gene_id:2956|Hs108|chr2 (1058) 7032 1032.5 0 CCDS34195.1 MSH3 gene_id:4437|Hs108|chr5 (1137) 601 100.3 3.3e-20 CCDS58709.1 MSH2 gene_id:4436|Hs108|chr2 ( 868) 590 98.6 8e-20 CCDS1834.1 MSH2 gene_id:4436|Hs108|chr2 ( 934) 590 98.6 8.5e-20 CCDS670.1 MSH4 gene_id:4438|Hs108|chr1 ( 936) 408 72.2 7.5e-12 CCDS4720.1 MSH5 gene_id:4439|Hs108|chr6 ( 834) 393 70.0 3.1e-11 >>CCDS1836.1 MSH6 gene_id:2956|Hs108|chr2 (1360 aa) initn: 9062 init1: 9062 opt: 9062 Z-score: 7103.5 bits: 1326.8 E(32554): 0 Smith-Waterman score: 9062; 100.0% identity (100.0% similar) in 1360 aa overlap (1-1360:1-1360) 10 20 30 40 50 60 pF1KE1 MSRQSTLYSFFPKSPALSDANKASARASREGGRAAAAPGASPSPGGDAAWSEAGPGPRPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 MSRQSTLYSFFPKSPALSDANKASARASREGGRAAAAPGASPSPGGDAAWSEAGPGPRPL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 ARSASPPKAKNLNGGLRRSVAPAAPTSCDFSPGDLVWAKMEGYPWWPCLVYNHPFDGTFI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 ARSASPPKAKNLNGGLRRSVAPAAPTSCDFSPGDLVWAKMEGYPWWPCLVYNHPFDGTFI 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 REKGKSVRVHVQFFDDSPTRGWVSKRLLKPYTGSKSKEAQKGGHFYSAKPEILRAMQRAD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 REKGKSVRVHVQFFDDSPTRGWVSKRLLKPYTGSKSKEAQKGGHFYSAKPEILRAMQRAD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 EALNKDKIKRLELAVCDEPSEPEEEEEMEVGTTYVTDKSEEDNEIESEEEVQPKTQGSRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 EALNKDKIKRLELAVCDEPSEPEEEEEMEVGTTYVTDKSEEDNEIESEEEVQPKTQGSRR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 SSRQIKKRRVISDSESDIGGSDVEFKPDTKEEGSSDEISSGVGDSESEGLNSPVKVARKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 SSRQIKKRRVISDSESDIGGSDVEFKPDTKEEGSSDEISSGVGDSESEGLNSPVKVARKR 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE1 KRMVTGNGSLKRKSSRKETPSATKQATSISSETKNTLRAFSAPQNSESQAHVSGGGDDSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 KRMVTGNGSLKRKSSRKETPSATKQATSISSETKNTLRAFSAPQNSESQAHVSGGGDDSS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE1 RPTVWYHETLEWLKEEKRRDEHRRRPDHPDFDASTLYVPEDFLNSCTPGMRKWWQIKSQN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 RPTVWYHETLEWLKEEKRRDEHRRRPDHPDFDASTLYVPEDFLNSCTPGMRKWWQIKSQN 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE1 FDLVICYKVGKFYELYHMDALIGVSELGLVFMKGNWAHSGFPEIAFGRYSDSLVQKGYKV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 FDLVICYKVGKFYELYHMDALIGVSELGLVFMKGNWAHSGFPEIAFGRYSDSLVQKGYKV 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE1 ARVEQTETPEMMEARCRKMAHISKYDRVVRREICRIITKGTQTYSVLEGDPSENYSKYLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 ARVEQTETPEMMEARCRKMAHISKYDRVVRREICRIITKGTQTYSVLEGDPSENYSKYLL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE1 SLKEKEEDSSGHTRAYGVCFVDTSLGKFFIGQFSDDRHCSRFRTLVAHYPPVQVLFEKGN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 SLKEKEEDSSGHTRAYGVCFVDTSLGKFFIGQFSDDRHCSRFRTLVAHYPPVQVLFEKGN 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE1 LSKETKTILKSSLSCSLQEGLIPGSQFWDASKTLRTLLEEEYFREKLSDGIGVMLPQVLK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 LSKETKTILKSSLSCSLQEGLIPGSQFWDASKTLRTLLEEEYFREKLSDGIGVMLPQVLK 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE1 GMTSESDSIGLTPGEKSELALSALGGCVFYLKKCLIDQELLSMANFEEYIPLDSDTVSTT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 GMTSESDSIGLTPGEKSELALSALGGCVFYLKKCLIDQELLSMANFEEYIPLDSDTVSTT 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE1 RSGAIFTKAYQRMVLDAVTLNNLEIFLNGTNGSTEGTLLERVDTCHTPFGKRLLKQWLCA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 RSGAIFTKAYQRMVLDAVTLNNLEIFLNGTNGSTEGTLLERVDTCHTPFGKRLLKQWLCA 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE1 PLCNHYAINDRLDAIEDLMVVPDKISEVVELLKKLPDLERLLSKIHNVGSPLKSQNHPDS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 PLCNHYAINDRLDAIEDLMVVPDKISEVVELLKKLPDLERLLSKIHNVGSPLKSQNHPDS 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE1 RAIMYEETTYSKKKIIDFLSALEGFKVMCKIIGIMEEVADGFKSKILKQVISLQTKNPEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 RAIMYEETTYSKKKIIDFLSALEGFKVMCKIIGIMEEVADGFKSKILKQVISLQTKNPEG 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE1 RFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQALADIRENEQSLLEYLEKQRN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 RFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQALADIRENEQSLLEYLEKQRN 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE1 RIGCRTIVYWGIGRNRYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKLANLIN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 RIGCRTIVYWGIGRNRYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKLANLIN 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE1 AEERRDVSLKDCMRRLFYNFDKNYKDWQSAVECIAVLDVLLCLANYSRGGDGPMCRPVIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 AEERRDVSLKDCMRRLFYNFDKNYKDWQSAVECIAVLDVLLCLANYSRGGDGPMCRPVIL 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KE1 LPEDTPPFLELKGSRHPCITKTFFGDDFIPNDILIGCEEEEQENGKAYCVLVTGPNMGGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 LPEDTPPFLELKGSRHPCITKTFFGDDFIPNDILIGCEEEEQENGKAYCVLVTGPNMGGK 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KE1 STLMRQAGLLAVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFFVELSETASI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 STLMRQAGLLAVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFFVELSETASI 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KE1 LMHATAHSLVLVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHSLVEDYSQNV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 LMHATAHSLVLVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHSLVEDYSQNV 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KE1 AVRLGHMACMVENECEDPSQETITFLYKFIKGACPKSYGFNAARLANLPEEVIQKGHRKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 AVRLGHMACMVENECEDPSQETITFLYKFIKGACPKSYGFNAARLANLPEEVIQKGHRKA 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 pF1KE1 REFEKMNQSLRLFREVCLASERSTVDAEAVHKLLTLIKEL :::::::::::::::::::::::::::::::::::::::: CCDS18 REFEKMNQSLRLFREVCLASERSTVDAEAVHKLLTLIKEL 1330 1340 1350 1360 >>CCDS62906.1 MSH6 gene_id:2956|Hs108|chr2 (1230 aa) initn: 7615 init1: 7615 opt: 7615 Z-score: 5970.5 bits: 1117.0 E(32554): 0 Smith-Waterman score: 7874; 90.4% identity (90.4% similar) in 1360 aa overlap (1-1360:1-1230) 10 20 30 40 50 60 pF1KE1 MSRQSTLYSFFPKSPALSDANKASARASREGGRAAAAPGASPSPGGDAAWSEAGPGPRPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 MSRQSTLYSFFPKSPALSDANKASARASREGGRAAAAPGASPSPGGDAAWSEAGPGPRPL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 ARSASPPKAKNLNGGLRRSVAPAAPTSCDFSPGDLVWAKMEGYPWWPCLVYNHPFDGTFI :::::::::::::::::::: CCDS62 ARSASPPKAKNLNGGLRRSV---------------------------------------- 70 80 130 140 150 160 170 180 pF1KE1 REKGKSVRVHVQFFDDSPTRGWVSKRLLKPYTGSKSKEAQKGGHFYSAKPEILRAMQRAD CCDS62 ------------------------------------------------------------ 190 200 210 220 230 240 pF1KE1 EALNKDKIKRLELAVCDEPSEPEEEEEMEVGTTYVTDKSEEDNEIESEEEVQPKTQGSRR :::::::::::::::::::::::::::::: CCDS62 ------------------------------GTTYVTDKSEEDNEIESEEEVQPKTQGSRR 90 100 110 250 260 270 280 290 300 pF1KE1 SSRQIKKRRVISDSESDIGGSDVEFKPDTKEEGSSDEISSGVGDSESEGLNSPVKVARKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 SSRQIKKRRVISDSESDIGGSDVEFKPDTKEEGSSDEISSGVGDSESEGLNSPVKVARKR 120 130 140 150 160 170 310 320 330 340 350 360 pF1KE1 KRMVTGNGSLKRKSSRKETPSATKQATSISSETKNTLRAFSAPQNSESQAHVSGGGDDSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 KRMVTGNGSLKRKSSRKETPSATKQATSISSETKNTLRAFSAPQNSESQAHVSGGGDDSS 180 190 200 210 220 230 370 380 390 400 410 420 pF1KE1 RPTVWYHETLEWLKEEKRRDEHRRRPDHPDFDASTLYVPEDFLNSCTPGMRKWWQIKSQN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 RPTVWYHETLEWLKEEKRRDEHRRRPDHPDFDASTLYVPEDFLNSCTPGMRKWWQIKSQN 240 250 260 270 280 290 430 440 450 460 470 480 pF1KE1 FDLVICYKVGKFYELYHMDALIGVSELGLVFMKGNWAHSGFPEIAFGRYSDSLVQKGYKV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 FDLVICYKVGKFYELYHMDALIGVSELGLVFMKGNWAHSGFPEIAFGRYSDSLVQKGYKV 300 310 320 330 340 350 490 500 510 520 530 540 pF1KE1 ARVEQTETPEMMEARCRKMAHISKYDRVVRREICRIITKGTQTYSVLEGDPSENYSKYLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 ARVEQTETPEMMEARCRKMAHISKYDRVVRREICRIITKGTQTYSVLEGDPSENYSKYLL 360 370 380 390 400 410 550 560 570 580 590 600 pF1KE1 SLKEKEEDSSGHTRAYGVCFVDTSLGKFFIGQFSDDRHCSRFRTLVAHYPPVQVLFEKGN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 SLKEKEEDSSGHTRAYGVCFVDTSLGKFFIGQFSDDRHCSRFRTLVAHYPPVQVLFEKGN 420 430 440 450 460 470 610 620 630 640 650 660 pF1KE1 LSKETKTILKSSLSCSLQEGLIPGSQFWDASKTLRTLLEEEYFREKLSDGIGVMLPQVLK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 LSKETKTILKSSLSCSLQEGLIPGSQFWDASKTLRTLLEEEYFREKLSDGIGVMLPQVLK 480 490 500 510 520 530 670 680 690 700 710 720 pF1KE1 GMTSESDSIGLTPGEKSELALSALGGCVFYLKKCLIDQELLSMANFEEYIPLDSDTVSTT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 GMTSESDSIGLTPGEKSELALSALGGCVFYLKKCLIDQELLSMANFEEYIPLDSDTVSTT 540 550 560 570 580 590 730 740 750 760 770 780 pF1KE1 RSGAIFTKAYQRMVLDAVTLNNLEIFLNGTNGSTEGTLLERVDTCHTPFGKRLLKQWLCA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 RSGAIFTKAYQRMVLDAVTLNNLEIFLNGTNGSTEGTLLERVDTCHTPFGKRLLKQWLCA 600 610 620 630 640 650 790 800 810 820 830 840 pF1KE1 PLCNHYAINDRLDAIEDLMVVPDKISEVVELLKKLPDLERLLSKIHNVGSPLKSQNHPDS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 PLCNHYAINDRLDAIEDLMVVPDKISEVVELLKKLPDLERLLSKIHNVGSPLKSQNHPDS 660 670 680 690 700 710 850 860 870 880 890 900 pF1KE1 RAIMYEETTYSKKKIIDFLSALEGFKVMCKIIGIMEEVADGFKSKILKQVISLQTKNPEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 RAIMYEETTYSKKKIIDFLSALEGFKVMCKIIGIMEEVADGFKSKILKQVISLQTKNPEG 720 730 740 750 760 770 910 920 930 940 950 960 pF1KE1 RFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQALADIRENEQSLLEYLEKQRN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 RFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQALADIRENEQSLLEYLEKQRN 780 790 800 810 820 830 970 980 990 1000 1010 1020 pF1KE1 RIGCRTIVYWGIGRNRYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKLANLIN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 RIGCRTIVYWGIGRNRYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKLANLIN 840 850 860 870 880 890 1030 1040 1050 1060 1070 1080 pF1KE1 AEERRDVSLKDCMRRLFYNFDKNYKDWQSAVECIAVLDVLLCLANYSRGGDGPMCRPVIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 AEERRDVSLKDCMRRLFYNFDKNYKDWQSAVECIAVLDVLLCLANYSRGGDGPMCRPVIL 900 910 920 930 940 950 1090 1100 1110 1120 1130 1140 pF1KE1 LPEDTPPFLELKGSRHPCITKTFFGDDFIPNDILIGCEEEEQENGKAYCVLVTGPNMGGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 LPEDTPPFLELKGSRHPCITKTFFGDDFIPNDILIGCEEEEQENGKAYCVLVTGPNMGGK 960 970 980 990 1000 1010 1150 1160 1170 1180 1190 1200 pF1KE1 STLMRQAGLLAVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFFVELSETASI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 STLMRQAGLLAVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFFVELSETASI 1020 1030 1040 1050 1060 1070 1210 1220 1230 1240 1250 1260 pF1KE1 LMHATAHSLVLVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHSLVEDYSQNV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 LMHATAHSLVLVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHSLVEDYSQNV 1080 1090 1100 1110 1120 1130 1270 1280 1290 1300 1310 1320 pF1KE1 AVRLGHMACMVENECEDPSQETITFLYKFIKGACPKSYGFNAARLANLPEEVIQKGHRKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 AVRLGHMACMVENECEDPSQETITFLYKFIKGACPKSYGFNAARLANLPEEVIQKGHRKA 1140 1150 1160 1170 1180 1190 1330 1340 1350 1360 pF1KE1 REFEKMNQSLRLFREVCLASERSTVDAEAVHKLLTLIKEL :::::::::::::::::::::::::::::::::::::::: CCDS62 REFEKMNQSLRLFREVCLASERSTVDAEAVHKLLTLIKEL 1200 1210 1220 1230 >>CCDS62907.1 MSH6 gene_id:2956|Hs108|chr2 (1058 aa) initn: 7032 init1: 7032 opt: 7032 Z-score: 5514.8 bits: 1032.5 E(32554): 0 Smith-Waterman score: 7032; 100.0% identity (100.0% similar) in 1058 aa overlap (303-1360:1-1058) 280 290 300 310 320 330 pF1KE1 GSSDEISSGVGDSESEGLNSPVKVARKRKRMVTGNGSLKRKSSRKETPSATKQATSISSE :::::::::::::::::::::::::::::: CCDS62 MVTGNGSLKRKSSRKETPSATKQATSISSE 10 20 30 340 350 360 370 380 390 pF1KE1 TKNTLRAFSAPQNSESQAHVSGGGDDSSRPTVWYHETLEWLKEEKRRDEHRRRPDHPDFD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 TKNTLRAFSAPQNSESQAHVSGGGDDSSRPTVWYHETLEWLKEEKRRDEHRRRPDHPDFD 40 50 60 70 80 90 400 410 420 430 440 450 pF1KE1 ASTLYVPEDFLNSCTPGMRKWWQIKSQNFDLVICYKVGKFYELYHMDALIGVSELGLVFM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 ASTLYVPEDFLNSCTPGMRKWWQIKSQNFDLVICYKVGKFYELYHMDALIGVSELGLVFM 100 110 120 130 140 150 460 470 480 490 500 510 pF1KE1 KGNWAHSGFPEIAFGRYSDSLVQKGYKVARVEQTETPEMMEARCRKMAHISKYDRVVRRE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 KGNWAHSGFPEIAFGRYSDSLVQKGYKVARVEQTETPEMMEARCRKMAHISKYDRVVRRE 160 170 180 190 200 210 520 530 540 550 560 570 pF1KE1 ICRIITKGTQTYSVLEGDPSENYSKYLLSLKEKEEDSSGHTRAYGVCFVDTSLGKFFIGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 ICRIITKGTQTYSVLEGDPSENYSKYLLSLKEKEEDSSGHTRAYGVCFVDTSLGKFFIGQ 220 230 240 250 260 270 580 590 600 610 620 630 pF1KE1 FSDDRHCSRFRTLVAHYPPVQVLFEKGNLSKETKTILKSSLSCSLQEGLIPGSQFWDASK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 FSDDRHCSRFRTLVAHYPPVQVLFEKGNLSKETKTILKSSLSCSLQEGLIPGSQFWDASK 280 290 300 310 320 330 640 650 660 670 680 690 pF1KE1 TLRTLLEEEYFREKLSDGIGVMLPQVLKGMTSESDSIGLTPGEKSELALSALGGCVFYLK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 TLRTLLEEEYFREKLSDGIGVMLPQVLKGMTSESDSIGLTPGEKSELALSALGGCVFYLK 340 350 360 370 380 390 700 710 720 730 740 750 pF1KE1 KCLIDQELLSMANFEEYIPLDSDTVSTTRSGAIFTKAYQRMVLDAVTLNNLEIFLNGTNG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 KCLIDQELLSMANFEEYIPLDSDTVSTTRSGAIFTKAYQRMVLDAVTLNNLEIFLNGTNG 400 410 420 430 440 450 760 770 780 790 800 810 pF1KE1 STEGTLLERVDTCHTPFGKRLLKQWLCAPLCNHYAINDRLDAIEDLMVVPDKISEVVELL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 STEGTLLERVDTCHTPFGKRLLKQWLCAPLCNHYAINDRLDAIEDLMVVPDKISEVVELL 460 470 480 490 500 510 820 830 840 850 860 870 pF1KE1 KKLPDLERLLSKIHNVGSPLKSQNHPDSRAIMYEETTYSKKKIIDFLSALEGFKVMCKII :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 KKLPDLERLLSKIHNVGSPLKSQNHPDSRAIMYEETTYSKKKIIDFLSALEGFKVMCKII 520 530 540 550 560 570 880 890 900 910 920 930 pF1KE1 GIMEEVADGFKSKILKQVISLQTKNPEGRFPDLTVELNRWDTAFDHEKARKTGLITPKAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 GIMEEVADGFKSKILKQVISLQTKNPEGRFPDLTVELNRWDTAFDHEKARKTGLITPKAG 580 590 600 610 620 630 940 950 960 970 980 990 pF1KE1 FDSDYDQALADIRENEQSLLEYLEKQRNRIGCRTIVYWGIGRNRYQLEIPENFTTRNLPE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 FDSDYDQALADIRENEQSLLEYLEKQRNRIGCRTIVYWGIGRNRYQLEIPENFTTRNLPE 640 650 660 670 680 690 1000 1010 1020 1030 1040 1050 pF1KE1 EYELKSTKKGCKRYWTKTIEKKLANLINAEERRDVSLKDCMRRLFYNFDKNYKDWQSAVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 EYELKSTKKGCKRYWTKTIEKKLANLINAEERRDVSLKDCMRRLFYNFDKNYKDWQSAVE 700 710 720 730 740 750 1060 1070 1080 1090 1100 1110 pF1KE1 CIAVLDVLLCLANYSRGGDGPMCRPVILLPEDTPPFLELKGSRHPCITKTFFGDDFIPND :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 CIAVLDVLLCLANYSRGGDGPMCRPVILLPEDTPPFLELKGSRHPCITKTFFGDDFIPND 760 770 780 790 800 810 1120 1130 1140 1150 1160 1170 pF1KE1 ILIGCEEEEQENGKAYCVLVTGPNMGGKSTLMRQAGLLAVMAQMGCYVPAEVCRLTPIDR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 ILIGCEEEEQENGKAYCVLVTGPNMGGKSTLMRQAGLLAVMAQMGCYVPAEVCRLTPIDR 820 830 840 850 860 870 1180 1190 1200 1210 1220 1230 pF1KE1 VFTRLGASDRIMSGESTFFVELSETASILMHATAHSLVLVDELGRGTATFDGTAIANAVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 VFTRLGASDRIMSGESTFFVELSETASILMHATAHSLVLVDELGRGTATFDGTAIANAVV 880 890 900 910 920 930 1240 1250 1260 1270 1280 1290 pF1KE1 KELAETIKCRTLFSTHYHSLVEDYSQNVAVRLGHMACMVENECEDPSQETITFLYKFIKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 KELAETIKCRTLFSTHYHSLVEDYSQNVAVRLGHMACMVENECEDPSQETITFLYKFIKG 940 950 960 970 980 990 1300 1310 1320 1330 1340 1350 pF1KE1 ACPKSYGFNAARLANLPEEVIQKGHRKAREFEKMNQSLRLFREVCLASERSTVDAEAVHK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 ACPKSYGFNAARLANLPEEVIQKGHRKAREFEKMNQSLRLFREVCLASERSTVDAEAVHK 1000 1010 1020 1030 1040 1050 1360 pF1KE1 LLTLIKEL :::::::: CCDS62 LLTLIKEL >>CCDS34195.1 MSH3 gene_id:4437|Hs108|chr5 (1137 aa) initn: 816 init1: 427 opt: 601 Z-score: 476.3 bits: 100.3 E(32554): 3.3e-20 Smith-Waterman score: 1053; 26.9% identity (58.9% similar) in 1121 aa overlap (248-1331:85-1101) 220 230 240 250 260 270 pF1KE1 KSEEDNEIESEEEVQPKTQGSRRSSRQIKKRRVISDSESDIGGSDVEFKPDTKEEGSSDE :: :.: : . : ..::.:: CCDS34 AAAAAAAAPPAPPAPAFPPQLPPHIATEIDRRKKRPLEND-GPVKKKVKKVQQKEGGSDL 60 70 80 90 100 110 280 290 300 310 320 330 pF1KE1 ISSGVGDSESEGLNSPVKVARKRKRMVTGNGSLKRKSSRKETPSATKQATSISSETKNTL :: .:: : : : :. . . .::. . :.. :. :.. . CCDS34 GMSG--NSE------PKKCLRTRN-VSKSLEKLKEFCCDSALPQSRVQTESLQERFAVLP 120 130 140 150 160 340 350 360 370 380 390 pF1KE1 RAFSAPQNSESQAHVSGGGDDSSRPTVWYHETLEWLKEEKRRDEHRRRPDHPDFDASTLY . . . : .:. . ...::.: :: :.. . .: ... .. CCDS34 KCTDFDDISLLHAKNAVSSEDSKRQINQKDTTLFDLSQFGSSNT-----SHENLQKTASK 170 180 190 200 210 400 410 420 430 440 450 pF1KE1 VPEDFLNSC-TPGMRKWWQIKSQNFDLVICYKVGKFYELYHMDALIGVSELGLV-FMKGN . .: :: .. ..:.:. : :.: . : :... :: :.. ::.. . : CCDS34 SANKRSKSIYTPLELQYIEMKQQHKDAVLCVECGYKYRFFGEDAEIAARELNIYCHLDHN 220 230 240 250 260 270 460 470 480 490 500 pF1KE1 WAHSGFPEIAFGRYSDSLVQKGYKVARVEQTETPEMM---EARC----RKMAHISKYDRV . ...: . . :: :::::. :.:::: . . : ::.. . . . CCDS34 FMTASIPTHRLFVHVRRLVAKGYKVGVVKQTETAALKAIGDNRSSLFSRKLTALYTKSTL 280 290 300 310 320 330 510 520 530 540 550 560 pF1KE1 VRREICRIITKGTQTYSVLEGDPSENYSKYLLSLKEKEEDSSGHTRA---YGVCFVDTSL . ... .: : .. .: : ... ..::: ..:..:. . .. :. :. . CCDS34 IGEDVNPLI-KLDDAVNVDEI-MTDTSTSYLLCISENKENVRDKKKGNIFIGIVGVQPAT 340 350 360 370 380 390 570 580 590 600 610 620 pF1KE1 GKFFIGQFSDDRHCSRFRTLVAHYPPVQVLFEKGNLSKETKTILKSSLSCSLQEGLIP-- :. . .:.:. :...: .. ::..:. .. ::..:..... . : :.:. : CCDS34 GEVVFDSFQDSASRSELETRMSSLQPVELLLPSA-LSEQTEALIHRATSVSVQDDRIRVE 400 410 420 430 440 450 630 640 650 660 670 680 pF1KE1 --GSQFWDASKTLRTLLEEEYFREKLSDGIGVMLPQVLKGMTSESDSIGLTPGEKSELAL . ... :...... : : : : . . :...:. ..: :: .. CCDS34 RMDNIYFEYSHAFQAVTE---FYAK--DTVDIKGSQIISGI------VNL---EKP--VI 460 470 480 490 500 690 700 710 720 730 740 pF1KE1 SALGGCVFYLKKCLIDQELLSMANFEEYIPLDSDTVSTTRSGAIFTKAYQRMVLDAVTLN .:.. . :::. ... : . ::.. ... .. :.....:: CCDS34 CSLAAIIKYLKEFNLEKMLSKPENFKQ-----------------LSSKMEFMTINGTTLR 510 520 530 540 750 760 770 780 790 800 pF1KE1 NLEIFLNGTNGSTEGTLLERVDTCHTPFGKRLLKQWLCAPLCNHYAINDRLDAIEDLMVV ::::. : :. .:.:.:: .: .: ::.: ::.:. :: . :: ::::. ... CCDS34 NLEILQNQTDMKTKGSLLWVLDHTKTSFGRRKLKKWVTQPLLKLREINARLDAVSEVLHS 550 560 570 580 590 600 810 820 830 840 850 860 pF1KE1 PDKI-SEVVELLKKLPDLERLLSKIHNVGSPLKSQNHPDSRAIMYEETTYSKKKIIDFLS ... ... . :.::::.:: : .:.. . ..:. .. .: : :. .: . CCDS34 ESSVFGQIENHLRKLPDIERGLCSIYH--KKCSTQEF-----FLIVKTLYHLKS--EFQA 610 620 630 640 650 870 880 890 900 910 920 pF1KE1 ALEGFKVMCKIIGIMEEVADGFKSKILKQVISLQTKNPEGRFPDLTVELNRWDTAFDHEK :. : . ..: .:. :: :. .:.: .... .. :. CCDS34 -------------IIPAVNSHIQSDLLRTVI-LE-------IPELLSPVEHYLKILN-EQ 660 670 680 690 930 940 950 960 970 pF1KE1 ARKTGLITPKAGFDSDYDQALADIRENE-QSLLE----YLEKQRNRIGCRTIVYWGIGRN : :.: : : . : : :..: :.... .:.. :. . . : .. . CCDS34 AAKVGDKTEL--FKDLSDFPLIKKRKDEIQGVIDEIRMHLQEIRKILKNPSAQYVTVSGQ 700 710 720 730 740 750 980 990 1000 1010 1020 1030 pF1KE1 RYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKLANLINAEERRDVSLKDCMRR ....:: .: .. .: .. .. :. .:. . : . : . .. :. . :: . CCDS34 EFMIEI-KNSAVSCIPTDWVKVGSTKAVSRFHSPFI---VENYRHLNQLREQLVLDCSAE 760 770 780 790 800 1040 1050 1060 1070 1080 1090 pF1KE1 ---LFYNFDKNYKDWQSAVECIAVLDVLLCLANYSRGGDGPMCRPVILLPEDTPPFLELK .. .:...:.. .::. .:..: .. ::. .. :: .:::.. :. . .: CCDS34 WLDFLEKFSEHYHSLCKAVHHLATVDCIFSLAKVAKQGD--YCRPTV--QEERK--IVIK 810 820 830 840 850 860 1100 1110 1120 1130 1140 1150 pF1KE1 GSRHPCITKTFFG--DDFIPNDILIGCEEEEQENGKAYCVLVTGPNMGGKSTLMRQAGLL ..::: : ...: :...::. .. :. :. ...:::::::::. ..:..:. CCDS34 NGRHPVID-VLLGEQDQYVPNNTDLS-EDSER------VMIITGPNMGGKSSYIKQVALI 870 880 890 900 910 1160 1170 1180 1190 1200 1210 pF1KE1 AVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFFVELSETASILMHATAHSLV ..:::.: ::::: . .: .:::.::.: :..:.:::. ::..:: :. .::..::: CCDS34 TIMAQIGSYVPAEEATIGIVDGIFTRMGAADNIYKGQSTFMEELTDTAEIIRKATSQSLV 920 930 940 950 960 970 1220 1230 1240 1250 1260 pF1KE1 LVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHSLVE---DYSQNVAVRLGHM ..:::::::.: :: ::: :... . . .: ::: ::: . : .::..:. :: CCDS34 ILDELGRGTSTHDGIAIAYATLEYFIRDVKSLTLFVTHYPPVCELEKNYSHQVGNY--HM 980 990 1000 1010 1020 1030 1270 1280 1290 1300 1310 1320 pF1KE1 ACMV-ENECE-DPSQ-----ETITFLYKFIKGACPKSYGFNAARLANLPEEVIQKGHRKA . .: :.: . ::. . .::::.. .: .:::.:.:.::..: :...:. .:. CCDS34 GFLVSEDESKLDPGAAEQVPDFVTFLYQITRGIAARSYGLNVAKLADVPGEILKKAAHKS 1040 1050 1060 1070 1080 1090 1330 1340 1350 1360 pF1KE1 REFEKMNQSLRLFREVCLASERSTVDAEAVHKLLTLIKEL .:.: . .. : CCDS34 KELEGLINTKRKRLKYFAKLWTMHNAQDLQKWTEEFNMEETQTSLLH 1100 1110 1120 1130 >>CCDS58709.1 MSH2 gene_id:4436|Hs108|chr2 (868 aa) initn: 678 init1: 428 opt: 590 Z-score: 469.3 bits: 98.6 E(32554): 8e-20 Smith-Waterman score: 833; 27.8% identity (57.7% similar) in 823 aa overlap (521-1325:63-787) 500 510 520 530 540 550 pF1KE1 MMEARCRKMAHISKYDRVVRREICRIITKGTQTYSVLEGDPSENYSKYLLSLKEKEEDSS .: ..: :. . . : ....: . :.. CCDS58 RVEVYKNRAGNKASKENDWYLAYKASPGNLSQFEDILFGNNDMSASIGVVGVKMSAVDGQ 40 50 60 70 80 90 560 570 580 590 600 610 pF1KE1 GHTRAYGVCFVDTSLGKFFIGQFSDDRHCSRFRTLVAHYPPVQVLFEKGNLSKETKTILK : :: .::. :. . .: :. . : ...:. . : . .. :. . . CCDS58 ---RQVGVGYVDSIQRKLGLCEFPDNDQFSNLEALLIQIGPKECVLPGGETAGDM----- 100 110 120 130 140 620 630 640 650 660 670 pF1KE1 SSLSCSLQEGLIPGSQFWDASKTLRTLLEEEYFREKLSDGIGVMLPQVLKGMTSESDSIG ..: .:.: : .. :. . . . .. : ..::: .:. . . CCDS58 GKLRQIIQRGGILITERKKADFSTKDIYQD--------------LNRLLKGKKGEQMNSA 150 160 170 180 190 680 690 700 710 720 pF1KE1 LTPGEKSELALSALGGCVFYLKKCLIDQELLSM-ANFEEYIPLDSDTVSTTRSGAIFTKA . : ....:.:.:.. . .: :::: .:: .. : :. CCDS58 VLPEMENQVAVSSLSAVIKFL-------ELLSDDSNFGQFELTTFD----------FS-- 200 210 220 230 730 740 750 760 770 780 pF1KE1 YQRMVLDAVTLNNLEIFLNGTNGSTEGT--LLERVDTCHTPFGKRLLKQWLCAPLCNHYA : : :: ... :..: .:. .: :. : .. :.:: :.::..::. :: .. CCDS58 -QYMKLDIAAVRALNLF-QGSVEDTTGSQSLAALLNKCKTPQGQRLVNQWIKQPLMDKNR 240 250 260 270 280 790 800 810 820 830 pF1KE1 INDRLDAIEDLMVVPDKISEVVE--LLKKLPDLERLLSKIHNVGSPLKS--------QNH :..::. .: . : .. .... ::...:::.:: .:.. .. :.. .. CCDS58 IEERLNLVEAF-VEDAELRQTLQEDLLRRFPDLNRLAKKFQRQAANLQDCYRLYQGINQL 290 300 310 320 330 340 840 850 860 870 880 890 pF1KE1 PDS-RAIMYEETTYSKKKIIDFLSALEGFKV-MCKIIGIMEEVADGFKSKILKQVISLQT :. .:. .: ..: . :.. : .. . :. ..: . : . :: . . CCDS58 PNVIQALEKHEGKHQKLLLAVFVTPLTDLRSDFSKFQEMIETTLD------MDQVENHEF 350 360 370 380 390 400 900 910 920 930 940 950 pF1KE1 KNPEGRFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQALADIRENEQSLLEYL . :.:. :: . : :: .. ::. :. : : . .:. . .. . : CCDS58 LVKPSFDPNLS-ELR--EIMNDLEKKMQSTLIS--AARDLGLDPG-KQIKLDSSAQFGYY 410 420 430 440 450 960 970 980 990 1000 1010 pF1KE1 EKQRNRIGCRTIVYWGIGRNRYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKL :. :. . :: .::.: .. :. : . :. :. CCDS58 F----RVTCKE---EKVLRNN------KNFSTVDIQ-----KNGVKFTNSKLTSLNEEYT 460 470 480 490 1020 1030 1040 1050 1060 1070 pF1KE1 ANLINAEERRDVSLKDCMRRLFYNFDKNY-KDWQSAVECIAVLDVLLCLANYSRGGDGPM : . :: .:. .:. . :....: . :. . .: ::... .:. : :. :. CCDS58 KNKTEYEEAQDAIVKEIV-----NISSGYVEPMQTLNDVLAQLDAVVSFAHVSNGAPVPY 500 510 520 530 540 550 1080 1090 1100 1110 1120 1130 pF1KE1 CRPVILLPEDTPPFLELKGSRHPCITKTFFGDD--FIPNDILIGCEEEEQENGKAYCVLV ::.:: : . ::.::: :. :. :::::. . :. : . .. CCDS58 VRPAIL--EKGQGRIILKASRHACVE---VQDEIAFIPNDVYF-------EKDKQMFHII 560 570 580 590 600 1140 1150 1160 1170 1180 1190 pF1KE1 TGPNMGGKSTLMRQAGLLAVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFFV :::::::::: .::.:....:::.::.:: : ... .: ...:.::.: ..: :::.. CCDS58 TGPNMGGKSTYIRQTGVIVLMAQIGCFVPCESAEVSIVDCILARVGAGDSQLKGVSTFMA 610 620 630 640 650 660 1200 1210 1220 1230 1240 1250 pF1KE1 ELSETASILMHATAHSLVLVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHSL :. :::::: :: ::...:::::::.:.:: ..: :. . .: : .:.::.: : CCDS58 EMLETASILRSATKDSLIIIDELGRGTSTYDGFGLAWAISEYIATKIGAFCMFATHFHEL 670 680 690 700 710 720 1260 1270 1280 1290 1300 1310 pF1KE1 VEDYSQNVAVRLGHMACMVENECEDPSQETITFLYKFIKGACPKSYGFNAARLANLPEEV . .: .: :.. .. ..::.:.::. ::.: .:.:...:.:::.:..: CCDS58 TALANQIPTVNNLHVTALT-------TEETLTMLYQVKKGVCDQSFGIHVAELANFPKHV 730 740 750 760 770 1320 1330 1340 1350 1360 pF1KE1 IQKGHRKAREFEKMNQSLRLFREVCLASERSTVDAEAVHKLLTLIKEL :. ...:: :.:. CCDS58 IECAKQKALELEEFQYIGESQGYDIMEPAAKKCYLEREQGEKIIQEFLSKVKQMPFTEMS 780 790 800 810 820 830 >>CCDS1834.1 MSH2 gene_id:4436|Hs108|chr2 (934 aa) initn: 678 init1: 428 opt: 590 Z-score: 468.9 bits: 98.6 E(32554): 8.5e-20 Smith-Waterman score: 835; 26.8% identity (56.9% similar) in 921 aa overlap (430-1325:40-853) 400 410 420 430 440 450 pF1KE1 EDFLNSCTPGMRKWWQIKSQNFDLVICYKVGKFYELYHMDALIGVSEL----GLVFMKGN : :: . :::... :. :.. . : CCDS18 QLESAAEVGFVRFFQGMPEKPTTTVRLFDRGDFYTAHGEDALLAAREVFKTQGVIKYMGP 10 20 30 40 50 60 460 470 480 490 500 510 pF1KE1 WAHSGFPEIAFGRYS-DSLVQKGYKVARVEQTETPEMMEARCRKMAHISKYDRVVRREIC . ... ....... .:.: : ..: ..:. . : . :: . . CCDS18 AGAKNLQSVVLSKMNFESFV-KDLLLVRQYRVEV-----YKNRAGNKASKENDWY---LA 70 80 90 100 110 120 520 530 540 550 560 570 pF1KE1 RIITKG--TQTYSVLEGDPSENYSKYLLSLKEKEEDSSGHTRAYGVCFVDTSLGKFFIGQ . : .: ..: :. . . : ....: . :.. : :: .::. :. . . CCDS18 YKASPGNLSQFEDILFGNNDMSASIGVVGVKMSAVDGQ---RQVGVGYVDSIQRKLGLCE 130 140 150 160 170 580 590 600 610 620 630 pF1KE1 FSDDRHCSRFRTLVAHYPPVQVLFEKGNLSKETKTILKSSLSCSLQEGLIPGSQFWDASK : :. . : ...:. . : . .. :. . . ..: .:.: : .. :. CCDS18 FPDNDQFSNLEALLIQIGPKECVLPGGETAGDM-----GKLRQIIQRGGILITERKKADF 180 190 200 210 220 230 640 650 660 670 680 690 pF1KE1 TLRTLLEEEYFREKLSDGIGVMLPQVLKGMTSESDSIGLTPGEKSELALSALGGCVFYLK . . . .. : ..::: .:. . .. : ....:.:.:.. . .: CCDS18 STKDIYQD--------------LNRLLKGKKGEQMNSAVLPEMENQVAVSSLSAVIKFL- 240 250 260 270 700 710 720 730 740 750 pF1KE1 KCLIDQELLSM-ANFEEYIPLDSDTVSTTRSGAIFTKAYQRMVLDAVTLNNLEIFLNGTN :::: .:: .. : :. : : :: ... :..: .:. CCDS18 ------ELLSDDSNFGQFELTTFD----------FS---QYMKLDIAAVRALNLF-QGSV 280 290 300 310 760 770 780 790 800 pF1KE1 GSTEGT--LLERVDTCHTPFGKRLLKQWLCAPLCNHYAINDRLDAIEDLMVVPDKISEVV .: :. : .. :.:: :.::..::. :: .. :..::. .: . : .. ... CCDS18 EDTTGSQSLAALLNKCKTPQGQRLVNQWIKQPLMDKNRIEERLNLVEAF-VEDAELRQTL 320 330 340 350 360 370 810 820 830 840 850 pF1KE1 E--LLKKLPDLERLLSKIHNVGSPLKS--------QNHPDS-RAIMYEETTYSKKKIIDF . ::...:::.:: .:.. .. :.. .. :. .:. .: ..: . : CCDS18 QEDLLRRFPDLNRLAKKFQRQAANLQDCYRLYQGINQLPNVIQALEKHEGKHQKLLLAVF 380 390 400 410 420 430 860 870 880 890 900 910 pF1KE1 LSALEGFKV-MCKIIGIMEEVADGFKSKILKQVISLQTKNPEGRFPDLTVELNRWDTAFD .. : .. . :. ..: . : . :: . . . :.:. :: . : CCDS18 VTPLTDLRSDFSKFQEMIETTLD------MDQVENHEFLVKPSFDPNLS-ELR--EIMND 440 450 460 470 480 920 930 940 950 960 970 pF1KE1 HEKARKTGLITPKAGFDSDYDQALADIRENEQSLLEYLEKQRNRIGCRTIVYWGIGRNRY :: .. ::. :. : : . .:. . .. . : :. :. . :: CCDS18 LEKKMQSTLIS--AARDLGLDPG-KQIKLDSSAQFGYYF----RVTCKE---EKVLRNN- 490 500 510 520 530 980 990 1000 1010 1020 1030 pF1KE1 QLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKLANLINAEERRDVSLKDCMRRLF .::.: .. :. : . :. :. : . :: .:. .:. . CCDS18 -----KNFSTVDIQ-----KNGVKFTNSKLTSLNEEYTKNKTEYEEAQDAIVKE-----I 540 550 560 570 580 1040 1050 1060 1070 1080 1090 pF1KE1 YNFDKNY-KDWQSAVECIAVLDVLLCLANYSRGGDGPMCRPVILLPEDTPPFLELKGSRH :....: . :. . .: ::... .:. : :. :. ::.:: : . ::.::: CCDS18 VNISSGYVEPMQTLNDVLAQLDAVVSFAHVSNGAPVPYVRPAIL--EKGQGRIILKASRH 590 600 610 620 630 1100 1110 1120 1130 1140 1150 pF1KE1 PCITKTFFGDD--FIPNDILIGCEEEEQENGKAYCVLVTGPNMGGKSTLMRQAGLLAVMA :. :. :::::. . :. : . ..:::::::::: .::.:....:: CCDS18 ACVE---VQDEIAFIPNDVYF-------EKDKQMFHIITGPNMGGKSTYIRQTGVIVLMA 640 650 660 670 680 1160 1170 1180 1190 1200 1210 pF1KE1 QMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFFVELSETASILMHATAHSLVLVDE :.::.:: : ... .: ...:.::.: ..: :::..:. :::::: :: ::...:: CCDS18 QIGCFVPCESAEVSIVDCILARVGAGDSQLKGVSTFMAEMLETASILRSATKDSLIIIDE 690 700 710 720 730 740 1220 1230 1240 1250 1260 1270 pF1KE1 LGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHSLVEDYSQNVAVRLGHMACMVENE :::::.:.:: ..: :. . .: : .:.::.: :. .: .: :.. .. CCDS18 LGRGTSTYDGFGLAWAISEYIATKIGAFCMFATHFHELTALANQIPTVNNLHVTALT--- 750 760 770 780 790 800 1280 1290 1300 1310 1320 1330 pF1KE1 CEDPSQETITFLYKFIKGACPKSYGFNAARLANLPEEVIQKGHRKAREFEKMNQSLRLFR ..::.:.::. ::.: .:.:...:.:::.:..::. ...:: :.:. CCDS18 ----TEETLTMLYQVKKGVCDQSFGIHVAELANFPKHVIECAKQKALELEEFQYIGESQG 810 820 830 840 850 860 1340 1350 1360 pF1KE1 EVCLASERSTVDAEAVHKLLTLIKEL CCDS18 YDIMEPAAKKCYLEREQGEKIIQEFLSKVKQMPFTEMSEENITIKLKQLKAEVIAKNNSF 870 880 890 900 910 920 >>CCDS670.1 MSH4 gene_id:4438|Hs108|chr1 (936 aa) initn: 481 init1: 309 opt: 408 Z-score: 326.3 bits: 72.2 E(32554): 7.5e-12 Smith-Waterman score: 544; 25.9% identity (56.3% similar) in 679 aa overlap (700-1355:276-893) 670 680 690 700 710 720 pF1KE1 GLTPGEKSELALSALGGCVFYLKKCLIDQELLSMANFEEYIPLDSDTVSTTRSGAI-FTK : ..: . .:. . ...: . .: : : CCDS67 NETKGLEYIEQLCIAEFSTVLMEVQSKYYCLAAVAALLKYVEFIQNSVYAPKSLKICFQG 250 260 270 280 290 300 730 740 750 760 770 780 pF1KE1 AYQRMVLDAVTLNNLEIFLNGTNGSTEGTLLERVDTCHTPFGKRLLKQWLCAPLCNHYAI . : ..:. . .:::...:. . .. ::. .. .:: :.: :.. . :: . .: CCDS67 SEQTAMIDSSSAQNLELLINNQDYRNNHTLFGVLNYTKTPGGSRRLRSNILEPLVDIETI 310 320 330 340 350 360 790 800 810 820 830 840 pF1KE1 NDRLDAIEDLMVVPDKISEVVELLKKLPDLERLLSKIHNVGSPLKSQNHPDSRA--IMYE : ::: ...:. . . . ..... : :.::: . .. . . : .:. ..: CCDS67 NMRLDCVQELLQDEELFFGLQSVISRFLDTEQLLSVLVQIPKQ-DTVNAAESKITNLIYL 370 380 390 400 410 420 850 860 870 880 890 900 pF1KE1 ETTYSKKKIIDFLS-ALEGFK--VMCKIIGIMEEVADGFKSKILKQVISLQTKNPEG--- . : ...: :. :... . .. : .:. :. . .: ::. ... .: CCDS67 KHTL---ELVDPLKIAMKNCNTPLLRAYYGSLEDKRFGIILEKIKTVINDDARYMKGCLN 430 440 450 460 470 480 910 920 930 940 950 pF1KE1 -RFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQALA-DIRENEQSLLEYLEKQ : . . . .: . : .. ::. :. . . .: . .: .. .. CCDS67 MRTQKCYAVRSNINEFLDIARRTYTEIVDDIAGMISQLGEKYSLPLRTSFSSARGFFIQM 490 500 510 520 530 540 960 970 980 990 1000 1010 pF1KE1 RNRIGCRTIVYWGIGRNRYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKLANL . : . .: . .:: :. .: .: . .:. :.: CCDS67 TT--DC--------------IALPSD----QLPSEF-IKISKVKNSYSFTS------ADL 550 560 570 1020 1030 1040 1050 1060 1070 pF1KE1 INAEERRDVSLKDCMRRLFYNFDKNYKDWQSAVEC-------IAVLDVLLCLANYSRGGD :. .:: . ::.. .. .. : .. ..: ...::.:: .:. .: CCDS67 IKMNERCQESLREIYHMTYMIVCKLLSEIYEHIHCLYKLSDTVSMLDMLLSFAHACTLSD 580 590 600 610 620 630 1080 1090 1100 1110 1120 1130 pF1KE1 GPMCRPVILLPEDTPPFLELKGSRHPCITKTFFGDDFIPNDILIGCEEEEQENGKAYCVL . :: . :: : .: . :: . : . .. : :. . .:. . .. CCDS67 --YVRPEFT---DT---LAIKQGWHPILEK-ISAEKPIANNTYV-------TEGSNF-LI 640 650 660 670 1140 1150 1160 1170 1180 1190 pF1KE1 VTGPNMGGKSTLMRQAGLLAVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFF .:::::.:::: ..: .: .:::.: ::::: . ..:::....: : .. :::. CCDS67 ITGPNMSGKSTYLKQIALCQIMAQIGSYVPAEYSSFRIAKQIFTRISTDDDIETNSSTFM 680 690 700 710 720 730 1200 1210 1220 1230 1240 1250 pF1KE1 VELSETASILMHATAHSLVLVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHS :..: : :: .:. .::.:.::::::: : .: .: :: . : ..: :::.::. CCDS67 KEMKEIAYILHNANDKSLILIDELGRGTNTEEGIGICYAVCEYLL-SLKAFTLFATHFLE 740 750 760 770 780 790 1260 1270 1280 1290 1300 pF1KE1 LVEDYSQNVAVRLGHMACM-VENECEDPSQETITFLYKFIKGACP-KSYGFNAARLANLP : . . :. :. . :.: .. .:.: . ::. :: :.::..::....:: CCDS67 LCHIDALYPNVENMHFEVQHVKNTSRN--KEAILYTYKLSKGLTEEKNYGLKAAEVSSLP 800 810 820 830 840 850 1310 1320 1330 1340 1350 1360 pF1KE1 EEVIQKGHRKAREFEKMNQSLRLFREVCLASERSTVDAE---AVHKLLTLIKEL .. :.:. . .. :.. : ..::: . : ::..: : CCDS67 PSIVL----DAKEI-----TTQITRQI-LQNQRSTPEMERQRAVYHLATRLVQTARNSQL 860 870 880 890 900 CCDS67 DPDSLRIYLSNLKKKYKEDFPRTEQVPEKTEE 910 920 930 >>CCDS4720.1 MSH5 gene_id:4439|Hs108|chr6 (834 aa) initn: 456 init1: 311 opt: 393 Z-score: 315.3 bits: 70.0 E(32554): 3.1e-11 Smith-Waterman score: 538; 27.4% identity (56.1% similar) in 660 aa overlap (679-1316:178-771) 650 660 670 680 690 700 pF1KE1 DGIGVMLPQVLKGMTSESDSIGLTPGEKSELALSALGGCVFYLKKCLIDQELLSMANFEE :.. :::: . .: . : :: ... CCDS47 LSGNYSFIPDAMTATEKILFLSSIIPFDCLLTVRALGGLLKFLGRRRIGVEL---EDYNV 150 160 170 180 190 200 710 720 730 740 750 760 pF1KE1 YIP-LDSDTVSTTRSGAIFTKAYQRMVLDAVTLNNLEIFLNGTNGSTEG-TLLERVDTCH .: : :. : .:. ::. .. . ..: :: .:. .. :: CCDS47 SVPILGFKKFMLTHLVNIDQDTYS--VLQIFKSESHPSVYKVASGLKEGLSLFGILNRCH 210 220 230 240 250 260 770 780 790 800 810 820 pF1KE1 TPFGKRLLKQWLCAPLCNHYAINDRLDAIEDLMVVPDKISEVVELLKKLPDLERLLSKIH .:..::. :. : . ...:::.:. ....:... ..... :.:::..:. CCDS47 CKWGEKLLRLWFTRPTHDLGELSSRLDVIQ-FFLLPQNL-DMAQM------LHRLLGHIK 270 280 290 300 310 830 840 850 860 870 880 pF1KE1 NVGSPLKSQNHPDSRA----IMYEETTYSKKKIIDFLSALEGFKVMCKIIGIMEEVADGF :: :: .. ... ..:. :.:: . : .: . . : .: .: . CCDS47 NVPLILKRMKLSHTKVSDWQVLYK-TVYSALGLRDACRSLPQSIQLFR--DIAQEFSDDL 320 330 340 350 360 370 890 900 910 920 930 940 pF1KE1 K--SKILKQVISLQTKNPEGRFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQA . .... .:.... . :.:: :: : : .:..: : :: : .: CCDS47 HHIASLIGKVVDFEGSLAENRF---TV-LPNIDPEIDEKKRRLMGL--P--SF------- 380 390 400 410 950 960 970 980 990 pF1KE1 LADIRENEQSLLEYLEKQRNRI-GCRTIVYWGIGRNRYQLEIPE--------NFTTRNLP :... ..: ::. .:: .: .: :: . : ::. .: .: CCDS47 LTEVARKE------LENLDSRIPSCSVIYIPLIG---FLLSIPRLPSMVEASDFEINGLD 420 430 440 450 460 1000 1010 1020 1030 1040 1050 pF1KE1 EEYELKSTKKGCKRYWTKTIEKKLANLINAEERRDVSLKDCMRRLFYNFDKNYKDWQSAV . :. : . :: .. :..: . : : . .: : .: . .. CCDS47 FMF-LSEEKLHYRSARTKELDALLGDL-HCEIRDQETL--LMYQLQCQVLARAAVLTRVL 470 480 490 500 510 520 1060 1070 1080 1090 1100 pF1KE1 ECIAVLDVLLCLANYSRGGDGPMCRPVILLPEDTPPFL--ELKGSRHPCITKTFFGDDFI . . ::::: ::. .: : . : :. .: : .....::: . . . :. CCDS47 DLASRLDVLLALASAAR--DYGYSR-----PRYSPQVLGVRIQNGRHPLM--ELCARTFV 530 540 550 560 570 1110 1120 1130 1140 1150 1160 pF1KE1 PNDILIGCEEEEQENGKAYCVLVTGPNMGGKSTLMRQAGLLAVMAQMGCYVPAEVCRLTP ::. : . :. ..:::: .::: ..:.::.. :: .: .:::: .. CCDS47 PNSTECGGD-------KGRVKVITGPNSSGKSIYLKQVGLITFMALVGSFVPAEEAEIGA 580 590 600 610 620 1170 1180 1190 1200 1210 1220 pF1KE1 IDRVFTRLGASDRIMSGESTFFVELSETASILMHATAHSLVLVDELGRGTATFDGTAIAN .: .:::. . . : : :::...:...:. . .:::.::::.::.:.:: : :: :. CCDS47 VDAIFTRIHSCESISLGLSTFMIDLNQVAKAVNNATAQSLVLIDEFGKGTNTVDGLALLA 630 640 650 660 670 680 1230 1240 1250 1260 1270 1280 pF1KE1 AVVKE-LAETIKCRTLF-STHYHSLVEDYSQNVAVRLGHMACMVENE-CEDPSQETITFL ::... ::. : .: .:.. ::: : . : .. .. : ::: .. ..:. CCDS47 AVLRHWLARGPTCPHIFVATNFLSLV----QLQLLPQGPLVQYLTMETCEDGND--LVFF 690 700 710 720 730 740 1290 1300 1310 1320 1330 1340 pF1KE1 YKFIKGACPKSYGFNAARLANLPEEVIQKGHRKAREFEKMNQSLRLFREVCLASERSTVD :. .:. :.. ..: :.::.... .: CCDS47 YQVCEGVAKASHASHTAAQAGLPDKLVARGKEVSDLIRSGKPIKPVKDLLKKNQMENCQT 750 760 770 780 790 800 1360 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 02:29:49 2016 done: Mon Nov 7 02:29:50 2016 Total Scan time: 5.180 Total Display time: 0.410 Function used was FASTA [36.3.4 Apr, 2011]