FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE1305, 1360 aa
1>>>pF1KE1305 1360 - 1360 aa - 1360 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 8.0855+/-0.00112; mu= 11.2483+/- 0.067
mean_var=162.9410+/-32.970, 0's: 0 Z-trim(108.9): 41 B-trim: 19 in 1/51
Lambda= 0.100475
statistics sampled from 10489 (10521) to 10489 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.661), E-opt: 0.2 (0.323), width: 16
Scan time: 5.180
The best scores are: opt bits E(32554)
CCDS1836.1 MSH6 gene_id:2956|Hs108|chr2 (1360) 9062 1326.8 0
CCDS62906.1 MSH6 gene_id:2956|Hs108|chr2 (1230) 7615 1117.0 0
CCDS62907.1 MSH6 gene_id:2956|Hs108|chr2 (1058) 7032 1032.5 0
CCDS34195.1 MSH3 gene_id:4437|Hs108|chr5 (1137) 601 100.3 3.3e-20
CCDS58709.1 MSH2 gene_id:4436|Hs108|chr2 ( 868) 590 98.6 8e-20
CCDS1834.1 MSH2 gene_id:4436|Hs108|chr2 ( 934) 590 98.6 8.5e-20
CCDS670.1 MSH4 gene_id:4438|Hs108|chr1 ( 936) 408 72.2 7.5e-12
CCDS4720.1 MSH5 gene_id:4439|Hs108|chr6 ( 834) 393 70.0 3.1e-11
>>CCDS1836.1 MSH6 gene_id:2956|Hs108|chr2 (1360 aa)
initn: 9062 init1: 9062 opt: 9062 Z-score: 7103.5 bits: 1326.8 E(32554): 0
Smith-Waterman score: 9062; 100.0% identity (100.0% similar) in 1360 aa overlap (1-1360:1-1360)
10 20 30 40 50 60
pF1KE1 MSRQSTLYSFFPKSPALSDANKASARASREGGRAAAAPGASPSPGGDAAWSEAGPGPRPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 MSRQSTLYSFFPKSPALSDANKASARASREGGRAAAAPGASPSPGGDAAWSEAGPGPRPL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE1 ARSASPPKAKNLNGGLRRSVAPAAPTSCDFSPGDLVWAKMEGYPWWPCLVYNHPFDGTFI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 ARSASPPKAKNLNGGLRRSVAPAAPTSCDFSPGDLVWAKMEGYPWWPCLVYNHPFDGTFI
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE1 REKGKSVRVHVQFFDDSPTRGWVSKRLLKPYTGSKSKEAQKGGHFYSAKPEILRAMQRAD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 REKGKSVRVHVQFFDDSPTRGWVSKRLLKPYTGSKSKEAQKGGHFYSAKPEILRAMQRAD
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE1 EALNKDKIKRLELAVCDEPSEPEEEEEMEVGTTYVTDKSEEDNEIESEEEVQPKTQGSRR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 EALNKDKIKRLELAVCDEPSEPEEEEEMEVGTTYVTDKSEEDNEIESEEEVQPKTQGSRR
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE1 SSRQIKKRRVISDSESDIGGSDVEFKPDTKEEGSSDEISSGVGDSESEGLNSPVKVARKR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 SSRQIKKRRVISDSESDIGGSDVEFKPDTKEEGSSDEISSGVGDSESEGLNSPVKVARKR
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE1 KRMVTGNGSLKRKSSRKETPSATKQATSISSETKNTLRAFSAPQNSESQAHVSGGGDDSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 KRMVTGNGSLKRKSSRKETPSATKQATSISSETKNTLRAFSAPQNSESQAHVSGGGDDSS
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE1 RPTVWYHETLEWLKEEKRRDEHRRRPDHPDFDASTLYVPEDFLNSCTPGMRKWWQIKSQN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 RPTVWYHETLEWLKEEKRRDEHRRRPDHPDFDASTLYVPEDFLNSCTPGMRKWWQIKSQN
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE1 FDLVICYKVGKFYELYHMDALIGVSELGLVFMKGNWAHSGFPEIAFGRYSDSLVQKGYKV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 FDLVICYKVGKFYELYHMDALIGVSELGLVFMKGNWAHSGFPEIAFGRYSDSLVQKGYKV
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE1 ARVEQTETPEMMEARCRKMAHISKYDRVVRREICRIITKGTQTYSVLEGDPSENYSKYLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 ARVEQTETPEMMEARCRKMAHISKYDRVVRREICRIITKGTQTYSVLEGDPSENYSKYLL
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE1 SLKEKEEDSSGHTRAYGVCFVDTSLGKFFIGQFSDDRHCSRFRTLVAHYPPVQVLFEKGN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 SLKEKEEDSSGHTRAYGVCFVDTSLGKFFIGQFSDDRHCSRFRTLVAHYPPVQVLFEKGN
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE1 LSKETKTILKSSLSCSLQEGLIPGSQFWDASKTLRTLLEEEYFREKLSDGIGVMLPQVLK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 LSKETKTILKSSLSCSLQEGLIPGSQFWDASKTLRTLLEEEYFREKLSDGIGVMLPQVLK
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE1 GMTSESDSIGLTPGEKSELALSALGGCVFYLKKCLIDQELLSMANFEEYIPLDSDTVSTT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 GMTSESDSIGLTPGEKSELALSALGGCVFYLKKCLIDQELLSMANFEEYIPLDSDTVSTT
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE1 RSGAIFTKAYQRMVLDAVTLNNLEIFLNGTNGSTEGTLLERVDTCHTPFGKRLLKQWLCA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 RSGAIFTKAYQRMVLDAVTLNNLEIFLNGTNGSTEGTLLERVDTCHTPFGKRLLKQWLCA
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE1 PLCNHYAINDRLDAIEDLMVVPDKISEVVELLKKLPDLERLLSKIHNVGSPLKSQNHPDS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 PLCNHYAINDRLDAIEDLMVVPDKISEVVELLKKLPDLERLLSKIHNVGSPLKSQNHPDS
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE1 RAIMYEETTYSKKKIIDFLSALEGFKVMCKIIGIMEEVADGFKSKILKQVISLQTKNPEG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 RAIMYEETTYSKKKIIDFLSALEGFKVMCKIIGIMEEVADGFKSKILKQVISLQTKNPEG
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE1 RFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQALADIRENEQSLLEYLEKQRN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 RFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQALADIRENEQSLLEYLEKQRN
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE1 RIGCRTIVYWGIGRNRYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKLANLIN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 RIGCRTIVYWGIGRNRYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKLANLIN
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE1 AEERRDVSLKDCMRRLFYNFDKNYKDWQSAVECIAVLDVLLCLANYSRGGDGPMCRPVIL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 AEERRDVSLKDCMRRLFYNFDKNYKDWQSAVECIAVLDVLLCLANYSRGGDGPMCRPVIL
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE1 LPEDTPPFLELKGSRHPCITKTFFGDDFIPNDILIGCEEEEQENGKAYCVLVTGPNMGGK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 LPEDTPPFLELKGSRHPCITKTFFGDDFIPNDILIGCEEEEQENGKAYCVLVTGPNMGGK
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KE1 STLMRQAGLLAVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFFVELSETASI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 STLMRQAGLLAVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFFVELSETASI
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KE1 LMHATAHSLVLVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHSLVEDYSQNV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 LMHATAHSLVLVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHSLVEDYSQNV
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KE1 AVRLGHMACMVENECEDPSQETITFLYKFIKGACPKSYGFNAARLANLPEEVIQKGHRKA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 AVRLGHMACMVENECEDPSQETITFLYKFIKGACPKSYGFNAARLANLPEEVIQKGHRKA
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360
pF1KE1 REFEKMNQSLRLFREVCLASERSTVDAEAVHKLLTLIKEL
::::::::::::::::::::::::::::::::::::::::
CCDS18 REFEKMNQSLRLFREVCLASERSTVDAEAVHKLLTLIKEL
1330 1340 1350 1360
>>CCDS62906.1 MSH6 gene_id:2956|Hs108|chr2 (1230 aa)
initn: 7615 init1: 7615 opt: 7615 Z-score: 5970.5 bits: 1117.0 E(32554): 0
Smith-Waterman score: 7874; 90.4% identity (90.4% similar) in 1360 aa overlap (1-1360:1-1230)
10 20 30 40 50 60
pF1KE1 MSRQSTLYSFFPKSPALSDANKASARASREGGRAAAAPGASPSPGGDAAWSEAGPGPRPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 MSRQSTLYSFFPKSPALSDANKASARASREGGRAAAAPGASPSPGGDAAWSEAGPGPRPL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE1 ARSASPPKAKNLNGGLRRSVAPAAPTSCDFSPGDLVWAKMEGYPWWPCLVYNHPFDGTFI
::::::::::::::::::::
CCDS62 ARSASPPKAKNLNGGLRRSV----------------------------------------
70 80
130 140 150 160 170 180
pF1KE1 REKGKSVRVHVQFFDDSPTRGWVSKRLLKPYTGSKSKEAQKGGHFYSAKPEILRAMQRAD
CCDS62 ------------------------------------------------------------
190 200 210 220 230 240
pF1KE1 EALNKDKIKRLELAVCDEPSEPEEEEEMEVGTTYVTDKSEEDNEIESEEEVQPKTQGSRR
::::::::::::::::::::::::::::::
CCDS62 ------------------------------GTTYVTDKSEEDNEIESEEEVQPKTQGSRR
90 100 110
250 260 270 280 290 300
pF1KE1 SSRQIKKRRVISDSESDIGGSDVEFKPDTKEEGSSDEISSGVGDSESEGLNSPVKVARKR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 SSRQIKKRRVISDSESDIGGSDVEFKPDTKEEGSSDEISSGVGDSESEGLNSPVKVARKR
120 130 140 150 160 170
310 320 330 340 350 360
pF1KE1 KRMVTGNGSLKRKSSRKETPSATKQATSISSETKNTLRAFSAPQNSESQAHVSGGGDDSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 KRMVTGNGSLKRKSSRKETPSATKQATSISSETKNTLRAFSAPQNSESQAHVSGGGDDSS
180 190 200 210 220 230
370 380 390 400 410 420
pF1KE1 RPTVWYHETLEWLKEEKRRDEHRRRPDHPDFDASTLYVPEDFLNSCTPGMRKWWQIKSQN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 RPTVWYHETLEWLKEEKRRDEHRRRPDHPDFDASTLYVPEDFLNSCTPGMRKWWQIKSQN
240 250 260 270 280 290
430 440 450 460 470 480
pF1KE1 FDLVICYKVGKFYELYHMDALIGVSELGLVFMKGNWAHSGFPEIAFGRYSDSLVQKGYKV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 FDLVICYKVGKFYELYHMDALIGVSELGLVFMKGNWAHSGFPEIAFGRYSDSLVQKGYKV
300 310 320 330 340 350
490 500 510 520 530 540
pF1KE1 ARVEQTETPEMMEARCRKMAHISKYDRVVRREICRIITKGTQTYSVLEGDPSENYSKYLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 ARVEQTETPEMMEARCRKMAHISKYDRVVRREICRIITKGTQTYSVLEGDPSENYSKYLL
360 370 380 390 400 410
550 560 570 580 590 600
pF1KE1 SLKEKEEDSSGHTRAYGVCFVDTSLGKFFIGQFSDDRHCSRFRTLVAHYPPVQVLFEKGN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 SLKEKEEDSSGHTRAYGVCFVDTSLGKFFIGQFSDDRHCSRFRTLVAHYPPVQVLFEKGN
420 430 440 450 460 470
610 620 630 640 650 660
pF1KE1 LSKETKTILKSSLSCSLQEGLIPGSQFWDASKTLRTLLEEEYFREKLSDGIGVMLPQVLK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 LSKETKTILKSSLSCSLQEGLIPGSQFWDASKTLRTLLEEEYFREKLSDGIGVMLPQVLK
480 490 500 510 520 530
670 680 690 700 710 720
pF1KE1 GMTSESDSIGLTPGEKSELALSALGGCVFYLKKCLIDQELLSMANFEEYIPLDSDTVSTT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 GMTSESDSIGLTPGEKSELALSALGGCVFYLKKCLIDQELLSMANFEEYIPLDSDTVSTT
540 550 560 570 580 590
730 740 750 760 770 780
pF1KE1 RSGAIFTKAYQRMVLDAVTLNNLEIFLNGTNGSTEGTLLERVDTCHTPFGKRLLKQWLCA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 RSGAIFTKAYQRMVLDAVTLNNLEIFLNGTNGSTEGTLLERVDTCHTPFGKRLLKQWLCA
600 610 620 630 640 650
790 800 810 820 830 840
pF1KE1 PLCNHYAINDRLDAIEDLMVVPDKISEVVELLKKLPDLERLLSKIHNVGSPLKSQNHPDS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 PLCNHYAINDRLDAIEDLMVVPDKISEVVELLKKLPDLERLLSKIHNVGSPLKSQNHPDS
660 670 680 690 700 710
850 860 870 880 890 900
pF1KE1 RAIMYEETTYSKKKIIDFLSALEGFKVMCKIIGIMEEVADGFKSKILKQVISLQTKNPEG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 RAIMYEETTYSKKKIIDFLSALEGFKVMCKIIGIMEEVADGFKSKILKQVISLQTKNPEG
720 730 740 750 760 770
910 920 930 940 950 960
pF1KE1 RFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQALADIRENEQSLLEYLEKQRN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 RFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQALADIRENEQSLLEYLEKQRN
780 790 800 810 820 830
970 980 990 1000 1010 1020
pF1KE1 RIGCRTIVYWGIGRNRYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKLANLIN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 RIGCRTIVYWGIGRNRYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKLANLIN
840 850 860 870 880 890
1030 1040 1050 1060 1070 1080
pF1KE1 AEERRDVSLKDCMRRLFYNFDKNYKDWQSAVECIAVLDVLLCLANYSRGGDGPMCRPVIL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 AEERRDVSLKDCMRRLFYNFDKNYKDWQSAVECIAVLDVLLCLANYSRGGDGPMCRPVIL
900 910 920 930 940 950
1090 1100 1110 1120 1130 1140
pF1KE1 LPEDTPPFLELKGSRHPCITKTFFGDDFIPNDILIGCEEEEQENGKAYCVLVTGPNMGGK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 LPEDTPPFLELKGSRHPCITKTFFGDDFIPNDILIGCEEEEQENGKAYCVLVTGPNMGGK
960 970 980 990 1000 1010
1150 1160 1170 1180 1190 1200
pF1KE1 STLMRQAGLLAVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFFVELSETASI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 STLMRQAGLLAVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFFVELSETASI
1020 1030 1040 1050 1060 1070
1210 1220 1230 1240 1250 1260
pF1KE1 LMHATAHSLVLVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHSLVEDYSQNV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 LMHATAHSLVLVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHSLVEDYSQNV
1080 1090 1100 1110 1120 1130
1270 1280 1290 1300 1310 1320
pF1KE1 AVRLGHMACMVENECEDPSQETITFLYKFIKGACPKSYGFNAARLANLPEEVIQKGHRKA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 AVRLGHMACMVENECEDPSQETITFLYKFIKGACPKSYGFNAARLANLPEEVIQKGHRKA
1140 1150 1160 1170 1180 1190
1330 1340 1350 1360
pF1KE1 REFEKMNQSLRLFREVCLASERSTVDAEAVHKLLTLIKEL
::::::::::::::::::::::::::::::::::::::::
CCDS62 REFEKMNQSLRLFREVCLASERSTVDAEAVHKLLTLIKEL
1200 1210 1220 1230
>>CCDS62907.1 MSH6 gene_id:2956|Hs108|chr2 (1058 aa)
initn: 7032 init1: 7032 opt: 7032 Z-score: 5514.8 bits: 1032.5 E(32554): 0
Smith-Waterman score: 7032; 100.0% identity (100.0% similar) in 1058 aa overlap (303-1360:1-1058)
280 290 300 310 320 330
pF1KE1 GSSDEISSGVGDSESEGLNSPVKVARKRKRMVTGNGSLKRKSSRKETPSATKQATSISSE
::::::::::::::::::::::::::::::
CCDS62 MVTGNGSLKRKSSRKETPSATKQATSISSE
10 20 30
340 350 360 370 380 390
pF1KE1 TKNTLRAFSAPQNSESQAHVSGGGDDSSRPTVWYHETLEWLKEEKRRDEHRRRPDHPDFD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 TKNTLRAFSAPQNSESQAHVSGGGDDSSRPTVWYHETLEWLKEEKRRDEHRRRPDHPDFD
40 50 60 70 80 90
400 410 420 430 440 450
pF1KE1 ASTLYVPEDFLNSCTPGMRKWWQIKSQNFDLVICYKVGKFYELYHMDALIGVSELGLVFM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 ASTLYVPEDFLNSCTPGMRKWWQIKSQNFDLVICYKVGKFYELYHMDALIGVSELGLVFM
100 110 120 130 140 150
460 470 480 490 500 510
pF1KE1 KGNWAHSGFPEIAFGRYSDSLVQKGYKVARVEQTETPEMMEARCRKMAHISKYDRVVRRE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 KGNWAHSGFPEIAFGRYSDSLVQKGYKVARVEQTETPEMMEARCRKMAHISKYDRVVRRE
160 170 180 190 200 210
520 530 540 550 560 570
pF1KE1 ICRIITKGTQTYSVLEGDPSENYSKYLLSLKEKEEDSSGHTRAYGVCFVDTSLGKFFIGQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 ICRIITKGTQTYSVLEGDPSENYSKYLLSLKEKEEDSSGHTRAYGVCFVDTSLGKFFIGQ
220 230 240 250 260 270
580 590 600 610 620 630
pF1KE1 FSDDRHCSRFRTLVAHYPPVQVLFEKGNLSKETKTILKSSLSCSLQEGLIPGSQFWDASK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 FSDDRHCSRFRTLVAHYPPVQVLFEKGNLSKETKTILKSSLSCSLQEGLIPGSQFWDASK
280 290 300 310 320 330
640 650 660 670 680 690
pF1KE1 TLRTLLEEEYFREKLSDGIGVMLPQVLKGMTSESDSIGLTPGEKSELALSALGGCVFYLK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 TLRTLLEEEYFREKLSDGIGVMLPQVLKGMTSESDSIGLTPGEKSELALSALGGCVFYLK
340 350 360 370 380 390
700 710 720 730 740 750
pF1KE1 KCLIDQELLSMANFEEYIPLDSDTVSTTRSGAIFTKAYQRMVLDAVTLNNLEIFLNGTNG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 KCLIDQELLSMANFEEYIPLDSDTVSTTRSGAIFTKAYQRMVLDAVTLNNLEIFLNGTNG
400 410 420 430 440 450
760 770 780 790 800 810
pF1KE1 STEGTLLERVDTCHTPFGKRLLKQWLCAPLCNHYAINDRLDAIEDLMVVPDKISEVVELL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 STEGTLLERVDTCHTPFGKRLLKQWLCAPLCNHYAINDRLDAIEDLMVVPDKISEVVELL
460 470 480 490 500 510
820 830 840 850 860 870
pF1KE1 KKLPDLERLLSKIHNVGSPLKSQNHPDSRAIMYEETTYSKKKIIDFLSALEGFKVMCKII
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 KKLPDLERLLSKIHNVGSPLKSQNHPDSRAIMYEETTYSKKKIIDFLSALEGFKVMCKII
520 530 540 550 560 570
880 890 900 910 920 930
pF1KE1 GIMEEVADGFKSKILKQVISLQTKNPEGRFPDLTVELNRWDTAFDHEKARKTGLITPKAG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 GIMEEVADGFKSKILKQVISLQTKNPEGRFPDLTVELNRWDTAFDHEKARKTGLITPKAG
580 590 600 610 620 630
940 950 960 970 980 990
pF1KE1 FDSDYDQALADIRENEQSLLEYLEKQRNRIGCRTIVYWGIGRNRYQLEIPENFTTRNLPE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 FDSDYDQALADIRENEQSLLEYLEKQRNRIGCRTIVYWGIGRNRYQLEIPENFTTRNLPE
640 650 660 670 680 690
1000 1010 1020 1030 1040 1050
pF1KE1 EYELKSTKKGCKRYWTKTIEKKLANLINAEERRDVSLKDCMRRLFYNFDKNYKDWQSAVE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 EYELKSTKKGCKRYWTKTIEKKLANLINAEERRDVSLKDCMRRLFYNFDKNYKDWQSAVE
700 710 720 730 740 750
1060 1070 1080 1090 1100 1110
pF1KE1 CIAVLDVLLCLANYSRGGDGPMCRPVILLPEDTPPFLELKGSRHPCITKTFFGDDFIPND
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 CIAVLDVLLCLANYSRGGDGPMCRPVILLPEDTPPFLELKGSRHPCITKTFFGDDFIPND
760 770 780 790 800 810
1120 1130 1140 1150 1160 1170
pF1KE1 ILIGCEEEEQENGKAYCVLVTGPNMGGKSTLMRQAGLLAVMAQMGCYVPAEVCRLTPIDR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 ILIGCEEEEQENGKAYCVLVTGPNMGGKSTLMRQAGLLAVMAQMGCYVPAEVCRLTPIDR
820 830 840 850 860 870
1180 1190 1200 1210 1220 1230
pF1KE1 VFTRLGASDRIMSGESTFFVELSETASILMHATAHSLVLVDELGRGTATFDGTAIANAVV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 VFTRLGASDRIMSGESTFFVELSETASILMHATAHSLVLVDELGRGTATFDGTAIANAVV
880 890 900 910 920 930
1240 1250 1260 1270 1280 1290
pF1KE1 KELAETIKCRTLFSTHYHSLVEDYSQNVAVRLGHMACMVENECEDPSQETITFLYKFIKG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 KELAETIKCRTLFSTHYHSLVEDYSQNVAVRLGHMACMVENECEDPSQETITFLYKFIKG
940 950 960 970 980 990
1300 1310 1320 1330 1340 1350
pF1KE1 ACPKSYGFNAARLANLPEEVIQKGHRKAREFEKMNQSLRLFREVCLASERSTVDAEAVHK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 ACPKSYGFNAARLANLPEEVIQKGHRKAREFEKMNQSLRLFREVCLASERSTVDAEAVHK
1000 1010 1020 1030 1040 1050
1360
pF1KE1 LLTLIKEL
::::::::
CCDS62 LLTLIKEL
>>CCDS34195.1 MSH3 gene_id:4437|Hs108|chr5 (1137 aa)
initn: 816 init1: 427 opt: 601 Z-score: 476.3 bits: 100.3 E(32554): 3.3e-20
Smith-Waterman score: 1053; 26.9% identity (58.9% similar) in 1121 aa overlap (248-1331:85-1101)
220 230 240 250 260 270
pF1KE1 KSEEDNEIESEEEVQPKTQGSRRSSRQIKKRRVISDSESDIGGSDVEFKPDTKEEGSSDE
:: :.: : . : ..::.::
CCDS34 AAAAAAAAPPAPPAPAFPPQLPPHIATEIDRRKKRPLEND-GPVKKKVKKVQQKEGGSDL
60 70 80 90 100 110
280 290 300 310 320 330
pF1KE1 ISSGVGDSESEGLNSPVKVARKRKRMVTGNGSLKRKSSRKETPSATKQATSISSETKNTL
:: .:: : : : :. . . .::. . :.. :. :.. .
CCDS34 GMSG--NSE------PKKCLRTRN-VSKSLEKLKEFCCDSALPQSRVQTESLQERFAVLP
120 130 140 150 160
340 350 360 370 380 390
pF1KE1 RAFSAPQNSESQAHVSGGGDDSSRPTVWYHETLEWLKEEKRRDEHRRRPDHPDFDASTLY
. . . : .:. . ...::.: :: :.. . .: ... ..
CCDS34 KCTDFDDISLLHAKNAVSSEDSKRQINQKDTTLFDLSQFGSSNT-----SHENLQKTASK
170 180 190 200 210
400 410 420 430 440 450
pF1KE1 VPEDFLNSC-TPGMRKWWQIKSQNFDLVICYKVGKFYELYHMDALIGVSELGLV-FMKGN
. .: :: .. ..:.:. : :.: . : :... :: :.. ::.. . :
CCDS34 SANKRSKSIYTPLELQYIEMKQQHKDAVLCVECGYKYRFFGEDAEIAARELNIYCHLDHN
220 230 240 250 260 270
460 470 480 490 500
pF1KE1 WAHSGFPEIAFGRYSDSLVQKGYKVARVEQTETPEMM---EARC----RKMAHISKYDRV
. ...: . . :: :::::. :.:::: . . : ::.. . . .
CCDS34 FMTASIPTHRLFVHVRRLVAKGYKVGVVKQTETAALKAIGDNRSSLFSRKLTALYTKSTL
280 290 300 310 320 330
510 520 530 540 550 560
pF1KE1 VRREICRIITKGTQTYSVLEGDPSENYSKYLLSLKEKEEDSSGHTRA---YGVCFVDTSL
. ... .: : .. .: : ... ..::: ..:..:. . .. :. :. .
CCDS34 IGEDVNPLI-KLDDAVNVDEI-MTDTSTSYLLCISENKENVRDKKKGNIFIGIVGVQPAT
340 350 360 370 380 390
570 580 590 600 610 620
pF1KE1 GKFFIGQFSDDRHCSRFRTLVAHYPPVQVLFEKGNLSKETKTILKSSLSCSLQEGLIP--
:. . .:.:. :...: .. ::..:. .. ::..:..... . : :.:. :
CCDS34 GEVVFDSFQDSASRSELETRMSSLQPVELLLPSA-LSEQTEALIHRATSVSVQDDRIRVE
400 410 420 430 440 450
630 640 650 660 670 680
pF1KE1 --GSQFWDASKTLRTLLEEEYFREKLSDGIGVMLPQVLKGMTSESDSIGLTPGEKSELAL
. ... :...... : : : : . . :...:. ..: :: ..
CCDS34 RMDNIYFEYSHAFQAVTE---FYAK--DTVDIKGSQIISGI------VNL---EKP--VI
460 470 480 490 500
690 700 710 720 730 740
pF1KE1 SALGGCVFYLKKCLIDQELLSMANFEEYIPLDSDTVSTTRSGAIFTKAYQRMVLDAVTLN
.:.. . :::. ... : . ::.. ... .. :.....::
CCDS34 CSLAAIIKYLKEFNLEKMLSKPENFKQ-----------------LSSKMEFMTINGTTLR
510 520 530 540
750 760 770 780 790 800
pF1KE1 NLEIFLNGTNGSTEGTLLERVDTCHTPFGKRLLKQWLCAPLCNHYAINDRLDAIEDLMVV
::::. : :. .:.:.:: .: .: ::.: ::.:. :: . :: ::::. ...
CCDS34 NLEILQNQTDMKTKGSLLWVLDHTKTSFGRRKLKKWVTQPLLKLREINARLDAVSEVLHS
550 560 570 580 590 600
810 820 830 840 850 860
pF1KE1 PDKI-SEVVELLKKLPDLERLLSKIHNVGSPLKSQNHPDSRAIMYEETTYSKKKIIDFLS
... ... . :.::::.:: : .:.. . ..:. .. .: : :. .: .
CCDS34 ESSVFGQIENHLRKLPDIERGLCSIYH--KKCSTQEF-----FLIVKTLYHLKS--EFQA
610 620 630 640 650
870 880 890 900 910 920
pF1KE1 ALEGFKVMCKIIGIMEEVADGFKSKILKQVISLQTKNPEGRFPDLTVELNRWDTAFDHEK
:. : . ..: .:. :: :. .:.: .... .. :.
CCDS34 -------------IIPAVNSHIQSDLLRTVI-LE-------IPELLSPVEHYLKILN-EQ
660 670 680 690
930 940 950 960 970
pF1KE1 ARKTGLITPKAGFDSDYDQALADIRENE-QSLLE----YLEKQRNRIGCRTIVYWGIGRN
: :.: : : . : : :..: :.... .:.. :. . . : .. .
CCDS34 AAKVGDKTEL--FKDLSDFPLIKKRKDEIQGVIDEIRMHLQEIRKILKNPSAQYVTVSGQ
700 710 720 730 740 750
980 990 1000 1010 1020 1030
pF1KE1 RYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKLANLINAEERRDVSLKDCMRR
....:: .: .. .: .. .. :. .:. . : . : . .. :. . :: .
CCDS34 EFMIEI-KNSAVSCIPTDWVKVGSTKAVSRFHSPFI---VENYRHLNQLREQLVLDCSAE
760 770 780 790 800
1040 1050 1060 1070 1080 1090
pF1KE1 ---LFYNFDKNYKDWQSAVECIAVLDVLLCLANYSRGGDGPMCRPVILLPEDTPPFLELK
.. .:...:.. .::. .:..: .. ::. .. :: .:::.. :. . .:
CCDS34 WLDFLEKFSEHYHSLCKAVHHLATVDCIFSLAKVAKQGD--YCRPTV--QEERK--IVIK
810 820 830 840 850 860
1100 1110 1120 1130 1140 1150
pF1KE1 GSRHPCITKTFFG--DDFIPNDILIGCEEEEQENGKAYCVLVTGPNMGGKSTLMRQAGLL
..::: : ...: :...::. .. :. :. ...:::::::::. ..:..:.
CCDS34 NGRHPVID-VLLGEQDQYVPNNTDLS-EDSER------VMIITGPNMGGKSSYIKQVALI
870 880 890 900 910
1160 1170 1180 1190 1200 1210
pF1KE1 AVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFFVELSETASILMHATAHSLV
..:::.: ::::: . .: .:::.::.: :..:.:::. ::..:: :. .::..:::
CCDS34 TIMAQIGSYVPAEEATIGIVDGIFTRMGAADNIYKGQSTFMEELTDTAEIIRKATSQSLV
920 930 940 950 960 970
1220 1230 1240 1250 1260
pF1KE1 LVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHSLVE---DYSQNVAVRLGHM
..:::::::.: :: ::: :... . . .: ::: ::: . : .::..:. ::
CCDS34 ILDELGRGTSTHDGIAIAYATLEYFIRDVKSLTLFVTHYPPVCELEKNYSHQVGNY--HM
980 990 1000 1010 1020 1030
1270 1280 1290 1300 1310 1320
pF1KE1 ACMV-ENECE-DPSQ-----ETITFLYKFIKGACPKSYGFNAARLANLPEEVIQKGHRKA
. .: :.: . ::. . .::::.. .: .:::.:.:.::..: :...:. .:.
CCDS34 GFLVSEDESKLDPGAAEQVPDFVTFLYQITRGIAARSYGLNVAKLADVPGEILKKAAHKS
1040 1050 1060 1070 1080 1090
1330 1340 1350 1360
pF1KE1 REFEKMNQSLRLFREVCLASERSTVDAEAVHKLLTLIKEL
.:.: . .. :
CCDS34 KELEGLINTKRKRLKYFAKLWTMHNAQDLQKWTEEFNMEETQTSLLH
1100 1110 1120 1130
>>CCDS58709.1 MSH2 gene_id:4436|Hs108|chr2 (868 aa)
initn: 678 init1: 428 opt: 590 Z-score: 469.3 bits: 98.6 E(32554): 8e-20
Smith-Waterman score: 833; 27.8% identity (57.7% similar) in 823 aa overlap (521-1325:63-787)
500 510 520 530 540 550
pF1KE1 MMEARCRKMAHISKYDRVVRREICRIITKGTQTYSVLEGDPSENYSKYLLSLKEKEEDSS
.: ..: :. . . : ....: . :..
CCDS58 RVEVYKNRAGNKASKENDWYLAYKASPGNLSQFEDILFGNNDMSASIGVVGVKMSAVDGQ
40 50 60 70 80 90
560 570 580 590 600 610
pF1KE1 GHTRAYGVCFVDTSLGKFFIGQFSDDRHCSRFRTLVAHYPPVQVLFEKGNLSKETKTILK
: :: .::. :. . .: :. . : ...:. . : . .. :. . .
CCDS58 ---RQVGVGYVDSIQRKLGLCEFPDNDQFSNLEALLIQIGPKECVLPGGETAGDM-----
100 110 120 130 140
620 630 640 650 660 670
pF1KE1 SSLSCSLQEGLIPGSQFWDASKTLRTLLEEEYFREKLSDGIGVMLPQVLKGMTSESDSIG
..: .:.: : .. :. . . . .. : ..::: .:. . .
CCDS58 GKLRQIIQRGGILITERKKADFSTKDIYQD--------------LNRLLKGKKGEQMNSA
150 160 170 180 190
680 690 700 710 720
pF1KE1 LTPGEKSELALSALGGCVFYLKKCLIDQELLSM-ANFEEYIPLDSDTVSTTRSGAIFTKA
. : ....:.:.:.. . .: :::: .:: .. : :.
CCDS58 VLPEMENQVAVSSLSAVIKFL-------ELLSDDSNFGQFELTTFD----------FS--
200 210 220 230
730 740 750 760 770 780
pF1KE1 YQRMVLDAVTLNNLEIFLNGTNGSTEGT--LLERVDTCHTPFGKRLLKQWLCAPLCNHYA
: : :: ... :..: .:. .: :. : .. :.:: :.::..::. :: ..
CCDS58 -QYMKLDIAAVRALNLF-QGSVEDTTGSQSLAALLNKCKTPQGQRLVNQWIKQPLMDKNR
240 250 260 270 280
790 800 810 820 830
pF1KE1 INDRLDAIEDLMVVPDKISEVVE--LLKKLPDLERLLSKIHNVGSPLKS--------QNH
:..::. .: . : .. .... ::...:::.:: .:.. .. :.. ..
CCDS58 IEERLNLVEAF-VEDAELRQTLQEDLLRRFPDLNRLAKKFQRQAANLQDCYRLYQGINQL
290 300 310 320 330 340
840 850 860 870 880 890
pF1KE1 PDS-RAIMYEETTYSKKKIIDFLSALEGFKV-MCKIIGIMEEVADGFKSKILKQVISLQT
:. .:. .: ..: . :.. : .. . :. ..: . : . :: . .
CCDS58 PNVIQALEKHEGKHQKLLLAVFVTPLTDLRSDFSKFQEMIETTLD------MDQVENHEF
350 360 370 380 390 400
900 910 920 930 940 950
pF1KE1 KNPEGRFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQALADIRENEQSLLEYL
. :.:. :: . : :: .. ::. :. : : . .:. . .. . :
CCDS58 LVKPSFDPNLS-ELR--EIMNDLEKKMQSTLIS--AARDLGLDPG-KQIKLDSSAQFGYY
410 420 430 440 450
960 970 980 990 1000 1010
pF1KE1 EKQRNRIGCRTIVYWGIGRNRYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKL
:. :. . :: .::.: .. :. : . :. :.
CCDS58 F----RVTCKE---EKVLRNN------KNFSTVDIQ-----KNGVKFTNSKLTSLNEEYT
460 470 480 490
1020 1030 1040 1050 1060 1070
pF1KE1 ANLINAEERRDVSLKDCMRRLFYNFDKNY-KDWQSAVECIAVLDVLLCLANYSRGGDGPM
: . :: .:. .:. . :....: . :. . .: ::... .:. : :. :.
CCDS58 KNKTEYEEAQDAIVKEIV-----NISSGYVEPMQTLNDVLAQLDAVVSFAHVSNGAPVPY
500 510 520 530 540 550
1080 1090 1100 1110 1120 1130
pF1KE1 CRPVILLPEDTPPFLELKGSRHPCITKTFFGDD--FIPNDILIGCEEEEQENGKAYCVLV
::.:: : . ::.::: :. :. :::::. . :. : . ..
CCDS58 VRPAIL--EKGQGRIILKASRHACVE---VQDEIAFIPNDVYF-------EKDKQMFHII
560 570 580 590 600
1140 1150 1160 1170 1180 1190
pF1KE1 TGPNMGGKSTLMRQAGLLAVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFFV
:::::::::: .::.:....:::.::.:: : ... .: ...:.::.: ..: :::..
CCDS58 TGPNMGGKSTYIRQTGVIVLMAQIGCFVPCESAEVSIVDCILARVGAGDSQLKGVSTFMA
610 620 630 640 650 660
1200 1210 1220 1230 1240 1250
pF1KE1 ELSETASILMHATAHSLVLVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHSL
:. :::::: :: ::...:::::::.:.:: ..: :. . .: : .:.::.: :
CCDS58 EMLETASILRSATKDSLIIIDELGRGTSTYDGFGLAWAISEYIATKIGAFCMFATHFHEL
670 680 690 700 710 720
1260 1270 1280 1290 1300 1310
pF1KE1 VEDYSQNVAVRLGHMACMVENECEDPSQETITFLYKFIKGACPKSYGFNAARLANLPEEV
. .: .: :.. .. ..::.:.::. ::.: .:.:...:.:::.:..:
CCDS58 TALANQIPTVNNLHVTALT-------TEETLTMLYQVKKGVCDQSFGIHVAELANFPKHV
730 740 750 760 770
1320 1330 1340 1350 1360
pF1KE1 IQKGHRKAREFEKMNQSLRLFREVCLASERSTVDAEAVHKLLTLIKEL
:. ...:: :.:.
CCDS58 IECAKQKALELEEFQYIGESQGYDIMEPAAKKCYLEREQGEKIIQEFLSKVKQMPFTEMS
780 790 800 810 820 830
>>CCDS1834.1 MSH2 gene_id:4436|Hs108|chr2 (934 aa)
initn: 678 init1: 428 opt: 590 Z-score: 468.9 bits: 98.6 E(32554): 8.5e-20
Smith-Waterman score: 835; 26.8% identity (56.9% similar) in 921 aa overlap (430-1325:40-853)
400 410 420 430 440 450
pF1KE1 EDFLNSCTPGMRKWWQIKSQNFDLVICYKVGKFYELYHMDALIGVSEL----GLVFMKGN
: :: . :::... :. :.. . :
CCDS18 QLESAAEVGFVRFFQGMPEKPTTTVRLFDRGDFYTAHGEDALLAAREVFKTQGVIKYMGP
10 20 30 40 50 60
460 470 480 490 500 510
pF1KE1 WAHSGFPEIAFGRYS-DSLVQKGYKVARVEQTETPEMMEARCRKMAHISKYDRVVRREIC
. ... ....... .:.: : ..: ..:. . : . :: . .
CCDS18 AGAKNLQSVVLSKMNFESFV-KDLLLVRQYRVEV-----YKNRAGNKASKENDWY---LA
70 80 90 100 110 120
520 530 540 550 560 570
pF1KE1 RIITKG--TQTYSVLEGDPSENYSKYLLSLKEKEEDSSGHTRAYGVCFVDTSLGKFFIGQ
. : .: ..: :. . . : ....: . :.. : :: .::. :. . .
CCDS18 YKASPGNLSQFEDILFGNNDMSASIGVVGVKMSAVDGQ---RQVGVGYVDSIQRKLGLCE
130 140 150 160 170
580 590 600 610 620 630
pF1KE1 FSDDRHCSRFRTLVAHYPPVQVLFEKGNLSKETKTILKSSLSCSLQEGLIPGSQFWDASK
: :. . : ...:. . : . .. :. . . ..: .:.: : .. :.
CCDS18 FPDNDQFSNLEALLIQIGPKECVLPGGETAGDM-----GKLRQIIQRGGILITERKKADF
180 190 200 210 220 230
640 650 660 670 680 690
pF1KE1 TLRTLLEEEYFREKLSDGIGVMLPQVLKGMTSESDSIGLTPGEKSELALSALGGCVFYLK
. . . .. : ..::: .:. . .. : ....:.:.:.. . .:
CCDS18 STKDIYQD--------------LNRLLKGKKGEQMNSAVLPEMENQVAVSSLSAVIKFL-
240 250 260 270
700 710 720 730 740 750
pF1KE1 KCLIDQELLSM-ANFEEYIPLDSDTVSTTRSGAIFTKAYQRMVLDAVTLNNLEIFLNGTN
:::: .:: .. : :. : : :: ... :..: .:.
CCDS18 ------ELLSDDSNFGQFELTTFD----------FS---QYMKLDIAAVRALNLF-QGSV
280 290 300 310
760 770 780 790 800
pF1KE1 GSTEGT--LLERVDTCHTPFGKRLLKQWLCAPLCNHYAINDRLDAIEDLMVVPDKISEVV
.: :. : .. :.:: :.::..::. :: .. :..::. .: . : .. ...
CCDS18 EDTTGSQSLAALLNKCKTPQGQRLVNQWIKQPLMDKNRIEERLNLVEAF-VEDAELRQTL
320 330 340 350 360 370
810 820 830 840 850
pF1KE1 E--LLKKLPDLERLLSKIHNVGSPLKS--------QNHPDS-RAIMYEETTYSKKKIIDF
. ::...:::.:: .:.. .. :.. .. :. .:. .: ..: . :
CCDS18 QEDLLRRFPDLNRLAKKFQRQAANLQDCYRLYQGINQLPNVIQALEKHEGKHQKLLLAVF
380 390 400 410 420 430
860 870 880 890 900 910
pF1KE1 LSALEGFKV-MCKIIGIMEEVADGFKSKILKQVISLQTKNPEGRFPDLTVELNRWDTAFD
.. : .. . :. ..: . : . :: . . . :.:. :: . :
CCDS18 VTPLTDLRSDFSKFQEMIETTLD------MDQVENHEFLVKPSFDPNLS-ELR--EIMND
440 450 460 470 480
920 930 940 950 960 970
pF1KE1 HEKARKTGLITPKAGFDSDYDQALADIRENEQSLLEYLEKQRNRIGCRTIVYWGIGRNRY
:: .. ::. :. : : . .:. . .. . : :. :. . ::
CCDS18 LEKKMQSTLIS--AARDLGLDPG-KQIKLDSSAQFGYYF----RVTCKE---EKVLRNN-
490 500 510 520 530
980 990 1000 1010 1020 1030
pF1KE1 QLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKLANLINAEERRDVSLKDCMRRLF
.::.: .. :. : . :. :. : . :: .:. .:. .
CCDS18 -----KNFSTVDIQ-----KNGVKFTNSKLTSLNEEYTKNKTEYEEAQDAIVKE-----I
540 550 560 570 580
1040 1050 1060 1070 1080 1090
pF1KE1 YNFDKNY-KDWQSAVECIAVLDVLLCLANYSRGGDGPMCRPVILLPEDTPPFLELKGSRH
:....: . :. . .: ::... .:. : :. :. ::.:: : . ::.:::
CCDS18 VNISSGYVEPMQTLNDVLAQLDAVVSFAHVSNGAPVPYVRPAIL--EKGQGRIILKASRH
590 600 610 620 630
1100 1110 1120 1130 1140 1150
pF1KE1 PCITKTFFGDD--FIPNDILIGCEEEEQENGKAYCVLVTGPNMGGKSTLMRQAGLLAVMA
:. :. :::::. . :. : . ..:::::::::: .::.:....::
CCDS18 ACVE---VQDEIAFIPNDVYF-------EKDKQMFHIITGPNMGGKSTYIRQTGVIVLMA
640 650 660 670 680
1160 1170 1180 1190 1200 1210
pF1KE1 QMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFFVELSETASILMHATAHSLVLVDE
:.::.:: : ... .: ...:.::.: ..: :::..:. :::::: :: ::...::
CCDS18 QIGCFVPCESAEVSIVDCILARVGAGDSQLKGVSTFMAEMLETASILRSATKDSLIIIDE
690 700 710 720 730 740
1220 1230 1240 1250 1260 1270
pF1KE1 LGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHSLVEDYSQNVAVRLGHMACMVENE
:::::.:.:: ..: :. . .: : .:.::.: :. .: .: :.. ..
CCDS18 LGRGTSTYDGFGLAWAISEYIATKIGAFCMFATHFHELTALANQIPTVNNLHVTALT---
750 760 770 780 790 800
1280 1290 1300 1310 1320 1330
pF1KE1 CEDPSQETITFLYKFIKGACPKSYGFNAARLANLPEEVIQKGHRKAREFEKMNQSLRLFR
..::.:.::. ::.: .:.:...:.:::.:..::. ...:: :.:.
CCDS18 ----TEETLTMLYQVKKGVCDQSFGIHVAELANFPKHVIECAKQKALELEEFQYIGESQG
810 820 830 840 850 860
1340 1350 1360
pF1KE1 EVCLASERSTVDAEAVHKLLTLIKEL
CCDS18 YDIMEPAAKKCYLEREQGEKIIQEFLSKVKQMPFTEMSEENITIKLKQLKAEVIAKNNSF
870 880 890 900 910 920
>>CCDS670.1 MSH4 gene_id:4438|Hs108|chr1 (936 aa)
initn: 481 init1: 309 opt: 408 Z-score: 326.3 bits: 72.2 E(32554): 7.5e-12
Smith-Waterman score: 544; 25.9% identity (56.3% similar) in 679 aa overlap (700-1355:276-893)
670 680 690 700 710 720
pF1KE1 GLTPGEKSELALSALGGCVFYLKKCLIDQELLSMANFEEYIPLDSDTVSTTRSGAI-FTK
: ..: . .:. . ...: . .: : :
CCDS67 NETKGLEYIEQLCIAEFSTVLMEVQSKYYCLAAVAALLKYVEFIQNSVYAPKSLKICFQG
250 260 270 280 290 300
730 740 750 760 770 780
pF1KE1 AYQRMVLDAVTLNNLEIFLNGTNGSTEGTLLERVDTCHTPFGKRLLKQWLCAPLCNHYAI
. : ..:. . .:::...:. . .. ::. .. .:: :.: :.. . :: . .:
CCDS67 SEQTAMIDSSSAQNLELLINNQDYRNNHTLFGVLNYTKTPGGSRRLRSNILEPLVDIETI
310 320 330 340 350 360
790 800 810 820 830 840
pF1KE1 NDRLDAIEDLMVVPDKISEVVELLKKLPDLERLLSKIHNVGSPLKSQNHPDSRA--IMYE
: ::: ...:. . . . ..... : :.::: . .. . . : .:. ..:
CCDS67 NMRLDCVQELLQDEELFFGLQSVISRFLDTEQLLSVLVQIPKQ-DTVNAAESKITNLIYL
370 380 390 400 410 420
850 860 870 880 890 900
pF1KE1 ETTYSKKKIIDFLS-ALEGFK--VMCKIIGIMEEVADGFKSKILKQVISLQTKNPEG---
. : ...: :. :... . .. : .:. :. . .: ::. ... .:
CCDS67 KHTL---ELVDPLKIAMKNCNTPLLRAYYGSLEDKRFGIILEKIKTVINDDARYMKGCLN
430 440 450 460 470 480
910 920 930 940 950
pF1KE1 -RFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQALA-DIRENEQSLLEYLEKQ
: . . . .: . : .. ::. :. . . .: . .: .. ..
CCDS67 MRTQKCYAVRSNINEFLDIARRTYTEIVDDIAGMISQLGEKYSLPLRTSFSSARGFFIQM
490 500 510 520 530 540
960 970 980 990 1000 1010
pF1KE1 RNRIGCRTIVYWGIGRNRYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKLANL
. : . .: . .:: :. .: .: . .:. :.:
CCDS67 TT--DC--------------IALPSD----QLPSEF-IKISKVKNSYSFTS------ADL
550 560 570
1020 1030 1040 1050 1060 1070
pF1KE1 INAEERRDVSLKDCMRRLFYNFDKNYKDWQSAVEC-------IAVLDVLLCLANYSRGGD
:. .:: . ::.. .. .. : .. ..: ...::.:: .:. .:
CCDS67 IKMNERCQESLREIYHMTYMIVCKLLSEIYEHIHCLYKLSDTVSMLDMLLSFAHACTLSD
580 590 600 610 620 630
1080 1090 1100 1110 1120 1130
pF1KE1 GPMCRPVILLPEDTPPFLELKGSRHPCITKTFFGDDFIPNDILIGCEEEEQENGKAYCVL
. :: . :: : .: . :: . : . .. : :. . .:. . ..
CCDS67 --YVRPEFT---DT---LAIKQGWHPILEK-ISAEKPIANNTYV-------TEGSNF-LI
640 650 660 670
1140 1150 1160 1170 1180 1190
pF1KE1 VTGPNMGGKSTLMRQAGLLAVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFF
.:::::.:::: ..: .: .:::.: ::::: . ..:::....: : .. :::.
CCDS67 ITGPNMSGKSTYLKQIALCQIMAQIGSYVPAEYSSFRIAKQIFTRISTDDDIETNSSTFM
680 690 700 710 720 730
1200 1210 1220 1230 1240 1250
pF1KE1 VELSETASILMHATAHSLVLVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHS
:..: : :: .:. .::.:.::::::: : .: .: :: . : ..: :::.::.
CCDS67 KEMKEIAYILHNANDKSLILIDELGRGTNTEEGIGICYAVCEYLL-SLKAFTLFATHFLE
740 750 760 770 780 790
1260 1270 1280 1290 1300
pF1KE1 LVEDYSQNVAVRLGHMACM-VENECEDPSQETITFLYKFIKGACP-KSYGFNAARLANLP
: . . :. :. . :.: .. .:.: . ::. :: :.::..::....::
CCDS67 LCHIDALYPNVENMHFEVQHVKNTSRN--KEAILYTYKLSKGLTEEKNYGLKAAEVSSLP
800 810 820 830 840 850
1310 1320 1330 1340 1350 1360
pF1KE1 EEVIQKGHRKAREFEKMNQSLRLFREVCLASERSTVDAE---AVHKLLTLIKEL
.. :.:. . .. :.. : ..::: . : ::..: :
CCDS67 PSIVL----DAKEI-----TTQITRQI-LQNQRSTPEMERQRAVYHLATRLVQTARNSQL
860 870 880 890 900
CCDS67 DPDSLRIYLSNLKKKYKEDFPRTEQVPEKTEE
910 920 930
>>CCDS4720.1 MSH5 gene_id:4439|Hs108|chr6 (834 aa)
initn: 456 init1: 311 opt: 393 Z-score: 315.3 bits: 70.0 E(32554): 3.1e-11
Smith-Waterman score: 538; 27.4% identity (56.1% similar) in 660 aa overlap (679-1316:178-771)
650 660 670 680 690 700
pF1KE1 DGIGVMLPQVLKGMTSESDSIGLTPGEKSELALSALGGCVFYLKKCLIDQELLSMANFEE
:.. :::: . .: . : :: ...
CCDS47 LSGNYSFIPDAMTATEKILFLSSIIPFDCLLTVRALGGLLKFLGRRRIGVEL---EDYNV
150 160 170 180 190 200
710 720 730 740 750 760
pF1KE1 YIP-LDSDTVSTTRSGAIFTKAYQRMVLDAVTLNNLEIFLNGTNGSTEG-TLLERVDTCH
.: : :. : .:. ::. .. . ..: :: .:. .. ::
CCDS47 SVPILGFKKFMLTHLVNIDQDTYS--VLQIFKSESHPSVYKVASGLKEGLSLFGILNRCH
210 220 230 240 250 260
770 780 790 800 810 820
pF1KE1 TPFGKRLLKQWLCAPLCNHYAINDRLDAIEDLMVVPDKISEVVELLKKLPDLERLLSKIH
.:..::. :. : . ...:::.:. ....:... ..... :.:::..:.
CCDS47 CKWGEKLLRLWFTRPTHDLGELSSRLDVIQ-FFLLPQNL-DMAQM------LHRLLGHIK
270 280 290 300 310
830 840 850 860 870 880
pF1KE1 NVGSPLKSQNHPDSRA----IMYEETTYSKKKIIDFLSALEGFKVMCKIIGIMEEVADGF
:: :: .. ... ..:. :.:: . : .: . . : .: .: .
CCDS47 NVPLILKRMKLSHTKVSDWQVLYK-TVYSALGLRDACRSLPQSIQLFR--DIAQEFSDDL
320 330 340 350 360 370
890 900 910 920 930 940
pF1KE1 K--SKILKQVISLQTKNPEGRFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQA
. .... .:.... . :.:: :: : : .:..: : :: : .:
CCDS47 HHIASLIGKVVDFEGSLAENRF---TV-LPNIDPEIDEKKRRLMGL--P--SF-------
380 390 400 410
950 960 970 980 990
pF1KE1 LADIRENEQSLLEYLEKQRNRI-GCRTIVYWGIGRNRYQLEIPE--------NFTTRNLP
:... ..: ::. .:: .: .: :: . : ::. .: .:
CCDS47 LTEVARKE------LENLDSRIPSCSVIYIPLIG---FLLSIPRLPSMVEASDFEINGLD
420 430 440 450 460
1000 1010 1020 1030 1040 1050
pF1KE1 EEYELKSTKKGCKRYWTKTIEKKLANLINAEERRDVSLKDCMRRLFYNFDKNYKDWQSAV
. :. : . :: .. :..: . : : . .: : .: . ..
CCDS47 FMF-LSEEKLHYRSARTKELDALLGDL-HCEIRDQETL--LMYQLQCQVLARAAVLTRVL
470 480 490 500 510 520
1060 1070 1080 1090 1100
pF1KE1 ECIAVLDVLLCLANYSRGGDGPMCRPVILLPEDTPPFL--ELKGSRHPCITKTFFGDDFI
. . ::::: ::. .: : . : :. .: : .....::: . . . :.
CCDS47 DLASRLDVLLALASAAR--DYGYSR-----PRYSPQVLGVRIQNGRHPLM--ELCARTFV
530 540 550 560 570
1110 1120 1130 1140 1150 1160
pF1KE1 PNDILIGCEEEEQENGKAYCVLVTGPNMGGKSTLMRQAGLLAVMAQMGCYVPAEVCRLTP
::. : . :. ..:::: .::: ..:.::.. :: .: .:::: ..
CCDS47 PNSTECGGD-------KGRVKVITGPNSSGKSIYLKQVGLITFMALVGSFVPAEEAEIGA
580 590 600 610 620
1170 1180 1190 1200 1210 1220
pF1KE1 IDRVFTRLGASDRIMSGESTFFVELSETASILMHATAHSLVLVDELGRGTATFDGTAIAN
.: .:::. . . : : :::...:...:. . .:::.::::.::.:.:: : :: :.
CCDS47 VDAIFTRIHSCESISLGLSTFMIDLNQVAKAVNNATAQSLVLIDEFGKGTNTVDGLALLA
630 640 650 660 670 680
1230 1240 1250 1260 1270 1280
pF1KE1 AVVKE-LAETIKCRTLF-STHYHSLVEDYSQNVAVRLGHMACMVENE-CEDPSQETITFL
::... ::. : .: .:.. ::: : . : .. .. : ::: .. ..:.
CCDS47 AVLRHWLARGPTCPHIFVATNFLSLV----QLQLLPQGPLVQYLTMETCEDGND--LVFF
690 700 710 720 730 740
1290 1300 1310 1320 1330 1340
pF1KE1 YKFIKGACPKSYGFNAARLANLPEEVIQKGHRKAREFEKMNQSLRLFREVCLASERSTVD
:. .:. :.. ..: :.::.... .:
CCDS47 YQVCEGVAKASHASHTAAQAGLPDKLVARGKEVSDLIRSGKPIKPVKDLLKKNQMENCQT
750 760 770 780 790 800
1360 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Mon Nov 7 02:29:49 2016 done: Mon Nov 7 02:29:50 2016
Total Scan time: 5.180 Total Display time: 0.410
Function used was FASTA [36.3.4 Apr, 2011]