Result of FASTA (ccds) for pF1KE4271
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KE4271, 1137 aa
  1>>>pF1KE4271 1137 - 1137 aa - 1137 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 8.6200+/-0.00107; mu= 9.2120+/- 0.066
 mean_var=177.9129+/-35.929, 0's: 0 Z-trim(109.8): 10  B-trim: 6 in 1/52
 Lambda= 0.096155
 statistics sampled from 11152 (11162) to 11152 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.65), E-opt: 0.2 (0.343), width:  16
 Scan time:  4.630

The best scores are:                                      opt bits E(32554)
CCDS34195.1 MSH3 gene_id:4437|Hs108|chr5           (1137) 7323 1028.8       0
CCDS58709.1 MSH2 gene_id:4436|Hs108|chr2           ( 868)  778 120.8 1.3e-26
CCDS1834.1 MSH2 gene_id:4436|Hs108|chr2            ( 934)  778 120.9 1.4e-26
CCDS670.1 MSH4 gene_id:4438|Hs108|chr1             ( 936)  611 97.7 1.3e-19
CCDS62907.1 MSH6 gene_id:2956|Hs108|chr2           (1058)  599 96.1 4.7e-19
CCDS62906.1 MSH6 gene_id:2956|Hs108|chr2           (1230)  599 96.1 5.4e-19
CCDS1836.1 MSH6 gene_id:2956|Hs108|chr2            (1360)  599 96.1 5.8e-19
CCDS4720.1 MSH5 gene_id:4439|Hs108|chr6            ( 834)  587 94.3 1.2e-18
CCDS34409.2 MSH5 gene_id:4439|Hs108|chr6           ( 822)  575 92.7 3.9e-18
CCDS34410.1 MSH5 gene_id:4439|Hs108|chr6           ( 835)  575 92.7 3.9e-18


>>CCDS34195.1 MSH3 gene_id:4437|Hs108|chr5                (1137 aa)
 initn: 7323 init1: 7323 opt: 7323  Z-score: 5496.1  bits: 1028.8 E(32554):    0
Smith-Waterman score: 7323; 99.7% identity (100.0% similar) in 1137 aa overlap (1-1137:1-1137)

               10        20        30        40        50        60
pF1KE4 MSRRKPASGGLAASSSAPARQAVLSRFFQSTGSLKSTSSSTGAADQVDPGAAAAAAAAAA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 MSRRKPASGGLAASSSAPARQAVLSRFFQSTGSLKSTSSSTGAADQVDPGAAAAAAAAAA
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KE4 AAPPAPPAPAFPPQLPPHVATEIDRRKKRPLENDGPVKKKVKKVQQKEGGSDLGMSGNSE
       ::::::::::::::::::.:::::::::::::::::::::::::::::::::::::::::
CCDS34 AAPPAPPAPAFPPQLPPHIATEIDRRKKRPLENDGPVKKKVKKVQQKEGGSDLGMSGNSE
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KE4 PKKCLRTRNVSKSLEKLKEFCCDSALPQSRVQTESLQERFAVLPKCTDFDDISLLHAKNA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 PKKCLRTRNVSKSLEKLKEFCCDSALPQSRVQTESLQERFAVLPKCTDFDDISLLHAKNA
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KE4 VSSEDSKRQINQKDTTLFDLSQFGSSNTSHENLQKTASKSANKRSKSIYTPLELQYIEMK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 VSSEDSKRQINQKDTTLFDLSQFGSSNTSHENLQKTASKSANKRSKSIYTPLELQYIEMK
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KE4 QQHKDAVLCVECGYKYRFFGEDAEIAARELNIYCHLDHNFMTASIPTHRLFVHVRRLVAK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 QQHKDAVLCVECGYKYRFFGEDAEIAARELNIYCHLDHNFMTASIPTHRLFVHVRRLVAK
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KE4 GYKVGVVKQTETAALKAIGDNRSSLFSRKLTALYTKSTLIGEDVNPLIKLDDAVNVDEIM
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 GYKVGVVKQTETAALKAIGDNRSSLFSRKLTALYTKSTLIGEDVNPLIKLDDAVNVDEIM
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KE4 TDTSTSYLLCISENKENVRDKKKGNIFIGIVGVQPATGEVVFDSFQDSASRSELETRMSS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 TDTSTSYLLCISENKENVRDKKKGNIFIGIVGVQPATGEVVFDSFQDSASRSELETRMSS
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KE4 LQPVELLLPSALSEQTEALIHRATSVSVQDDRIRVERMDNIYFEYSHAFQAVTEFYAKDT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 LQPVELLLPSALSEQTEALIHRATSVSVQDDRIRVERMDNIYFEYSHAFQAVTEFYAKDT
              430       440       450       460       470       480

              490       500       510       520       530       540
pF1KE4 VDIKGSQIISGIVNLEKPVICSLAAIIKYLKEFNLEKMLSKPENFKQLSSKMEFMTINGT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 VDIKGSQIISGIVNLEKPVICSLAAIIKYLKEFNLEKMLSKPENFKQLSSKMEFMTINGT
              490       500       510       520       530       540

              550       560       570       580       590       600
pF1KE4 TLRNLEILQNQTDMKTKGSLLWVLDHTKTSFGRRKLKKWVTQPLLKLREINARLDAVSEV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 TLRNLEILQNQTDMKTKGSLLWVLDHTKTSFGRRKLKKWVTQPLLKLREINARLDAVSEV
              550       560       570       580       590       600

              610       620       630       640       650       660
pF1KE4 LHSESSVFGQIENHLRKLPDIERGLCSIYHKKCSTQEFFLIVKTLYHLKSEFQAIIPAVN
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 LHSESSVFGQIENHLRKLPDIERGLCSIYHKKCSTQEFFLIVKTLYHLKSEFQAIIPAVN
              610       620       630       640       650       660

              670       680       690       700       710       720
pF1KE4 SHIQSDLLRTVILEIPELLSPVEHYLKILNEQAAKVGDKTELFKDLSDFPLIKKRKDEIQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 SHIQSDLLRTVILEIPELLSPVEHYLKILNEQAAKVGDKTELFKDLSDFPLIKKRKDEIQ
              670       680       690       700       710       720

              730       740       750       760       770       780
pF1KE4 GVIDEIRMHLQEIRKILKNPSAQYVTVSGQEFMIEIKNSAVSCIPTDWVKVGSTKAVSRF
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 GVIDEIRMHLQEIRKILKNPSAQYVTVSGQEFMIEIKNSAVSCIPTDWVKVGSTKAVSRF
              730       740       750       760       770       780

              790       800       810       820       830       840
pF1KE4 HSPFIVENYRHLNQLREQLVLDCSAEWLDFLEKFSEHYHSLCKAVHHLATVDCIFSLAKV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 HSPFIVENYRHLNQLREQLVLDCSAEWLDFLEKFSEHYHSLCKAVHHLATVDCIFSLAKV
              790       800       810       820       830       840

              850       860       870       880       890       900
pF1KE4 AKQGDYCRPTVQEERKIVIKNGRHPVIDVLLGEQDQYVPNNTDLSEDSERVMIITGPNMG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 AKQGDYCRPTVQEERKIVIKNGRHPVIDVLLGEQDQYVPNNTDLSEDSERVMIITGPNMG
              850       860       870       880       890       900

              910       920       930       940       950       960
pF1KE4 GKSSYIKQVALITIMAQIGSYVPAEEATIGIVDGIFTRMGAADNIYKGRSTFMEELTDTA
       ::::::::::::::::::::::::::::::::::::::::::::::::.:::::::::::
CCDS34 GKSSYIKQVALITIMAQIGSYVPAEEATIGIVDGIFTRMGAADNIYKGQSTFMEELTDTA
              910       920       930       940       950       960

              970       980       990      1000      1010      1020
pF1KE4 EIIRKATSQSLVILDELGRGTSTHDGIAIAYATLEYFIRDVKSLTLFVTHYPPVCELEKN
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 EIIRKATSQSLVILDELGRGTSTHDGIAIAYATLEYFIRDVKSLTLFVTHYPPVCELEKN
              970       980       990      1000      1010      1020

             1030      1040      1050      1060      1070      1080
pF1KE4 YSHQVGNYHMGFLVSEDESKLDPGTAEQVPDFVTFLYQITRGIAARSYGLNVAKLADVPG
       ::::::::::::::::::::::::.:::::::::::::::::::::::::::::::::::
CCDS34 YSHQVGNYHMGFLVSEDESKLDPGAAEQVPDFVTFLYQITRGIAARSYGLNVAKLADVPG
             1030      1040      1050      1060      1070      1080

             1090      1100      1110      1120      1130       
pF1KE4 EILKKAAHKSKELEGLINTKRKRLKYFAKLWTMHNAQDLQKWTEEFNMEETQTSLLH
       :::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 EILKKAAHKSKELEGLINTKRKRLKYFAKLWTMHNAQDLQKWTEEFNMEETQTSLLH
             1090      1100      1110      1120      1130       

>>CCDS58709.1 MSH2 gene_id:4436|Hs108|chr2                (868 aa)
 initn: 711 init1: 476 opt: 778  Z-score: 591.0  bits: 120.8 E(32554): 1.3e-26
Smith-Waterman score: 871; 28.0% identity (61.0% similar) in 735 aa overlap (388-1094:95-786)

       360       370       380       390       400       410       
pF1KE4 EIMTDTSTSYLLCISENKENVRDKKKGNIFIGIVGVQPATGEVVFDSFQDSASRSELETR
                                     .:.  :.    .. .  : :. . :.::. 
CCDS58 FEDILFGNNDMSASIGVVGVKMSAVDGQRQVGVGYVDSIQRKLGLCEFPDNDQFSNLEAL
           70        80        90       100       110       120    

       420       430       440       450       460       470       
pF1KE4 MSSLQPVELLLPSALSEQTEALIHRATSVSVQDDRIRVERMDNIYFEYSHAFQAVTEFYA
       . .. : : .::..   .: . . .  .. .:   : . .  .  :  .  .: ....  
CCDS58 LIQIGPKECVLPGG---ETAGDMGKLRQI-IQRGGILITERKKADFSTKDIYQDLNRLLK
          130          140       150        160       170       180

       480       490         500       510       520       530     
pF1KE4 KDTVDIKGSQIISGIV-NLEKPV-ICSLAAIIKYLKEFNLEKMLSKPENFKQLSSKM---
             :: :. :... ..:. : . ::.:.::.:.      .::   :: :.       
CCDS58 GK----KGEQMNSAVLPEMENQVAVSSLSAVIKFLE------LLSDDSNFGQFELTTFDF
                  190       200       210             220       230

             540       550        560       570       580       590
pF1KE4 -EFMTINGTTLRNLEILQNQT-DMKTKGSLLWVLDHTKTSFGRRKLKKWVTQPLLKLREI
        ..: .. ...: :...:... :   . ::  .:.. ::  :.: ...:. :::.   .:
CCDS58 SQYMKLDIAAVRALNLFQGSVEDTTGSQSLAALLNKCKTPQGQRLVNQWIKQPLMDKNRI
              240       250       260       270       280       290

              600       610       620       630       640       650
pF1KE4 NARLDAVSEVLHSESSVFGQIENHLRKLPDIERGLCSIYHKKCSTQEFFLIVKTLYHLKS
       . ::. :   ...        :. ::..::..:   .. ..  . :. . . . . .: .
CCDS58 EERLNLVEAFVEDAELRQTLQEDLLRRFPDLNRLAKKFQRQAANLQDCYRLYQGINQLPN
              300       310       320       330       340       350

              660       670       680       690         700        
pF1KE4 EFQAIIPAVNSHIQSDLLRTVILEIPELLSPVEHYLKILNE--QAAKVGDKTELFK----
        .::.    ..: :. :: . .  . .: :   .. ....   .  .: ..  : :    
CCDS58 VIQALEKHEGKH-QKLLLAVFVTPLTDLRSDFSKFQEMIETTLDMDQVENHEFLVKPSFD
              360        370       380       390       400         

            710       720         730       740            750     
pF1KE4 -DLSDF-PLIKKRKDEIQG-VIDEIR-MHLQEIRKILKNPSAQY-----VTVSGQEFMIE
        .::..  ...  . ..:. .:.  : . :.  ..:  . :::.     :: . .. . .
CCDS58 PNLSELREIMNDLEKKMQSTLISAARDLGLDPGKQIKLDSSAQFGYYFRVTCKEEKVLRN
     410       420       430       440       450       460         

         760       770       780       790       800       810     
pF1KE4 IKNSAVSCIPTDWVKVGSTKAVSRFHSPFIVENYRHLNQLREQLVLDCSAEWLDFLEKFS
        :: ..  :  . ::  ..: .: ..  . ..:  . .. .. .:     : ...   . 
CCDS58 NKNFSTVDIQKNGVKFTNSKLTS-LNEEY-TKNKTEYEEAQDAIV----KEIVNISSGYV
     470       480       490         500       510           520   

         820       830       840         850         860       870 
pF1KE4 EHYHSLCKAVHHLATVDCIFSLAKVAKQGD--YCRPTVQE--ERKIVIKNGRHPVIDVLL
       : ...:  .   :: .: . :.:.:.. .   : ::.. :  . .:..: .::  ..:  
CCDS58 EPMQTLNDV---LAQLDAVVSFAHVSNGAPVPYVRPAILEKGQGRIILKASRHACVEV--
           530          540       550       560       570          

               880       890       900       910       920         
pF1KE4 GEQDQ--YVPNNTDLSEDSERVMIITGPNMGGKSSYIKQVALITIMAQIGSYVPAEEATI
         ::.  ..::.. . .:..   :::::::::::.::.:...:..::::: .:: : : .
CCDS58 --QDEIAFIPNDVYFEKDKQMFHIITGPNMGGKSTYIRQTGVIVLMAQIGCFVPCESAEV
        580       590       600       610       620       630      

     930       940       950       960       970       980         
pF1KE4 GIVDGIFTRMGAADNIYKGRSTFMEELTDTAEIIRKATSQSLVILDELGRGTSTHDGIAI
       .::: :..:.::.:.  :: :::: :. .:: :.:.::..::.:.:::::::::.::...
CCDS58 SIVDCILARVGAGDSQLKGVSTFMAEMLETASILRSATKDSLIIIDELGRGTSTYDGFGL
        640       650       660       670       680       690      

     990      1000      1010      1020      1030      1040         
pF1KE4 AYATLEYFIRDVKSLTLFVTHYPPVCELEKNYSHQVGNYHMGFLVSEDESKLDPGTAEQV
       :.:  ::.   . .. .:.::.  .  :  :    :.: :.  :..:.            
CCDS58 AWAISEYIATKIGAFCMFATHFHELTALA-NQIPTVNNLHVTALTTEET-----------
        700       710       720        730       740               

    1050      1060      1070      1080      1090      1100         
pF1KE4 PDFVTFLYQITRGIAARSYGLNVAKLADVPGEILKKAAHKSKELEGLINTKRKRLKYFAK
          .:.:::. .:.  .:.:..::.::. : .... : .:. :::               
CCDS58 ---LTMLYQVKKGVCDQSFGIHVAELANFPKHVIECAKQKALELEEFQYIGESQGYDIME
             750       760       770       780       790       800 

    1110      1120      1130                                       
pF1KE4 LWTMHNAQDLQKWTEEFNMEETQTSLLH                                
                                                                   
CCDS58 PAAKKCYLEREQGEKIIQEFLSKVKQMPFTEMSEENITIKLKQLKAEVIAKNNSFVNEII
             810       820       830       840       850       860 

>>CCDS1834.1 MSH2 gene_id:4436|Hs108|chr2                 (934 aa)
 initn: 747 init1: 476 opt: 778  Z-score: 590.5  bits: 120.9 E(32554): 1.4e-26
Smith-Waterman score: 871; 28.0% identity (61.0% similar) in 735 aa overlap (388-1094:161-852)

       360       370       380       390       400       410       
pF1KE4 EIMTDTSTSYLLCISENKENVRDKKKGNIFIGIVGVQPATGEVVFDSFQDSASRSELETR
                                     .:.  :.    .. .  : :. . :.::. 
CCDS18 FEDILFGNNDMSASIGVVGVKMSAVDGQRQVGVGYVDSIQRKLGLCEFPDNDQFSNLEAL
              140       150       160       170       180       190

       420       430       440       450       460       470       
pF1KE4 MSSLQPVELLLPSALSEQTEALIHRATSVSVQDDRIRVERMDNIYFEYSHAFQAVTEFYA
       . .. : : .::..   .: . . .  .. .:   : . .  .  :  .  .: ....  
CCDS18 LIQIGPKECVLPGG---ETAGDMGKLRQI-IQRGGILITERKKADFSTKDIYQDLNRLLK
              200          210        220       230       240      

       480       490         500       510       520       530     
pF1KE4 KDTVDIKGSQIISGIV-NLEKPV-ICSLAAIIKYLKEFNLEKMLSKPENFKQLSSKM---
             :: :. :... ..:. : . ::.:.::.:.      .::   :: :.       
CCDS18 GK----KGEQMNSAVLPEMENQVAVSSLSAVIKFLE------LLSDDSNFGQFELTTFDF
            250       260       270             280       290      

             540       550        560       570       580       590
pF1KE4 -EFMTINGTTLRNLEILQNQT-DMKTKGSLLWVLDHTKTSFGRRKLKKWVTQPLLKLREI
        ..: .. ...: :...:... :   . ::  .:.. ::  :.: ...:. :::.   .:
CCDS18 SQYMKLDIAAVRALNLFQGSVEDTTGSQSLAALLNKCKTPQGQRLVNQWIKQPLMDKNRI
        300       310       320       330       340       350      

              600       610       620       630       640       650
pF1KE4 NARLDAVSEVLHSESSVFGQIENHLRKLPDIERGLCSIYHKKCSTQEFFLIVKTLYHLKS
       . ::. :   ...        :. ::..::..:   .. ..  . :. . . . . .: .
CCDS18 EERLNLVEAFVEDAELRQTLQEDLLRRFPDLNRLAKKFQRQAANLQDCYRLYQGINQLPN
        360       370       380       390       400       410      

              660       670       680       690         700        
pF1KE4 EFQAIIPAVNSHIQSDLLRTVILEIPELLSPVEHYLKILNE--QAAKVGDKTELFK----
        .::.    ..: :. :: . .  . .: :   .. ....   .  .: ..  : :    
CCDS18 VIQALEKHEGKH-QKLLLAVFVTPLTDLRSDFSKFQEMIETTLDMDQVENHEFLVKPSFD
        420        430       440       450       460       470     

            710       720         730       740            750     
pF1KE4 -DLSDF-PLIKKRKDEIQG-VIDEIR-MHLQEIRKILKNPSAQY-----VTVSGQEFMIE
        .::..  ...  . ..:. .:.  : . :.  ..:  . :::.     :: . .. . .
CCDS18 PNLSELREIMNDLEKKMQSTLISAARDLGLDPGKQIKLDSSAQFGYYFRVTCKEEKVLRN
         480       490       500       510       520       530     

         760       770       780       790       800       810     
pF1KE4 IKNSAVSCIPTDWVKVGSTKAVSRFHSPFIVENYRHLNQLREQLVLDCSAEWLDFLEKFS
        :: ..  :  . ::  ..: .: ..  . ..:  . .. .. .:     : ...   . 
CCDS18 NKNFSTVDIQKNGVKFTNSKLTS-LNEEY-TKNKTEYEEAQDAIV----KEIVNISSGYV
         540       550        560        570           580         

         820       830       840         850         860       870 
pF1KE4 EHYHSLCKAVHHLATVDCIFSLAKVAKQGD--YCRPTVQE--ERKIVIKNGRHPVIDVLL
       : ...:  .   :: .: . :.:.:.. .   : ::.. :  . .:..: .::  ..:  
CCDS18 EPMQTLNDV---LAQLDAVVSFAHVSNGAPVPYVRPAILEKGQGRIILKASRHACVEV--
     590          600       610       620       630       640      

               880       890       900       910       920         
pF1KE4 GEQDQ--YVPNNTDLSEDSERVMIITGPNMGGKSSYIKQVALITIMAQIGSYVPAEEATI
         ::.  ..::.. . .:..   :::::::::::.::.:...:..::::: .:: : : .
CCDS18 --QDEIAFIPNDVYFEKDKQMFHIITGPNMGGKSTYIRQTGVIVLMAQIGCFVPCESAEV
            650       660       670       680       690       700  

     930       940       950       960       970       980         
pF1KE4 GIVDGIFTRMGAADNIYKGRSTFMEELTDTAEIIRKATSQSLVILDELGRGTSTHDGIAI
       .::: :..:.::.:.  :: :::: :. .:: :.:.::..::.:.:::::::::.::...
CCDS18 SIVDCILARVGAGDSQLKGVSTFMAEMLETASILRSATKDSLIIIDELGRGTSTYDGFGL
            710       720       730       740       750       760  

     990      1000      1010      1020      1030      1040         
pF1KE4 AYATLEYFIRDVKSLTLFVTHYPPVCELEKNYSHQVGNYHMGFLVSEDESKLDPGTAEQV
       :.:  ::.   . .. .:.::.  .  :  :    :.: :.  :..:.            
CCDS18 AWAISEYIATKIGAFCMFATHFHELTALA-NQIPTVNNLHVTALTTEET-----------
            770       780       790        800       810           

    1050      1060      1070      1080      1090      1100         
pF1KE4 PDFVTFLYQITRGIAARSYGLNVAKLADVPGEILKKAAHKSKELEGLINTKRKRLKYFAK
          .:.:::. .:.  .:.:..::.::. : .... : .:. :::               
CCDS18 ---LTMLYQVKKGVCDQSFGIHVAELANFPKHVIECAKQKALELEEFQYIGESQGYDIME
                 820       830       840       850       860       

    1110      1120      1130                                       
pF1KE4 LWTMHNAQDLQKWTEEFNMEETQTSLLH                                
                                                                   
CCDS18 PAAKKCYLEREQGEKIIQEFLSKVKQMPFTEMSEENITIKLKQLKAEVIAKNNSFVNEII
       870       880       890       900       910       920       

>>CCDS670.1 MSH4 gene_id:4438|Hs108|chr1                  (936 aa)
 initn: 619 init1: 384 opt: 611  Z-score: 465.3  bits: 97.7 E(32554): 1.3e-19
Smith-Waterman score: 869; 26.5% identity (63.9% similar) in 739 aa overlap (388-1093:171-868)

       360       370       380       390       400       410       
pF1KE4 EIMTDTSTSYLLCISENKENVRDKKKGNIFIGIVGVQPATGEVVFDSFQDSASRSELETR
                                     ::.....  . ......: :... ... :.
CCDS67 YSASSSSAISAHSPSVIVAVVEGRGLARGEIGMASIDLKNPQIILSQFADNTTYAKVITK
              150       160       170       180       190       200

       420       430          440       450       460       470    
pF1KE4 MSSLQPVELLLPS---ALSEQTEALIHRATSVSVQDDRIRVERMDNIYFEYSHAFQAVTE
       .. :.:.:... .   :....:. .    : .. .   .    ..  ::. ..... . .
CCDS67 LKILSPLEIIMSNTACAVGNSTKLF----TLITENFKNVNFTTIQRKYFNETKGLEYIEQ
              210       220           230       240       250      

          480       490       500         510       520        530 
pF1KE4 FYAKDTVDIKGSQIISGIVNLEKPVIC--SLAAIIKYLKEFNLEKMLSKPENFKQ-LSSK
       .   .   .        ......   :  ..::..::. :: ... .  :...:  ....
CCDS67 LCIAEFSTV--------LMEVQSKYYCLAAVAALLKYV-EF-IQNSVYAPKSLKICFQGS
        260               270       280         290       300      

             540       550       560       570       580       590 
pF1KE4 MEFMTINGTTLRNLEILQNQTDMKTKGSLLWVLDHTKTSFGRRKLKKWVTQPLLKLREIN
        .   :.... .:::.: :. :.... .:. ::..:::  : :.:.. . .::. .. ::
CCDS67 EQTAMIDSSSAQNLELLINNQDYRNNHTLFGVLNYTKTPGGSRRLRSNILEPLVDIETIN
        310       320       330       340       350       360      

             600       610       620       630         640         
pF1KE4 ARLDAVSEVLHSESSVFGQIENHLRKLPDIERGLCSIYH--KKCSTQEFFLIVKTLYHLK
        ::: :.:.:..:   :: ... . .. : :. :  . .  :. ...     . .: .::
CCDS67 MRLDCVQELLQDEELFFG-LQSVISRFLDTEQLLSVLVQIPKQDTVNAAESKITNLIYLK
        370       380        390       400       410       420     

     650         660       670                   680        690    
pF1KE4 SEFQAIIP--AVNSHIQSDLLRT-----------VILE-IPELLSPVEHYLK-ILNEQAA
         .. . :   . .. .. :::.           .::: :  ...   .:.:  :: .. 
CCDS67 HTLELVDPLKIAMKNCNTPLLRAYYGSLEDKRFGIILEKIKTVINDDARYMKGCLNMRTQ
         430       440       450       460       470       480     

          700       710       720       730       740       750    
pF1KE4 KVGDKTELFKDLSDFPLIKKRKDEIQGVIDEIRMHLQEIRKILKNPSAQYVTVSGQEFMI
       :      . .....:  : .:      ..:.:   .... .  . :     . :.. :.:
CCDS67 KC---YAVRSNINEFLDIARR--TYTEIVDDIAGMISQLGEKYSLPLRTSFS-SARGFFI
            490       500         510       520       530          

          760           770       780        790           800     
pF1KE4 EIKNSAVSC----IPTDWVKVGSTKAVSRFHSPFIVE-NYRHLNQLRE----QLVLDCSA
       .. .. ..     .:....:....:    : :  ... : :  ..:::      .. :. 
CCDS67 QMTTDCIALPSDQLPSEFIKISKVKNSYSFTSADLIKMNERCQESLREIYHMTYMIVCK-
     540       550       560       570       580       590         

         810       820       830       840       850       860     
pF1KE4 EWLDFLEKFSEHYHSLCKAVHHLATVDCIFSLAKVAKQGDYCRPTVQEERKIVIKNGRHP
           .: .. :: : : :    .. .: ..:.:..   .:: ::   .   ..::.: ::
CCDS67 ----LLSEIYEHIHCLYKLSDTVSMLDMLLSFAHACTLSDYVRPEFTD--TLAIKQGWHP
          600       610       620       630       640         650  

         870       880       890       900       910       920     
pF1KE4 VIDVLLGEQDQYVPNNTDLSEDSERVMIITGPNMGGKSSYIKQVALITIMAQIGSYVPAE
       ... . .:.   . ::: ..: :.  .:::::::.:::.:.::.::  ::::::::::::
CCDS67 ILEKISAEKP--IANNTYVTEGSN-FLIITGPNMSGKSTYLKQIALCQIMAQIGSYVPAE
            660         670        680       690       700         

         930       940       950       960       970       980     
pF1KE4 EATIGIVDGIFTRMGAADNIYKGRSTFMEELTDTAEIIRKATSQSLVILDELGRGTSTHD
        ... :.  ::::... :.:  . ::::.:. . : :...:...::...:::::::.:..
CCDS67 YSSFRIAKQIFTRISTDDDIETNSSTFMKEMKEIAYILHNANDKSLILIDELGRGTNTEE
     710       720       730       740       750       760         

         990      1000      1010      1020      1030      1040     
pF1KE4 GIAIAYATLEYFIRDVKSLTLFVTHYPPVCELEKNYSHQVGNYHMGFLVSEDESKLDPGT
       ::.: ::. ::.. ..:..:::.::.  .:...  : . : :.:  : :.. ..      
CCDS67 GIGICYAVCEYLL-SLKAFTLFATHFLELCHIDALYPN-VENMH--FEVQHVKN------
     770       780        790       800        810                 

        1050      1060       1070      1080      1090      1100    
pF1KE4 AEQVPDFVTFLYQITRGIAA-RSYGLNVAKLADVPGEILKKAAHKSKELEGLINTKRKRL
       . .  . . . :....:..  ..:::..:.....:  :.  : . . ..           
CCDS67 TSRNKEAILYTYKLSKGLTEEKNYGLKAAEVSSLPPSIVLDAKEITTQITRQILQNQRST
     820       830       840       850       860       870         

         1110      1120      1130                               
pF1KE4 KYFAKLWTMHNAQDLQKWTEEFNMEETQTSLLH                        
                                                                
CCDS67 PEMERQRAVYHLATRLVQTARNSQLDPDSLRIYLSNLKKKYKEDFPRTEQVPEKTEE
     880       890       900       910       920       930      

>>CCDS62907.1 MSH6 gene_id:2956|Hs108|chr2                (1058 aa)
 initn: 814 init1: 425 opt: 599  Z-score: 455.5  bits: 96.1 E(32554): 4.7e-19
Smith-Waterman score: 1047; 27.8% identity (61.1% similar) in 960 aa overlap (230-1101:105-1029)

     200       210       220       230       240       250         
pF1KE4 LSQFGSSNTSHENLQKTASKSANKRSKSIYTPLELQYIEMKQQHKDAVLCVECGYKYRFF
                                     ::   .. ..:.:. : :.: . :  :...
CCDS62 KRRDEHRRRPDHPDFDASTLYVPEDFLNSCTPGMRKWWQIKSQNFDLVICYKVGKFYELY
           80        90       100       110       120       130    

     260       270       280       290       300       310         
pF1KE4 GEDAEIAARELNIYCHLDHNFMTASIPTHRLFVHVRRLVAKGYKVGVVKQTETAALKAIG
         :: :.. ::..   .  :.  ...:   .  .   :: :::::. :.::::  .    
CCDS62 HMDALIGVSELGLV-FMKGNWAHSGFPEIAFGRYSDSLVQKGYKVARVEQTETPEMM---
          140        150       160       170       180       190   

     320       330       340        350        360       370       
pF1KE4 DNRSSLFSRKLTALYTKSTLIGEDVNPLI-KLDDAVNVDEI-MTDTSTSYLLCISENKEN
       . :     ::.. .   . .. ...  .: :  .. .: :   ... ..::: ..:..:.
CCDS62 EARC----RKMAHISKYDRVVRREICRIITKGTQTYSVLEGDPSENYSKYLLSLKEKEED
                  200       210       220       230       240      

       380       390       400       410       420       430       
pF1KE4 VRDKKKGNIFIGIVGVQPATGEVVFDSFQDSASRSELETRMSSLQPVELLLPSA-LSEQT
          . ..    :.  :. . :.  . .:.:.   :...: ..   ::..:. .. ::..:
CCDS62 SSGHTRA---YGVCFVDTSLGKFFIGQFSDDRHCSRFRTLVAHYPPVQVLFEKGNLSKET
        250          260       270       280       290       300   

        440       450       460       470            480       490 
pF1KE4 EALIHRATSVSVQDDRIRVERMDNIYFEYSHAFQAVTE---FYAK--DTVDIKGSQIISG
       ..... . : :.:.  :      . ... :...... :   :  :  : . .   :...:
CCDS62 KTILKSSLSCSLQEGLIP----GSQFWDASKTLRTLLEEEYFREKLSDGIGVMLPQVLKG
           310       320           330       340       350         

                        500       510       520                    
pF1KE4 I------VNL---EKP--VICSLAAIIKYLKEFNLEKMLSKPENFKQ-------------
       .      ..:   ::   .. .:.. . :::.  ... : .  ::..             
CCDS62 MTSESDSIGLTPGEKSELALSALGGCVFYLKKCLIDQELLSMANFEEYIPLDSDTVSTTR
     360       370       380       390       400       410         

           530       540       550       560       570       580   
pF1KE4 ----LSSKMEFMTINGTTLRNLEILQNQTDMKTKGSLLWVLDHTKTSFGRRKLKKWVTQP
           ... .. :.....:: ::::. : :. .:.:.::  .:  .: ::.: ::.:.  :
CCDS62 SGAIFTKAYQRMVLDAVTLNNLEIFLNGTNGSTEGTLLERVDTCHTPFGKRLLKQWLCAP
     420       430       440       450       460       470         

           590       600       610       620       630             
pF1KE4 LLKLREINARLDAVSEVLHSESSVFGQIENHLRKLPDIERGLCSIYH--KKCSTQEF---
       : .   :: ::::. ...   ... ... . :.::::.:: : .:..  .  ..:.    
CCDS62 LCNHYAINDRLDAIEDLMVVPDKI-SEVVELLKKLPDLERLLSKIHNVGSPLKSQNHPDS
     480       490       500        510       520       530        

        640       650                      660       670           
pF1KE4 --FLIVKTLYHLKS--EFQA-------------IIPAVNSHIQSDLLRTVI-LE------
         ..  .: :  :.  .: .             :.  : . ..: .:. :: :.      
CCDS62 RAIMYEETTYSKKKIIDFLSALEGFKVMCKIIGIMEEVADGFKSKILKQVISLQTKNPEG
      540       550       560       570       580       590        

           680       690        700         710       720       730
pF1KE4 -IPELLSPVEHYLKILN-EQAAKVGDKTEL--FKDLSDFPLIKKRKDEIQGVIDEIRMHL
        .:.:   ....   .. :.: :.:  :    : .  :  :   :..: :....    .:
CCDS62 RFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQALADIRENE-QSLLE----YL
      600       610       620       630       640        650       

              740       750        760       770       780         
pF1KE4 QEIRKILKNPSAQYVTVSGQEFMIEI-KNSAVSCIPTDWVKVGSTKAVSRFHSPFIVENY
       .. :. .   .  :  .. .....:: .: ..  .: ..   .. :. .:. .  : .. 
CCDS62 EKQRNRIGCRTIVYWGIGRNRYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKL
           660       670       680       690       700       710   

     790          800       810       820       830       840      
pF1KE4 RHL---NQLREQLVLDCSAEWLDFLEKFSEHYHSLCKAVHHLATVDCIFSLAKVAKQGD-
        .:   .. :.  . ::  .   .. .:...:..  .::. .:..: .. ::. .. :: 
CCDS62 ANLINAEERRDVSLKDCMRR---LFYNFDKNYKDWQSAVECIAVLDVLLCLANYSRGGDG
           720       730          740       750       760       770

          850           860        870       880       890         
pF1KE4 -YCRPTV--QEERK--IVIKNGRHPVID-VLLGEQDQYVPNNTDLSEDSER-------VM
        .:::..   :.    . .:..::: :  ...:  :...::.  .. . :.        .
CCDS62 PMCRPVILLPEDTPPFLELKGSRHPCITKTFFG--DDFIPNDILIGCEEEEQENGKAYCV
              780       790       800         810       820        

            900       910       920       930       940       950  
pF1KE4 IITGPNMGGKSSYIKQVALITIMAQIGSYVPAEEATIGIVDGIFTRMGAADNIYKGRSTF
       ..:::::::::. ..:..:...:::.: :::::   .  .: .:::.::.: :..:.:::
CCDS62 LVTGPNMGGKSTLMRQAGLLAVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTF
      830       840       850       860       870       880        

            960       970       980       990      1000      1010  
pF1KE4 MEELTDTAEIIRKATSQSLVILDELGRGTSTHDGIAIAYATLEYFIRDVKSLTLFVTHYP
       . ::..:: :. .::..:::..:::::::.: :: ::: :... . . .:  ::: ::: 
CCDS62 FVELSETASILMHATAHSLVLVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYH
      890       900       910       920       930       940        

            1020      1030      1040      1050      1060      1070 
pF1KE4 PVCE-LEKNYSHQVGNYHMGFLVSEDESKLDPGTAEQVPDFVTFLYQITRGIAARSYGLN
        . :   .: . ..:  ::. .: :.: . ::.      . .::::.. .:   .:::.:
CCDS62 SLVEDYSQNVAVRLG--HMACMV-ENECE-DPSQ-----ETITFLYKFIKGACPKSYGFN
      950       960          970             980       990         

            1080      1090      1100      1110      1120      1130 
pF1KE4 VAKLADVPGEILKKAAHKSKELEGLINTKRKRLKYFAKLWTMHNAQDLQKWTEEFNMEET
       .:.::..: :...:. .:..:.: . .. :                              
CCDS62 AARLANLPEEVIQKGHRKAREFEKMNQSLRLFREVCLASERSTVDAEAVHKLLTLIKEL 
    1000      1010      1020      1030      1040      1050         

>>CCDS62906.1 MSH6 gene_id:2956|Hs108|chr2                (1230 aa)
 initn: 814 init1: 425 opt: 599  Z-score: 454.5  bits: 96.1 E(32554): 5.4e-19
Smith-Waterman score: 1051; 26.8% identity (58.8% similar) in 1121 aa overlap (85-1101:118-1201)

           60        70        80        90        100       110   
pF1KE4 AAAAAAAAPPAPPAPAFPPQLPPHVATEIDRRKKRPLEND-GPVKKKVKKVQQKEGGSDL
                                     ::     :.: :    . :   ..::.:: 
CCDS62 KSEEDNEIESEEEVQPKTQGSRRSSRQIKKRRVISDSESDIGGSDVEFKPDTKEEGSSDE
        90       100       110       120       130       140       

             120              130       140       150       160    
pF1KE4 GMSG--NSE------PKKCLRTRN-VSKSLEKLKEFCCDSALPQSRVQTESLQERFAVLP
         ::  .::      : :  : :. .  .  .::.    .  :..  :. :.. .     
CCDS62 ISSGVGDSESEGLNSPVKVARKRKRMVTGNGSLKRKSSRKETPSATKQATSISSETKNTL
       150       160       170       180       190       200       

          170       180       190       200            210         
pF1KE4 KCTDFDDISLLHAKNAVSSEDSKRQINQKDTTLFDLSQFGSSNT-----SHENLQKTASK
       .  .  . :  .:. . ...::.:       ::  :..    .      .: ... ..  
CCDS62 RAFSAPQNSESQAHVSGGGDDSSRPTVWYHETLEWLKEEKRRDEHRRRPDHPDFDASTLY
       210       220       230       240       250       260       

     220       230       240       250       260       270         
pF1KE4 SANKRSKSIYTPLELQYIEMKQQHKDAVLCVECGYKYRFFGEDAEIAARELNIYCHLDHN
         .   .:  ::   .. ..:.:. : :.: . :  :...  :: :.. ::..   .  :
CCDS62 VPEDFLNSC-TPGMRKWWQIKSQNFDLVICYKVGKFYELYHMDALIGVSELGLV-FMKGN
       270        280       290       300       310       320      

     280       290       300       310       320       330         
pF1KE4 FMTASIPTHRLFVHVRRLVAKGYKVGVVKQTETAALKAIGDNRSSLFSRKLTALYTKSTL
       .  ...:   .  .   :: :::::. :.::::  .    . :     ::.. .   . .
CCDS62 WAHSGFPEIAFGRYSDSLVQKGYKVARVEQTETPEMM---EAR----CRKMAHISKYDRV
         330       340       350       360              370        

     340        350        360       370       380       390       
pF1KE4 IGEDVNPLI-KLDDAVNVDEI-MTDTSTSYLLCISENKENVRDKKKGNIFIGIVGVQPAT
       . ...  .: :  .. .: :   ... ..::: ..:..:.   . ..    :.  :. . 
CCDS62 VRREICRIITKGTQTYSVLEGDPSENYSKYLLSLKEKEEDSSGHTRA---YGVCFVDTSL
      380       390       400       410       420          430     

       400       410       420       430        440       450      
pF1KE4 GEVVFDSFQDSASRSELETRMSSLQPVELLLPSA-LSEQTEALIHRATSVSVQDDRIRVE
       :.  . .:.:.   :...: ..   ::..:. .. ::..:..... . : :.:.  :   
CCDS62 GKFFIGQFSDDRHCSRFRTLVAHYPPVQVLFEKGNLSKETKTILKSSLSCSLQEGLI---
         440       450       460       470       480       490     

        460       470            480       490                  500
pF1KE4 RMDNIYFEYSHAFQAVTE---FYAK--DTVDIKGSQIISGI------VNL---EKP--VI
          . ... :...... :   :  :  : . .   :...:.      ..:   ::   ..
CCDS62 -PGSQFWDASKTLRTLLEEEYFREKLSDGIGVMLPQVLKGMTSESDSIGLTPGEKSELAL
             500       510       520       530       540       550 

              510       520                        530       540   
pF1KE4 CSLAAIIKYLKEFNLEKMLSKPENFKQ-----------------LSSKMEFMTINGTTLR
        .:.. . :::.  ... : .  ::..                 ... .. :.....:: 
CCDS62 SALGGCVFYLKKCLIDQELLSMANFEEYIPLDSDTVSTTRSGAIFTKAYQRMVLDAVTLN
             560       570       580       590       600       610 

           550       560       570       580       590       600   
pF1KE4 NLEILQNQTDMKTKGSLLWVLDHTKTSFGRRKLKKWVTQPLLKLREINARLDAVSEVLHS
       ::::. : :. .:.:.::  .:  .: ::.: ::.:.  :: .   :: ::::. ...  
CCDS62 NLEIFLNGTNGSTEGTLLERVDTCHTPFGKRLLKQWLCAPLCNHYAINDRLDAIEDLMVV
             620       630       640       650       660       670 

           610       620       630              640       650      
pF1KE4 ESSVFGQIENHLRKLPDIERGLCSIYH--KKCSTQEF-----FLIVKTLYHLKS--EFQA
        ... ... . :.::::.:: : .:..  .  ..:.      ..  .: :  :.  .: .
CCDS62 PDKI-SEVVELLKKLPDLERLLSKIHNVGSPLKSQNHPDSRAIMYEETTYSKKKIIDFLS
              680       690       700       710       720       730

                       660       670               680       690   
pF1KE4 -------------IIPAVNSHIQSDLLRTVIL--------EIPELLSPVEHYLKILN-EQ
                    :.  : . ..: .:. ::         ..:.:   ....   .. :.
CCDS62 ALEGFKVMCKIIGIMEEVADGFKSKILKQVISLQTKNPEGRFPDLTVELNRWDTAFDHEK
              740       750       760       770       780       790

            700         710       720       730       740       750
pF1KE4 AAKVGDKTEL--FKDLSDFPLIKKRKDEIQGVIDEIRMHLQEIRKILKNPSAQYVTVSGQ
       : :.:  :    : .  :  :   :..: :....    .:.. :. .   .  :  .. .
CCDS62 ARKTGLITPKAGFDSDYDQALADIRENE-QSLLE----YLEKQRNRIGCRTIVYWGIGRN
              800       810        820           830       840     

               760       770       780       790          800      
pF1KE4 EFMIEI-KNSAVSCIPTDWVKVGSTKAVSRFHSPFIVENYRHL---NQLREQLVLDCSAE
       ....:: .: ..  .: ..   .. :. .:. .  : ..  .:   .. :.  . ::  .
CCDS62 RYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKLANLINAEERRDVSLKDCMRR
         850       860       870       880       890       900     

        810       820       830       840         850           860
pF1KE4 WLDFLEKFSEHYHSLCKAVHHLATVDCIFSLAKVAKQGD--YCRPTV--QEERK--IVIK
          .. .:...:..  .::. .:..: .. ::. .. ::  .:::..   :.    . .:
CCDS62 ---LFYNFDKNYKDWQSAVECIAVLDVLLCLANYSRGGDGPMCRPVILLPEDTPPFLELK
            910       920       930       940       950       960  

               870       880       890              900       910  
pF1KE4 NGRHPVID-VLLGEQDQYVPNNTDLSEDSER-------VMIITGPNMGGKSSYIKQVALI
       ..::: :  ...:  :...::.  .. . :.        ...:::::::::. ..:..:.
CCDS62 GSRHPCITKTFFG--DDFIPNDILIGCEEEEQENGKAYCVLVTGPNMGGKSTLMRQAGLL
            970         980       990      1000      1010      1020

            920       930       940       950       960       970  
pF1KE4 TIMAQIGSYVPAEEATIGIVDGIFTRMGAADNIYKGRSTFMEELTDTAEIIRKATSQSLV
       ..:::.: :::::   .  .: .:::.::.: :..:.:::. ::..:: :. .::..:::
CCDS62 AVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFFVELSETASILMHATAHSLV
             1030      1040      1050      1060      1070      1080

            980       990      1000      1010      1020        1030
pF1KE4 ILDELGRGTSTHDGIAIAYATLEYFIRDVKSLTLFVTHYPPVCELEKNYSHQVGNY--HM
       ..:::::::.: :: ::: :... . . .:  ::: :::  . :   .::..:.    ::
CCDS62 LVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHSLVE---DYSQNVAVRLGHM
             1090      1100      1110      1120         1130       

             1040      1050      1060      1070      1080      1090
pF1KE4 GFLVSEDESKLDPGTAEQVPDFVTFLYQITRGIAARSYGLNVAKLADVPGEILKKAAHKS
       . .: :.: . ::.      . .::::.. .:   .:::.:.:.::..: :...:. .:.
CCDS62 ACMV-ENECE-DPSQ-----ETITFLYKFIKGACPKSYGFNAARLANLPEEVIQKGHRKA
      1140        1150           1160      1170      1180      1190

             1100      1110      1120      1130       
pF1KE4 KELEGLINTKRKRLKYFAKLWTMHNAQDLQKWTEEFNMEETQTSLLH
       .:.: . .. :                                    
CCDS62 REFEKMNQSLRLFREVCLASERSTVDAEAVHKLLTLIKEL       
             1200      1210      1220      1230       

>>CCDS1836.1 MSH6 gene_id:2956|Hs108|chr2                 (1360 aa)
 initn: 814 init1: 425 opt: 599  Z-score: 453.9  bits: 96.1 E(32554): 5.8e-19
Smith-Waterman score: 1051; 26.8% identity (58.8% similar) in 1121 aa overlap (85-1101:248-1331)

           60        70        80        90        100       110   
pF1KE4 AAAAAAAAPPAPPAPAFPPQLPPHVATEIDRRKKRPLEND-GPVKKKVKKVQQKEGGSDL
                                     ::     :.: :    . :   ..::.:: 
CCDS18 KSEEDNEIESEEEVQPKTQGSRRSSRQIKKRRVISDSESDIGGSDVEFKPDTKEEGSSDE
       220       230       240       250       260       270       

             120              130       140       150       160    
pF1KE4 GMSG--NSE------PKKCLRTRN-VSKSLEKLKEFCCDSALPQSRVQTESLQERFAVLP
         ::  .::      : :  : :. .  .  .::.    .  :..  :. :.. .     
CCDS18 ISSGVGDSESEGLNSPVKVARKRKRMVTGNGSLKRKSSRKETPSATKQATSISSETKNTL
       280       290       300       310       320       330       

          170       180       190       200            210         
pF1KE4 KCTDFDDISLLHAKNAVSSEDSKRQINQKDTTLFDLSQFGSSNT-----SHENLQKTASK
       .  .  . :  .:. . ...::.:       ::  :..    .      .: ... ..  
CCDS18 RAFSAPQNSESQAHVSGGGDDSSRPTVWYHETLEWLKEEKRRDEHRRRPDHPDFDASTLY
       340       350       360       370       380       390       

     220       230       240       250       260       270         
pF1KE4 SANKRSKSIYTPLELQYIEMKQQHKDAVLCVECGYKYRFFGEDAEIAARELNIYCHLDHN
         .   .:  ::   .. ..:.:. : :.: . :  :...  :: :.. ::..   .  :
CCDS18 VPEDFLNSC-TPGMRKWWQIKSQNFDLVICYKVGKFYELYHMDALIGVSELGLV-FMKGN
       400        410       420       430       440       450      

     280       290       300       310       320       330         
pF1KE4 FMTASIPTHRLFVHVRRLVAKGYKVGVVKQTETAALKAIGDNRSSLFSRKLTALYTKSTL
       .  ...:   .  .   :: :::::. :.::::  .    . :     ::.. .   . .
CCDS18 WAHSGFPEIAFGRYSDSLVQKGYKVARVEQTETPEMM---EAR----CRKMAHISKYDRV
         460       470       480       490              500        

     340        350        360       370       380       390       
pF1KE4 IGEDVNPLI-KLDDAVNVDEI-MTDTSTSYLLCISENKENVRDKKKGNIFIGIVGVQPAT
       . ...  .: :  .. .: :   ... ..::: ..:..:.   . ..    :.  :. . 
CCDS18 VRREICRIITKGTQTYSVLEGDPSENYSKYLLSLKEKEEDSSGHTRA---YGVCFVDTSL
      510       520       530       540       550          560     

       400       410       420       430        440       450      
pF1KE4 GEVVFDSFQDSASRSELETRMSSLQPVELLLPSA-LSEQTEALIHRATSVSVQDDRIRVE
       :.  . .:.:.   :...: ..   ::..:. .. ::..:..... . : :.:.  :   
CCDS18 GKFFIGQFSDDRHCSRFRTLVAHYPPVQVLFEKGNLSKETKTILKSSLSCSLQEGLI---
         570       580       590       600       610       620     

        460       470            480       490                  500
pF1KE4 RMDNIYFEYSHAFQAVTE---FYAK--DTVDIKGSQIISGI------VNL---EKP--VI
          . ... :...... :   :  :  : . .   :...:.      ..:   ::   ..
CCDS18 -PGSQFWDASKTLRTLLEEEYFREKLSDGIGVMLPQVLKGMTSESDSIGLTPGEKSELAL
             630       640       650       660       670       680 

              510       520                        530       540   
pF1KE4 CSLAAIIKYLKEFNLEKMLSKPENFKQ-----------------LSSKMEFMTINGTTLR
        .:.. . :::.  ... : .  ::..                 ... .. :.....:: 
CCDS18 SALGGCVFYLKKCLIDQELLSMANFEEYIPLDSDTVSTTRSGAIFTKAYQRMVLDAVTLN
             690       700       710       720       730       740 

           550       560       570       580       590       600   
pF1KE4 NLEILQNQTDMKTKGSLLWVLDHTKTSFGRRKLKKWVTQPLLKLREINARLDAVSEVLHS
       ::::. : :. .:.:.::  .:  .: ::.: ::.:.  :: .   :: ::::. ...  
CCDS18 NLEIFLNGTNGSTEGTLLERVDTCHTPFGKRLLKQWLCAPLCNHYAINDRLDAIEDLMVV
             750       760       770       780       790       800 

           610       620       630              640       650      
pF1KE4 ESSVFGQIENHLRKLPDIERGLCSIYH--KKCSTQEF-----FLIVKTLYHLKS--EFQA
        ... ... . :.::::.:: : .:..  .  ..:.      ..  .: :  :.  .: .
CCDS18 PDKI-SEVVELLKKLPDLERLLSKIHNVGSPLKSQNHPDSRAIMYEETTYSKKKIIDFLS
              810       820       830       840       850       860

                       660       670               680       690   
pF1KE4 -------------IIPAVNSHIQSDLLRTVIL--------EIPELLSPVEHYLKILN-EQ
                    :.  : . ..: .:. ::         ..:.:   ....   .. :.
CCDS18 ALEGFKVMCKIIGIMEEVADGFKSKILKQVISLQTKNPEGRFPDLTVELNRWDTAFDHEK
              870       880       890       900       910       920

            700         710       720       730       740       750
pF1KE4 AAKVGDKTEL--FKDLSDFPLIKKRKDEIQGVIDEIRMHLQEIRKILKNPSAQYVTVSGQ
       : :.:  :    : .  :  :   :..: :....    .:.. :. .   .  :  .. .
CCDS18 ARKTGLITPKAGFDSDYDQALADIRENE-QSLLE----YLEKQRNRIGCRTIVYWGIGRN
              930       940        950           960       970     

               760       770       780       790          800      
pF1KE4 EFMIEI-KNSAVSCIPTDWVKVGSTKAVSRFHSPFIVENYRHL---NQLREQLVLDCSAE
       ....:: .: ..  .: ..   .. :. .:. .  : ..  .:   .. :.  . ::  .
CCDS18 RYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKLANLINAEERRDVSLKDCMRR
         980       990      1000      1010      1020      1030     

        810       820       830       840         850           860
pF1KE4 WLDFLEKFSEHYHSLCKAVHHLATVDCIFSLAKVAKQGD--YCRPTV--QEERK--IVIK
          .. .:...:..  .::. .:..: .. ::. .. ::  .:::..   :.    . .:
CCDS18 ---LFYNFDKNYKDWQSAVECIAVLDVLLCLANYSRGGDGPMCRPVILLPEDTPPFLELK
           1040      1050      1060      1070      1080      1090  

               870       880       890              900       910  
pF1KE4 NGRHPVID-VLLGEQDQYVPNNTDLSEDSER-------VMIITGPNMGGKSSYIKQVALI
       ..::: :  ...:  :...::.  .. . :.        ...:::::::::. ..:..:.
CCDS18 GSRHPCITKTFFG--DDFIPNDILIGCEEEEQENGKAYCVLVTGPNMGGKSTLMRQAGLL
           1100        1110      1120      1130      1140      1150

            920       930       940       950       960       970  
pF1KE4 TIMAQIGSYVPAEEATIGIVDGIFTRMGAADNIYKGRSTFMEELTDTAEIIRKATSQSLV
       ..:::.: :::::   .  .: .:::.::.: :..:.:::. ::..:: :. .::..:::
CCDS18 AVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFFVELSETASILMHATAHSLV
             1160      1170      1180      1190      1200      1210

            980       990      1000      1010      1020        1030
pF1KE4 ILDELGRGTSTHDGIAIAYATLEYFIRDVKSLTLFVTHYPPVCELEKNYSHQVGNY--HM
       ..:::::::.: :: ::: :... . . .:  ::: :::  . :   .::..:.    ::
CCDS18 LVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHSLVE---DYSQNVAVRLGHM
             1220      1230      1240      1250         1260       

             1040      1050      1060      1070      1080      1090
pF1KE4 GFLVSEDESKLDPGTAEQVPDFVTFLYQITRGIAARSYGLNVAKLADVPGEILKKAAHKS
       . .: :.: . ::.      . .::::.. .:   .:::.:.:.::..: :...:. .:.
CCDS18 ACMV-ENECE-DPSQ-----ETITFLYKFIKGACPKSYGFNAARLANLPEEVIQKGHRKA
      1270        1280           1290      1300      1310      1320

             1100      1110      1120      1130       
pF1KE4 KELEGLINTKRKRLKYFAKLWTMHNAQDLQKWTEEFNMEETQTSLLH
       .:.: . .. :                                    
CCDS18 REFEKMNQSLRLFREVCLASERSTVDAEAVHKLLTLIKEL       
             1330      1340      1350      1360       

>>CCDS4720.1 MSH5 gene_id:4439|Hs108|chr6                 (834 aa)
 initn: 484 init1: 415 opt: 587  Z-score: 448.1  bits: 94.3 E(32554): 1.2e-18
Smith-Waterman score: 653; 28.2% identity (60.1% similar) in 616 aa overlap (547-1135:241-818)

        520       530       540       550       560       570      
pF1KE4 KMLSKPENFKQLSSKMEFMTINGTTLRNLEILQNQTDMKTKGSLLWVLDHTKTSFGRRKL
                                     . .  . .:   ::. .:.. . ..:.. :
CCDS47 FKKFMLTHLVNIDQDTYSVLQIFKSESHPSVYKVASGLKEGLSLFGILNRCHCKWGEKLL
              220       230       240       250       260       270

        580       590       600       610           620       630  
pF1KE4 KKWVTQPLLKLREINARLDAVSEVLHSESSVFGQIEN----HLRKLPDIERGLCSIYHKK
       . : :.:   : :...:::...  :  ..  ..:. .    :....: : . . .. : :
CCDS47 RLWFTRPTHDLGELSSRLDVIQFFLLPQNLDMAQMLHRLLGHIKNVPLILKRM-KLSHTK
              280       290       300       310       320          

            640       650       660        670       680        690
pF1KE4 CSTQEFFLIVKTLYHLKSEFQAIIPAVNSHIQS-DLLRTVILEIPELLSPVEHYL-KILN
        :  .  .. ::.:   : . ..  :  :  :: .:.: .  :. . :  .   . :...
CCDS47 VSDWQ--VLYKTVY---SAL-GLRDACRSLPQSIQLFRDIAQEFSDDLHHIASLIGKVVD
     330         340           350       360       370       380   

              700       710       720           730       740      
pF1KE4 EQAAKVGDKTELFKDLSDFPLIKKRKDEIQGV---IDEI-RMHLQEIRKILKNPSAQYVT
        ... . ..  .. ...  : : ..: ...:.   . :. : .:... . . . :. :. 
CCDS47 FEGSLAENRFTVLPNID--PEIDEKKRRLMGLPSFLTEVARKELENLDSRIPSCSVIYIP
           390       400         410       420       430       440 

        750       760       770       780       790       800      
pF1KE4 VSGQEFMIEIKNSAVSCIPTDWVKVGSTKAVSRFHSPFIVENYRHLNQLREQLV------
       . :  :.. :       .:.  :.... . .. .   :. :.  :  . : . .      
CCDS47 LIG--FLLSIPR-----LPS-MVEASDFE-INGLDFMFLSEEKLHYRSARTKELDALLGD
               450             460        470       480       490  

              810       820            830        840       850    
pF1KE4 LDCSAEWLDFLEKFSEHYHSLCKA-----VHHLAT-VDCIFSLAKVAKQGDYCRPTVQEE
       : :  .  . :  .. . . : .:     :  ::. .: ...::..:..  : ::  . .
CCDS47 LHCEIRDQETLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALASAARDYGYSRPRYSPQ
            500       510       520       530       540       550  

           860       870       880       890       900       910   
pF1KE4 R-KIVIKNGRHPVIDVLLGEQDQYVPNNTDLSEDSERVMIITGPNMGGKSSYIKQVALIT
          . :.:::::....       .:::.:. . :. :: .::::: .::: :.:::.:::
CCDS47 VLGVRIQNGRHPLMELC---ARTFVPNSTECGGDKGRVKVITGPNSSGKSIYLKQVGLIT
            560          570       580       590       600         

           920       930       940       950       960       970   
pF1KE4 IMAQIGSYVPAEEATIGIVDGIFTRMGAADNIYKGRSTFMEELTDTAEIIRKATSQSLVI
       .:: .::.:::::: :: ::.::::. . ..:  : :::: .:...:. . .::.::::.
CCDS47 FMALVGSFVPAEEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQVAKAVNNATAQSLVL
     610       620       630       640       650       660         

           980       990       1000       1010      1020      1030 
pF1KE4 LDELGRGTSTHDGIAIAYATLEYFI-RDVKSLTLFV-THYPPVCELEKNYSHQVGNYHMG
       .::.:.::.: ::.:.  :.:.... :      .:: :..  . .:.           .:
CCDS47 IDEFGKGTNTVDGLALLAAVLRHWLARGPTCPHIFVATNFLSLVQLQL--------LPQG
     670       680       690       700       710               720 

            1040      1050      1060      1070      1080      1090 
pF1KE4 FLVSEDESKLDPGTAEQVPDFVTFLYQITRGIAARSYGLNVAKLADVPGEILKKAAHKSK
        ::    . :   : :.  :.: :.::. .:.:  :.. ..:  : .: ...     ..:
CCDS47 PLV----QYLTMETCEDGNDLV-FFYQVCEGVAKASHASHTAAQAGLPDKLVA----RGK
                 730        740       750       760           770  

            1100        1110      1120      1130                   
pF1KE4 ELEGLINTKR--KRLKYFAKLWTMHNAQDLQKWTEEFNMEETQTSLLH            
       :.  :: . .  : .: . :   :.: : :     ....:. . .:              
CCDS47 EVSDLIRSGKPIKPVKDLLKKNQMENCQTLVDKFMKLDLEDPNLDLNVFMSQEVLPAATS
            780       790       800       810       820       830  

CCDS47 IL
         

>>CCDS34409.2 MSH5 gene_id:4439|Hs108|chr6                (822 aa)
 initn: 462 init1: 293 opt: 575  Z-score: 439.2  bits: 92.7 E(32554): 3.9e-18
Smith-Waterman score: 581; 29.2% identity (62.0% similar) in 476 aa overlap (547-998:258-712)

        520       530       540       550       560       570      
pF1KE4 KMLSKPENFKQLSSKMEFMTINGTTLRNLEILQNQTDMKTKGSLLWVLDHTKTSFGRRKL
                                     . .  . .:   ::. .:.. . ..:.. :
CCDS34 FKKFMLTHLVNIDQDTYSVLQIFKSESHPSVYKVASGLKEGLSLFGILNRCHCKWGEKLL
       230       240       250       260       270       280       

        580       590       600       610           620       630  
pF1KE4 KKWVTQPLLKLREINARLDAVSEVLHSESSVFGQIEN----HLRKLPDIERGLCSIYHKK
       . : :.:   : :...:::...  :  ..  ..:. .    :....: : . . .. : :
CCDS34 RLWFTRPTHDLGELSSRLDVIQFFLLPQNLDMAQMLHRLLGHIKNVPLILKRM-KLSHTK
       290       300       310       320       330       340       

            640       650       660        670       680        690
pF1KE4 CSTQEFFLIVKTLYHLKSEFQAIIPAVNSHIQS-DLLRTVILEIPELLSPVEHYL-KILN
        :  .  .. ::.:   : . ..  :  :  :: .:.: .  :. . :  .   . :...
CCDS34 VSDWQ--VLYKTVY---SAL-GLRDACRSLPQSIQLFRDIAQEFSDDLHHIASLIGKVVD
        350            360        370       380       390       400

              700       710       720           730       740      
pF1KE4 EQAAKVGDKTELFKDLSDFPLIKKRKDEIQGV---IDEI-RMHLQEIRKILKNPSAQYVT
        ... . ..  .. ...  : : ..: ...:.   . :. : .:... . . . :. :. 
CCDS34 FEGSLAENRFTVLPNID--PEIDEKKRRLMGLPSFLTEVARKELENLDSRIPSCSVIYIP
              410         420       430       440       450        

        750       760       770       780       790       800      
pF1KE4 VSGQEFMIEIKNSAVSCIPTDWVKVGSTKAVSRFHSPFIVENYRHLNQLREQLV------
       . :  :.. :       .:.  .  .:   .. .   :. :.  :  . : . .      
CCDS34 LIG--FLLSIPR-----LPS--MVEASDFEINGLDFMFLSEEKLHYRSARTKELDALLGD
      460              470         480       490       500         

              810       820            830        840       850    
pF1KE4 LDCSAEWLDFLEKFSEHYHSLCKA-----VHHLAT-VDCIFSLAKVAKQGDYCRPTVQEE
       : :  .  . :  .. . . : .:     :  ::. .: ...::..:..  : ::  . .
CCDS34 LHCEIRDQETLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALASAARDYGYSRPRYSPQ
     510       520       530       540       550       560         

           860       870       880       890       900       910   
pF1KE4 R-KIVIKNGRHPVIDVLLGEQDQYVPNNTDLSEDSERVMIITGPNMGGKSSYIKQVALIT
          . :.:::::....       .:::.:. . :. :: .::::: .::: :.:::.:::
CCDS34 VLGVRIQNGRHPLMELC---ARTFVPNSTECGGDKGRVKVITGPNSSGKSIYLKQVGLIT
     570       580          590       600       610       620      

           920       930       940       950        960       970  
pF1KE4 IMAQIGSYVPAEEATIGIVDGIFTRMGAADNIYKGRSTFMEELTD-TAEIIRKATSQSLV
       .:: .::.:::::: :: ::.::::. . ..:  : :::: .:.. .:. . .::.::::
CCDS34 FMALVGSFVPAEEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQQVAKAVNNATAQSLV
        630       640       650       660       670       680      

            980       990      1000      1010      1020      1030  
pF1KE4 ILDELGRGTSTHDGIAIAYATLEYFIRDVKSLTLFVTHYPPVCELEKNYSHQVGNYHMGF
       ..::.:.::.: ::.:.  :.:....                                  
CCDS34 LIDEFGKGTNTVDGLALLAAVLRHWLARGPTCPHIFVATNFLSLVQLQLLPQGPLVQYLT
        690       700       710       720       730       740      

>>CCDS34410.1 MSH5 gene_id:4439|Hs108|chr6                (835 aa)
 initn: 470 init1: 293 opt: 575  Z-score: 439.0  bits: 92.7 E(32554): 3.9e-18
Smith-Waterman score: 641; 28.2% identity (60.0% similar) in 617 aa overlap (547-1135:241-819)

        520       530       540       550       560       570      
pF1KE4 KMLSKPENFKQLSSKMEFMTINGTTLRNLEILQNQTDMKTKGSLLWVLDHTKTSFGRRKL
                                     . .  . .:   ::. .:.. . ..:.. :
CCDS34 FKKFMLTHLVNIDQDTYSVLQIFKSESHPSVYKVASGLKEGLSLFGILNRCHCKWGEKLL
              220       230       240       250       260       270

        580       590       600       610           620       630  
pF1KE4 KKWVTQPLLKLREINARLDAVSEVLHSESSVFGQIEN----HLRKLPDIERGLCSIYHKK
       . : :.:   : :...:::...  :  ..  ..:. .    :....: : . . .. : :
CCDS34 RLWFTRPTHDLGELSSRLDVIQFFLLPQNLDMAQMLHRLLGHIKNVPLILKRM-KLSHTK
              280       290       300       310       320          

            640       650       660        670       680        690
pF1KE4 CSTQEFFLIVKTLYHLKSEFQAIIPAVNSHIQS-DLLRTVILEIPELLSPVEHYL-KILN
        :  .  .. ::.:   : . ..  :  :  :: .:.: .  :. . :  .   . :...
CCDS34 VSDWQ--VLYKTVY---SAL-GLRDACRSLPQSIQLFRDIAQEFSDDLHHIASLIGKVVD
     330         340           350       360       370       380   

              700       710       720           730       740      
pF1KE4 EQAAKVGDKTELFKDLSDFPLIKKRKDEIQGV---IDEI-RMHLQEIRKILKNPSAQYVT
        ... . ..  .. ...  : : ..: ...:.   . :. : .:... . . . :. :. 
CCDS34 FEGSLAENRFTVLPNID--PEIDEKKRRLMGLPSFLTEVARKELENLDSRIPSCSVIYIP
           390       400         410       420       430       440 

        750       760       770       780       790       800      
pF1KE4 VSGQEFMIEIKNSAVSCIPTDWVKVGSTKAVSRFHSPFIVENYRHLNQLREQLV------
       . :  :.. :       .:.  :.... . .. .   :. :.  :  . : . .      
CCDS34 LIG--FLLSIPR-----LPS-MVEASDFE-INGLDFMFLSEEKLHYRSARTKELDALLGD
               450             460        470       480       490  

              810       820            830        840       850    
pF1KE4 LDCSAEWLDFLEKFSEHYHSLCKA-----VHHLAT-VDCIFSLAKVAKQGDYCRPTVQEE
       : :  .  . :  .. . . : .:     :  ::. .: ...::..:..  : ::  . .
CCDS34 LHCEIRDQETLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALASAARDYGYSRPRYSPQ
            500       510       520       530       540       550  

           860       870       880       890       900       910   
pF1KE4 R-KIVIKNGRHPVIDVLLGEQDQYVPNNTDLSEDSERVMIITGPNMGGKSSYIKQVALIT
          . :.:::::....       .:::.:. . :. :: .::::: .::: :.:::.:::
CCDS34 VLGVRIQNGRHPLMELC---ARTFVPNSTECGGDKGRVKVITGPNSSGKSIYLKQVGLIT
            560          570       580       590       600         

           920       930       940       950        960       970  
pF1KE4 IMAQIGSYVPAEEATIGIVDGIFTRMGAADNIYKGRSTFMEELTD-TAEIIRKATSQSLV
       .:: .::.:::::: :: ::.::::. . ..:  : :::: .:.. .:. . .::.::::
CCDS34 FMALVGSFVPAEEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQQVAKAVNNATAQSLV
     610       620       630       640       650       660         

            980       990       1000       1010      1020      1030
pF1KE4 ILDELGRGTSTHDGIAIAYATLEYFI-RDVKSLTLFV-THYPPVCELEKNYSHQVGNYHM
       ..::.:.::.: ::.:.  :.:.... :      .:: :..  . .:.           .
CCDS34 LIDEFGKGTNTVDGLALLAAVLRHWLARGPTCPHIFVATNFLSLVQLQL--------LPQ
     670       680       690       700       710               720 

             1040      1050      1060      1070      1080      1090
pF1KE4 GFLVSEDESKLDPGTAEQVPDFVTFLYQITRGIAARSYGLNVAKLADVPGEILKKAAHKS
       : ::    . :   : :.  :.: :.::. .:.:  :.. ..:  : .: ...     ..
CCDS34 GPLV----QYLTMETCEDGNDLV-FFYQVCEGVAKASHASHTAAQAGLPDKLVA----RG
                 730       740        750       760       770      

             1100        1110      1120      1130                  
pF1KE4 KELEGLINTKR--KRLKYFAKLWTMHNAQDLQKWTEEFNMEETQTSLLH           
       ::.  :: . .  : .: . :   :.: : :     ....:. . .:             
CCDS34 KEVSDLIRSGKPIKPVKDLLKKNQMENCQTLVDKFMKLDLEDPNLDLNVFMSQEVLPAAT
            780       790       800       810       820       830  

CCDS34 SIL
          




1137 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Mon Nov  7 18:16:43 2016 done: Mon Nov  7 18:16:43 2016
 Total Scan time:  4.630 Total Display time:  0.400

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com