Result of FASTA (ccds) for pF1KB7694
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB7694, 413 aa
  1>>>pF1KB7694 413 - 413 aa - 413 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 8.2028+/-0.000762; mu= 5.9120+/- 0.046
 mean_var=176.4014+/-36.795, 0's: 0 Z-trim(115.2): 18  B-trim: 0 in 0/52
 Lambda= 0.096566
 statistics sampled from 15692 (15707) to 15692 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.799), E-opt: 0.2 (0.482), width:  16
 Scan time:  3.060

The best scores are:                                      opt bits E(32554)
CCDS14305.1 GATA1 gene_id:2623|Hs108|chrX          ( 413) 2847 408.2 7.4e-114
CCDS3049.1 GATA2 gene_id:2624|Hs108|chr3           ( 480)  830 127.2 3.2e-29
CCDS31143.1 GATA3 gene_id:2625|Hs108|chr10         ( 444)  789 121.5 1.6e-27
CCDS7083.1 GATA3 gene_id:2625|Hs108|chr10          ( 443)  781 120.4 3.4e-27
CCDS13499.1 GATA5 gene_id:140628|Hs108|chr20       ( 397)  701 109.2 7.1e-24
CCDS78303.1 GATA4 gene_id:2626|Hs108|chr8          ( 443)  694 108.3 1.5e-23
CCDS78304.1 GATA4 gene_id:2626|Hs108|chr8          ( 236)  687 107.1 1.8e-23
CCDS5983.1 GATA4 gene_id:2626|Hs108|chr8           ( 442)  691 107.8   2e-23
CCDS11872.1 GATA6 gene_id:2627|Hs108|chr18         ( 595)  639 100.7 3.9e-21
CCDS46903.1 GATA2 gene_id:2624|Hs108|chr3          ( 466)  440 72.9 7.1e-13


>>CCDS14305.1 GATA1 gene_id:2623|Hs108|chrX               (413 aa)
 initn: 2847 init1: 2847 opt: 2847  Z-score: 2157.6  bits: 408.2 E(32554): 7.4e-114
Smith-Waterman score: 2847; 100.0% identity (100.0% similar) in 413 aa overlap (1-413:1-413)

               10        20        30        40        50        60
pF1KB7 MEFPGLGSLGTSEPLPQFVDPALVSSTPESGVFFPSGPEGLDAAASSTAPSTATAAAAAL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 MEFPGLGSLGTSEPLPQFVDPALVSSTPESGVFFPSGPEGLDAAASSTAPSTATAAAAAL
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB7 AYYRDAEAYRHSPVFQVYPLLNCMEGIPGGSPYAGWAYGKTGLYPASTVCPTREDSPPQA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 AYYRDAEAYRHSPVFQVYPLLNCMEGIPGGSPYAGWAYGKTGLYPASTVCPTREDSPPQA
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB7 VEDLDGKGSTSFLETLKTERLSPDLLTLGPALPSSLPVPNSAYGGPDFSSTFFSPTGSPL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 VEDLDGKGSTSFLETLKTERLSPDLLTLGPALPSSLPVPNSAYGGPDFSSTFFSPTGSPL
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB7 NSAAYSSPKLRGTLPLPPCEARECVNCGATATPLWRRDRTGHYLCNACGLYHKMNGQNRP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 NSAAYSSPKLRGTLPLPPCEARECVNCGATATPLWRRDRTGHYLCNACGLYHKMNGQNRP
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB7 LIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNASGDPVCNACGLYYKLHQVNRPLTMRKD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 LIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNASGDPVCNACGLYYKLHQVNRPLTMRKD
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB7 GIQTRNRKASGKGKKKRGSSLGGTGAAEGPAGGFMVVAGGSGSGNCGEVASGLTLGPPGT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 GIQTRNRKASGKGKKKRGSSLGGTGAAEGPAGGFMVVAGGSGSGNCGEVASGLTLGPPGT
              310       320       330       340       350       360

              370       380       390       400       410   
pF1KB7 AHLYQGLGPVVLSGPVSHLMPFPGPLLGSPTGSFPTGPMPPTTSTTVVAPLSS
       :::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 AHLYQGLGPVVLSGPVSHLMPFPGPLLGSPTGSFPTGPMPPTTSTTVVAPLSS
              370       380       390       400       410   

>>CCDS3049.1 GATA2 gene_id:2624|Hs108|chr3                (480 aa)
 initn: 956 init1: 724 opt: 830  Z-score: 638.0  bits: 127.2 E(32554): 3.2e-29
Smith-Waterman score: 846; 43.1% identity (61.3% similar) in 408 aa overlap (16-407:115-479)

                              10        20          30        40   
pF1KB7                MEFPGLGSLGTSEPLPQFVDPALVSSTP--ESGVFFPSGPEGLDA
                                     :  :.:   :.::   :..  :.:: ..  
CCDS30 CRPHLLHSPGLPWLDGGKAALSAAAAHHHNPWTVSP--FSKTPLHPSAAGGPGGPLSVYP
           90       100       110       120         130       140  

            50        60        70        80        90       100   
pF1KB7 AASSTAPSTATAAAAALAYYRDAEAYRHSPVFQVYPLLNCMEGIPGGSPYAGWAYGKTGL
       .:.. . . . ...:.:.    . :.  : .:  .:     :  :  :  .: :      
CCDS30 GAGGGSGGGSGSSVASLT---PTAAHSGSHLFG-FPPTPPKEVSPDPST-TGAAS-----
            150       160          170        180        190       

           110       120        130       140          150         
pF1KB7 YPASTVCPTREDSPPQAVEDLDG-KGSTSFLETLKTER---LSPDLLTLGPALPSSLPVP
        :::.   .   :  .. :: :: : ..:. :..: :    : : : :.:    .  :.:
CCDS30 -PASS---SAGGSAARG-EDKDGVKYQVSLTESMKMESGSPLRPGLATMGTQPATHHPIP
                200        210       220       230       240       

     160           170       180       190        200       210    
pF1KB7 NSAYGGP----DFSSTFFSPTGSPLNSAAYSSPKLRGTLPLPPC-EARECVNCGATATPL
       .     :    :.:: .: : :   . :.  .:: :.      : :.:::::::::::::
CCDS30 TYPSYVPAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKAR--SCSEGRECVNCGATATPL
       250       260       270       280         290       300     

          220       230       240       250       260       270    
pF1KB7 WRRDRTGHYLCNACGLYHKMNGQNRPLIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNAS
       :::: :::::::::::::::::::::::.::.:: ...:::: :.::::::::::::::.
CCDS30 WRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTCCANCQTTTTTLWRRNAN
         310       320       330       340       350       360     

          280       290       300       310        320       330   
pF1KB7 GDPVCNACGLYYKLHQVNRPLTMRKDGIQTRNRKASGKGKK-KRGSSLGGTGAAEGPAGG
       :::::::::::::::.:::::::.:.:::::::: :.:.:: :.:            :  
CCDS30 GDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKG------------AEC
         370       380       390       400       410               

           340       350       360       370          380       390
pF1KB7 FMVVAGGSGSGNCGEVASGLTLGPPGTAHLYQGLGPVVLSGPVSH---LMPFPGPLLGSP
       :  ..      .: .  :.    : ..: :   ..::    : ::   ..: : :.   :
CCDS30 FEELS------KCMQEKSS----PFSAAALAGHMAPVGHLPPFSHSGHILPTPTPI--HP
                 420           430       440       450         460 

               400       410   
pF1KB7 TGSFPTG-PMPPTTSTTVVAPLSS
       ..:.  : : : .  :..      
CCDS30 SSSLSFGHPHPSSMVTAMG     
             470       480     

>>CCDS31143.1 GATA3 gene_id:2625|Hs108|chr10              (444 aa)
 initn: 777 init1: 725 opt: 789  Z-score: 607.6  bits: 121.5 E(32554): 1.6e-27
Smith-Waterman score: 795; 41.2% identity (61.2% similar) in 381 aa overlap (51-408:105-443)

               30        40        50        60        70          
pF1KB7 PALVSSTPESGVFFPSGPEGLDAAASSTAPSTATAAAAALAYYRDAEAYRHSP-VFQVYP
                                     :  ::.   :. .  .  .. ::  ..:::
CCDS31 YPPTHHGSQVCRPPLLHGSLPWLDGGKALGSHHTASPWNLSPFSKTSIHHGSPGPLSVYP
           80        90       100       110       120       130    

      80        90         100       110       120       130       
pF1KB7 LLNCMEGIPGG--SPYAGWAYGKTGLYPASTVCPTREDSPPQAVEDLDGKGSTSFLETLK
         .   .. ::  ::.  ...  :   : . : :    : : ..    :..  .  : ::
CCDS31 PASS-SSLSGGHASPHL-FTFPPT---PPKDVSPDPSLSTPGSA----GSARQDEKECLK
           140       150           160       170           180     

       140                   150       160         170             
pF1KB7 TERLSPD------------LLTLGPALPSSLPVPNSAYGG--PDFSSTFFSPT----GSP
        .   ::            . .:: :  ::   : ..:    :..:: .: :.    :::
CCDS31 YQVPLPDSMKLESSHSRGSMTALGGA-SSSTHHPITTYPPYVPEYSSGLFPPSSLLGGSP
         190       200       210        220       230       240    

     180       190       200       210       220       230         
pF1KB7 LNSAAYSSPKLRGTLPLPPCEARECVNCGATATPLWRRDRTGHYLCNACGLYHKMNGQNR
        . .  : :: :..      :.:::::::::.::::::: ::::::::::::::::::::
CCDS31 TGFGCKSRPKARSST-----EGRECVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNR
          250            260       270       280       290         

     240       250       260       270       280       290         
pF1KB7 PLIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNASGDPVCNACGLYYKLHQVNRPLTMRK
       :::.::.:: ...::::.:.::::::::::::::.:::::::::::::::..::::::.:
CCDS31 PLIKPKRRLSAARRAGTSCANCQTTTTTLWRRNANGDPVCNACGLYYKLHNINRPLTMKK
     300       310       320       330       340       350         

     300       310         320       330       340       350       
pF1KB7 DGIQTRNRKASGKGKK--KRGSSLGGTGAAEGPAGGFMVVAGGSGSGNCGEVASGLTLGP
       .:::::::: :.:.::  :  .::      . : ..                    ...:
CCDS31 EGIQTRNRKMSSKSKKCKKVHDSL-----EDFPKNS--------------------SFNP
     360       370       380            390                        

       360       370       380       390       400       410   
pF1KB7 PGTAHLYQGLGPVVLSGPVSHLMPFPGPLLGSPTGSFPTGPMPPTTSTTVVAPLSS
        . .. ...:. .   .  ::..  : :.   : .:.  ::  :.. .:..     
CCDS31 AALSRHMSSLSHISPFSHSSHMLTTPTPM--HPPSSLSFGPHHPSSMVTAMG    
          400       410       420         430       440        

>>CCDS7083.1 GATA3 gene_id:2625|Hs108|chr10               (443 aa)
 initn: 771 init1: 719 opt: 781  Z-score: 601.6  bits: 120.4 E(32554): 3.4e-27
Smith-Waterman score: 787; 40.9% identity (60.9% similar) in 381 aa overlap (51-408:105-442)

               30        40        50        60        70          
pF1KB7 PALVSSTPESGVFFPSGPEGLDAAASSTAPSTATAAAAALAYYRDAEAYRHSP-VFQVYP
                                     :  ::.   :. .  .  .. ::  ..:::
CCDS70 YPPTHHGSQVCRPPLLHGSLPWLDGGKALGSHHTASPWNLSPFSKTSIHHGSPGPLSVYP
           80        90       100       110       120       130    

      80        90         100       110       120       130       
pF1KB7 LLNCMEGIPGG--SPYAGWAYGKTGLYPASTVCPTREDSPPQAVEDLDGKGSTSFLETLK
         .   .. ::  ::.  ...  :   : . : :    : : ..    :..  .  : ::
CCDS70 PASS-SSLSGGHASPHL-FTFPPT---PPKDVSPDPSLSTPGSA----GSARQDEKECLK
           140       150           160       170           180     

       140                   150       160         170             
pF1KB7 TERLSPD------------LLTLGPALPSSLPVPNSAYGG--PDFSSTFFSPT----GSP
        .   ::            . .:: :  ::   : ..:    :..:: .: :.    :::
CCDS70 YQVPLPDSMKLESSHSRGSMTALGGA-SSSTHHPITTYPPYVPEYSSGLFPPSSLLGGSP
         190       200       210        220       230       240    

     180       190       200       210       220       230         
pF1KB7 LNSAAYSSPKLRGTLPLPPCEARECVNCGATATPLWRRDRTGHYLCNACGLYHKMNGQNR
        . .  : :: :..       .:::::::::.::::::: ::::::::::::::::::::
CCDS70 TGFGCKSRPKARSST------GRECVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNR
          250             260       270       280       290        

     240       250       260       270       280       290         
pF1KB7 PLIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNASGDPVCNACGLYYKLHQVNRPLTMRK
       :::.::.:: ...::::.:.::::::::::::::.:::::::::::::::..::::::.:
CCDS70 PLIKPKRRLSAARRAGTSCANCQTTTTTLWRRNANGDPVCNACGLYYKLHNINRPLTMKK
      300       310       320       330       340       350        

     300       310         320       330       340       350       
pF1KB7 DGIQTRNRKASGKGKK--KRGSSLGGTGAAEGPAGGFMVVAGGSGSGNCGEVASGLTLGP
       .:::::::: :.:.::  :  .::      . : ..                    ...:
CCDS70 EGIQTRNRKMSSKSKKCKKVHDSL-----EDFPKNS--------------------SFNP
      360       370       380                                390   

       360       370       380       390       400       410   
pF1KB7 PGTAHLYQGLGPVVLSGPVSHLMPFPGPLLGSPTGSFPTGPMPPTTSTTVVAPLSS
        . .. ...:. .   .  ::..  : :.   : .:.  ::  :.. .:..     
CCDS70 AALSRHMSSLSHISPFSHSSHMLTTPTPM--HPPSSLSFGPHHPSSMVTAMG    
           400       410       420         430       440       

>>CCDS13499.1 GATA5 gene_id:140628|Hs108|chr20            (397 aa)
 initn: 720 init1: 633 opt: 701  Z-score: 542.1  bits: 109.2 E(32554): 7.1e-24
Smith-Waterman score: 721; 39.8% identity (58.7% similar) in 402 aa overlap (4-400:26-378)

                                     10        20          30      
pF1KB7                       MEFPGLGSLGTSEPLPQFVDPALVSS--TPESGVFFPS
                                :: ::       :.:: :: : :  .  ::   ::
CCDS13 MYQSLALAASPRQAAYADSGSFLHAPGAGS-------PMFVPPARVPSMLSYLSGCE-PS
               10        20        30               40        50   

         40        50        60        70        80        90      
pF1KB7 GPEGLDAAASSTAPSTATAAAAALAYYRDAEAYRHSPVFQVYPLLNCMEGIPGGSPYAGW
        :.  . ::     .:::: ..:..         : :   ..:. .   : ::..  :: 
CCDS13 -PQPPELAARPGWAQTATADSSAFGPGSPHPPAAHPPGATAFPFAHSPSG-PGSGGSAG-
              60        70        80        90       100           

        100       110       120       130       140       150      
pF1KB7 AYGKTGLYPASTVCPTREDSPPQAVEDLDGKGSTSFLETLKTERLSPDLLTLGPALPSSL
         :. :    ... : .. . :     :    .::.  :  .  .:::            
CCDS13 --GRDGSAYQGALLPREQFAAP-----LGRPVGTSYSATYPA-YVSPD------------
       110       120            130       140                      

        160       170       180       190       200       210      
pF1KB7 PVPNSAYGGPDFSSTFFSPTGSPLNSAAYSSPKLRGTLPLPPCEARECVNCGATATPLWR
        : .:  .:: :... .   : :    .. :  :.      : :.:::::::: .:::::
CCDS13 -VAQSWTAGP-FDGSVLH--GLPGRRPTFVSDFLEEF----PGEGRECVNCGALSTPLWR
      150        160         170       180           190       200 

        220       230       240       250       260       270      
pF1KB7 RDRTGHYLCNACGLYHKMNGQNRPLIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNASGD
       :: ::::::::::::::::: ::::.::.:::  :.:::  ::::.::.:::::::. :.
CCDS13 RDGTGHYLCNACGLYHKMNGVNRPLVRPQKRLSSSRRAGLCCTNCHTTNTTLWRRNSEGE
             210       220       230       240       250       260 

        280       290       300       310       320       330      
pF1KB7 PVCNACGLYYKLHQVNRPLTMRKDGIQTRNRKASGKGKKKRGSSLGGTGAAEGPAGGFMV
       :::::::::.::: : :::.:.:..::::.:: .  .:  :::: .  .:. .:..    
CCDS13 PVCNACGLYMKLHGVPRPLAMKKESIQTRKRKPKTIAKA-RGSSGSTRNASASPSA----
             270       280       290       300        310          

        340       350         360       370        380       390   
pF1KB7 VAGGSGSGNCGEVASGLTLGP--PGTAHLYQGLGPVVLSGPVSHL-MPFPGPLLGSPTGS
       ::. ..:.  ...  .:. .:  :: .   :. :    :   .:: . :    .. :.  
CCDS13 VASTDSSAATSKAKPSLA-SPVCPGPSMAPQASGQEDDSLAPGHLEFKFEPEDFAFPS--
        320       330        340       350       360       370     

           400       410         
pF1KB7 FPTGPMPPTTSTTVVAPLSS      
         :.: :                   
CCDS13 --TAPSPQAGLRGALRQEAWCALALA
             380       390       

>>CCDS78303.1 GATA4 gene_id:2626|Hs108|chr8               (443 aa)
 initn: 820 init1: 644 opt: 694  Z-score: 536.1  bits: 108.3 E(32554): 1.5e-23
Smith-Waterman score: 700; 36.4% identity (56.8% similar) in 426 aa overlap (39-404:3-423)

       10        20        30        40        50        60        
pF1KB7 LGTSEPLPQFVDPALVSSTPESGVFFPSGPEGLDAAASSTAPSTATAAAAALAYYRDAEA
                                     ..:  ::.   :  :  :..  :... : :
CCDS78                             MYQSLAMAANHGPPPGAYEAGGPGAFMHGAGA
                                           10        20        30  

       70        80               90       100       110        120
pF1KB7 YRHSPVFQVYPL-------LNCMEGIPGGSPYAGWAYGKTGLYPASTVCP-TREDSPPQA
          :::.   :        :. ..:  .::  .: . :..:   :: . : :.. ::  .
CCDS78 AS-SPVYVPTPRVPSSVLGLSYLQGGGAGSASGGASGGSSG-GAASGAGPGTQQGSPGWS
              40        50        60        70         80        90

                               130       140       150       160   
pF1KB7 VEDLDGK-----------------GSTSFLETLKTERLSPDLLTLGPALPSSLPVPNSAY
           ::                  :: .   .  . : .    . : :  ..: .    :
CCDS78 QAGADGAAYTPPPVSPRFSFPGTTGSLAAAAAAAAAREAAAYSSGGGAAGAGL-AGREQY
              100       110       120       130       140          

           170              180             190                    
pF1KB7 GGPDFSSTFFSP-------TGSPLNSAA------YSSPKLRGTLP--LPPC---------
       :   :.... ::       .:.   .::      ..:: :. .::    :          
CCDS78 GRAGFAGSYSSPYPAYMADVGASWAAAAAASAGPFDSPVLH-SLPGRANPAARHPNLVDM
     150       160       170       180       190        200        

          200       210       220       230       240       250    
pF1KB7 -----EARECVNCGATATPLWRRDRTGHYLCNACGLYHKMNGQNRPLIRPKKRLIVSKRA
            :.:::::::: .::::::: ::::::::::::::::: :::::.:..:: .:.:.
CCDS78 FDDFSEGRECVNCGAMSTPLWRRDGTGHYLCNACGLYHKMNGINRPLIKPQRRLSASRRV
      210       220       230       240       250       260        

          260       270       280       290       300       310    
pF1KB7 GTQCTNCQTTTTTLWRRNASGDPVCNACGLYYKLHQVNRPLTMRKDGIQTRNRKASGKGK
       : .:.:::::::::::::: :.:::::::::.::: : :::.:::.:::::.:: .. .:
CCDS78 GLSCANCQTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRPLAMRKEGIQTRKRKPKNLNK
      270       280       290       300       310       320        

          320       330       340            350       360         
pF1KB7 KKRGSSLGGTGAAEGPAGGFMVVAGGSGSGNCGEV-----ASGLTLGPPGTAHLYQGLGP
       .:  .. .:.  .  ::.:    .... ...  :.       ::.     .. . : .. 
CCDS78 SKTPAAPSGS-ESLPPASGASSNSSNATTSSSEEMRPIKTEPGLSSHYGHSSSVSQTFSV
      330        340       350       360       370       380       

     370       380       390        400       410              
pF1KB7 VVLSGPVSHLMPFPGPLLGSPTG-SFPTGPMPPTTSTTVVAPLSS           
        ..::    . :  . :  :: : . :..  : :.:                    
CCDS78 SAMSGHGPSIHPVLSALKLSPQGYASPVSQSPQTSSKQDSWNSLVLADSHGDIITA
       390       400       410       420       430       440   

>>CCDS78304.1 GATA4 gene_id:2626|Hs108|chr8               (236 aa)
 initn: 852 init1: 644 opt: 687  Z-score: 534.7  bits: 107.1 E(32554): 1.8e-23
Smith-Waterman score: 687; 50.7% identity (73.0% similar) in 211 aa overlap (200-404:7-216)

     170       180       190       200       210       220         
pF1KB7 STFFSPTGSPLNSAAYSSPKLRGTLPLPPCEARECVNCGATATPLWRRDRTGHYLCNACG
                                     :.:::::::: .::::::: ::::::::::
CCDS78                         MFDDFSEGRECVNCGAMSTPLWRRDGTGHYLCNACG
                                       10        20        30      

     230       240       250       260       270       280         
pF1KB7 LYHKMNGQNRPLIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNASGDPVCNACGLYYKLH
       ::::::: :::::.:..:: .:.:.: .:.:::::::::::::: :.:::::::::.:::
CCDS78 LYHKMNGINRPLIKPQRRLSASRRVGLSCANCQTTTTTLWRRNAEGEPVCNACGLYMKLH
         40        50        60        70        80        90      

     290       300       310       320       330       340         
pF1KB7 QVNRPLTMRKDGIQTRNRKASGKGKKKRGSSLGGTGAAEGPAGGFMVVAGGSGSGNCGEV
        : :::.:::.:::::.:: .. .:.:  .. .:.  .  ::.:    .... ...  :.
CCDS78 GVPRPLAMRKEGIQTRKRKPKNLNKSKTPAAPSGS-ESLPPASGASSNSSNATTSSSEEM
        100       110       120       130        140       150     

          350       360       370       380       390        400   
pF1KB7 -----ASGLTLGPPGTAHLYQGLGPVVLSGPVSHLMPFPGPLLGSPTG-SFPTGPMPPTT
              ::.     .. . : ..  ..::    . :  . :  :: : . :..  : :.
CCDS78 RPIKTEPGLSSHYGHSSSVSQTFSVSAMSGHGPSIHPVLSALKLSPQGYASPVSQSPQTS
         160       170       180       190       200       210     

           410              
pF1KB7 STTVVAPLSS           
       :                    
CCDS78 SKQDSWNSLVLADSHGDIITA
         220       230      

>>CCDS5983.1 GATA4 gene_id:2626|Hs108|chr8                (442 aa)
 initn: 820 init1: 644 opt: 691  Z-score: 533.9  bits: 107.8 E(32554): 2e-23
Smith-Waterman score: 702; 36.5% identity (56.9% similar) in 425 aa overlap (39-404:3-422)

       10        20        30        40        50        60        
pF1KB7 LGTSEPLPQFVDPALVSSTPESGVFFPSGPEGLDAAASSTAPSTATAAAAALAYYRDAEA
                                     ..:  ::.   :  :  :..  :... : :
CCDS59                             MYQSLAMAANHGPPPGAYEAGGPGAFMHGAGA
                                           10        20        30  

       70        80               90       100       110        120
pF1KB7 YRHSPVFQVYPL-------LNCMEGIPGGSPYAGWAYGKTGLYPASTVCP-TREDSPPQA
          :::.   :        :. ..:  .::  .: . :..:   :: . : :.. ::  .
CCDS59 AS-SPVYVPTPRVPSSVLGLSYLQGGGAGSASGGASGGSSG-GAASGAGPGTQQGSPGWS
              40        50        60        70         80        90

                               130       140       150       160   
pF1KB7 VEDLDGK-----------------GSTSFLETLKTERLSPDLLTLGPALPSSLPVPNSAY
           ::                  :: .   .  . : .    . : :  ..: .    :
CCDS59 QAGADGAAYTPPPVSPRFSFPGTTGSLAAAAAAAAAREAAAYSSGGGAAGAGL-AGREQY
              100       110       120       130       140          

           170              180             190                    
pF1KB7 GGPDFSSTFFSP-------TGSPLNSAA------YSSPKLRGTLP--LPPC---------
       :   :.... ::       .:.   .::      ..:: :. .::    :          
CCDS59 GRAGFAGSYSSPYPAYMADVGASWAAAAAASAGPFDSPVLH-SLPGRANPAARHPNLDMF
     150       160       170       180       190        200        

         200       210       220       230       240       250     
pF1KB7 ----EARECVNCGATATPLWRRDRTGHYLCNACGLYHKMNGQNRPLIRPKKRLIVSKRAG
           :.:::::::: .::::::: ::::::::::::::::: :::::.:..:: .:.:.:
CCDS59 DDFSEGRECVNCGAMSTPLWRRDGTGHYLCNACGLYHKMNGINRPLIKPQRRLSASRRVG
      210       220       230       240       250       260        

         260       270       280       290       300       310     
pF1KB7 TQCTNCQTTTTTLWRRNASGDPVCNACGLYYKLHQVNRPLTMRKDGIQTRNRKASGKGKK
        .:.:::::::::::::: :.:::::::::.::: : :::.:::.:::::.:: .. .:.
CCDS59 LSCANCQTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRPLAMRKEGIQTRKRKPKNLNKS
      270       280       290       300       310       320        

         320       330       340            350       360       370
pF1KB7 KRGSSLGGTGAAEGPAGGFMVVAGGSGSGNCGEV-----ASGLTLGPPGTAHLYQGLGPV
       :  .. .:.  .  ::.:    .... ...  :.       ::.     .. . : ..  
CCDS59 KTPAAPSGS-ESLPPASGASSNSSNATTSSSEEMRPIKTEPGLSSHYGHSSSVSQTFSVS
      330        340       350       360       370       380       

              380       390        400       410              
pF1KB7 VLSGPVSHLMPFPGPLLGSPTG-SFPTGPMPPTTSTTVVAPLSS           
       ..::    . :  . :  :: : . :..  : :.:                    
CCDS59 AMSGHGPSIHPVLSALKLSPQGYASPVSQSPQTSSKQDSWNSLVLADSHGDIITA
       390       400       410       420       430       440  

>>CCDS11872.1 GATA6 gene_id:2627|Hs108|chr18              (595 aa)
 initn: 777 init1: 608 opt: 639  Z-score: 492.9  bits: 100.7 E(32554): 3.9e-21
Smith-Waterman score: 678; 36.9% identity (56.9% similar) in 385 aa overlap (35-412:234-588)

           10        20        30        40        50        60    
pF1KB7 GLGSLGTSEPLPQFVDPALVSSTPESGVFFPSGPEGLDAAASSTAPSTATAAAAALAYYR
                                     : :  :  :......:. : .::: ..   
CCDS11 HLQGSGSGPANHAGGAGAHPGWPQASADSPPYGSGGGAAGGGAAGPGGAGSAAAHVSARF
           210       220       230       240       250       260   

           70        80        90       100       110              
pF1KB7 DAEAYRHSPVFQVYPLLNCMEGIPGGSPYAGWAYGKTGLYPASTVCPTREDSPPQ-----
           :  ::     :. :     :::   :: . :  :.  ...   .     ::     
CCDS11 P---YSPSP-----PMANGAAREPGGYAAAG-SGGAGGVSGGGSSLAAMGGREPQYSSLS
                   270       280        290       300       310    

     120       130       140       150       160       170         
pF1KB7 AVEDLDGKGSTSFLETLKTERLSPDLLTLGPALPSSLPVPNSAYGGPDFSSTFFSPTGSP
       :.. :.:    .. .  . ..  :.  .   . : .   : . .  : . : . : .:.:
CCDS11 AARPLNG----TYHHHHHHHHHHPSPYSPYVGAPLTPAWPAGPFETPVLHS-LQSRAGAP
          320           330       340       350       360          

     180       190       200       210       220       230         
pF1KB7 LNSAAYSSPKLRGTLPLPPCEARECVNCGATATPLWRRDRTGHYLCNACGLYHKMNGQNR
       :      :  :   :     :.:::::::.  ::::::: :::::::::::: :::: .:
CCDS11 LPVPRGPSADLLEDLS----ESRECVNCGSIQTPLWRRDGTGHYLCNACGLYSKMNGLSR
     370       380           390       400       410       420     

     240       250       260       270       280       290         
pF1KB7 PLIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNASGDPVCNACGLYYKLHQVNRPLTMRK
       :::.:.::.  :.: : .:.::.::::::::::: :.:::::::::.::: : :::.:.:
CCDS11 PLIKPQKRVPSSRRLGLSCANCHTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRPLAMKK
         430       440       450       460       470       480     

     300       310       320       330       340       350         
pF1KB7 DGIQTRNRKASGKGKKKRGSSLGGTGAAEGPAGGFMVVAGGSGSGNCGEVASGLTLGPPG
       .:::::.:: .. .:.:  :. ....    :.      . .:.: .:.. .:      : 
CCDS11 EGIQTRKRKPKNINKSKTCSGNSNNSIPMTPT------STSSNSDDCSKNTS------PT
         490       500       510             520       530         

     360       370       380       390         400       410       
pF1KB7 TAHLYQGLGPVVLSGPVSHLMPFPGPLLGSPTGSFPTGP--MPPTTSTTVVAPLSS    
       :    .: :  :..:      :  . :  :   ..  :     :.  :. : : :     
CCDS11 TQPTASGAGAPVMTGAGESTNPENSELKYSGQDGLYIGVSLASPAEVTSSVRPDSWCALA
           540       550       560       570       580       590   

CCDS11 LA
         

>>CCDS46903.1 GATA2 gene_id:2624|Hs108|chr3               (466 aa)
 initn: 685 init1: 343 opt: 440  Z-score: 344.6  bits: 72.9 E(32554): 7.1e-13
Smith-Waterman score: 745; 41.2% identity (58.3% similar) in 408 aa overlap (16-407:115-465)

                              10        20          30        40   
pF1KB7                MEFPGLGSLGTSEPLPQFVDPALVSSTP--ESGVFFPSGPEGLDA
                                     :  :.:   :.::   :..  :.:: ..  
CCDS46 CRPHLLHSPGLPWLDGGKAALSAAAAHHHNPWTVSP--FSKTPLHPSAAGGPGGPLSVYP
           90       100       110       120         130       140  

            50        60        70        80        90       100   
pF1KB7 AASSTAPSTATAAAAALAYYRDAEAYRHSPVFQVYPLLNCMEGIPGGSPYAGWAYGKTGL
       .:.. . . . ...:.:.    . :.  : .:  .:     :  :  :  .: :      
CCDS46 GAGGGSGGGSGSSVASLT---PTAAHSGSHLFG-FPPTPPKEVSPDPST-TGAAS-----
            150       160          170        180        190       

           110       120        130       140          150         
pF1KB7 YPASTVCPTREDSPPQAVEDLDG-KGSTSFLETLKTER---LSPDLLTLGPALPSSLPVP
        :::.   .   :  .. :: :: : ..:. :..: :    : : : :.:    .  :.:
CCDS46 -PASS---SAGGSAARG-EDKDGVKYQVSLTESMKMESGSPLRPGLATMGTQPATHHPIP
                200        210       220       230       240       

     160           170       180       190        200       210    
pF1KB7 NSAYGGP----DFSSTFFSPTGSPLNSAAYSSPKLRGTLPLPPC-EARECVNCGATATPL
       .     :    :.:: .: : :   . :.  .:: :.      : :.:::::::::::::
CCDS46 TYPSYVPAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKAR--SCSEGRECVNCGATATPL
       250       260       270       280         290       300     

          220       230       240       250       260       270    
pF1KB7 WRRDRTGHYLCNACGLYHKMNGQNRPLIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNAS
       :::: :::::::::::::::::::::::.::.::              :::::::::::.
CCDS46 WRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRL--------------TTTTTLWRRNAN
         310       320       330                     340       350 

          280       290       300       310        320       330   
pF1KB7 GDPVCNACGLYYKLHQVNRPLTMRKDGIQTRNRKASGKGKK-KRGSSLGGTGAAEGPAGG
       :::::::::::::::.:::::::.:.:::::::: :.:.:: :.:            :  
CCDS46 GDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKG------------AEC
             360       370       380       390                     

           340       350       360       370          380       390
pF1KB7 FMVVAGGSGSGNCGEVASGLTLGPPGTAHLYQGLGPVVLSGPVSH---LMPFPGPLLGSP
       :  ..      .: .  :.    : ..: :   ..::    : ::   ..: : :.   :
CCDS46 FEELS------KCMQEKSS----PFSAAALAGHMAPVGHLPPFSHSGHILPTPTPI--HP
     400             410           420       430       440         

               400       410   
pF1KB7 TGSFPTG-PMPPTTSTTVVAPLSS
       ..:.  : : : .  :..      
CCDS46 SSSLSFGHPHPSSMVTAMG     
       450       460           




413 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Fri Nov  4 21:36:01 2016 done: Fri Nov  4 21:36:02 2016
 Total Scan time:  3.060 Total Display time:  0.050

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com