Result of FASTA (ccds) for pF1KB7730
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB7730, 480 aa
  1>>>pF1KB7730 480 - 480 aa - 480 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 10.2541+/-0.000846; mu= -3.1783+/- 0.051
 mean_var=267.1429+/-56.121, 0's: 0 Z-trim(116.2): 22  B-trim: 0 in 0/52
 Lambda= 0.078470
 statistics sampled from 16793 (16813) to 16793 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.807), E-opt: 0.2 (0.516), width:  16
 Scan time:  3.050

The best scores are:                                      opt bits E(32554)
CCDS3049.1 GATA2 gene_id:2624|Hs108|chr3           ( 480) 3401 397.8 1.3e-110
CCDS46903.1 GATA2 gene_id:2624|Hs108|chr3          ( 466) 2446 289.7 4.5e-78
CCDS31143.1 GATA3 gene_id:2625|Hs108|chr10         ( 444) 1362 167.0 3.8e-41
CCDS7083.1 GATA3 gene_id:2625|Hs108|chr10          ( 443) 1347 165.3 1.2e-40
CCDS78303.1 GATA4 gene_id:2626|Hs108|chr8          ( 443)  855 109.6 7.2e-24
CCDS5983.1 GATA4 gene_id:2626|Hs108|chr8           ( 442)  846 108.5 1.5e-23
CCDS14305.1 GATA1 gene_id:2623|Hs108|chrX          ( 413)  830 106.7 4.9e-23
CCDS11872.1 GATA6 gene_id:2627|Hs108|chr18         ( 595)  768 99.8 8.4e-21
CCDS78304.1 GATA4 gene_id:2626|Hs108|chr8          ( 236)  730 95.2 7.9e-20
CCDS13499.1 GATA5 gene_id:140628|Hs108|chr20       ( 397)  722 94.5 2.3e-19


>>CCDS3049.1 GATA2 gene_id:2624|Hs108|chr3                (480 aa)
 initn: 3401 init1: 3401 opt: 3401  Z-score: 2099.2  bits: 397.8 E(32554): 1.3e-110
Smith-Waterman score: 3401; 100.0% identity (100.0% similar) in 480 aa overlap (1-480:1-480)

               10        20        30        40        50        60
pF1KB7 MEVAPEQPRWMAHPAVLNAQHPDSHHPGLAHNYMEPAQLLPPDEVDVFFNHLDSQGNPYY
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 MEVAPEQPRWMAHPAVLNAQHPDSHHPGLAHNYMEPAQLLPPDEVDVFFNHLDSQGNPYY
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB7 ANPAHARARVSYSPAHARLTGGQMCRPHLLHSPGLPWLDGGKAALSAAAAHHHNPWTVSP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 ANPAHARARVSYSPAHARLTGGQMCRPHLLHSPGLPWLDGGKAALSAAAAHHHNPWTVSP
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB7 FSKTPLHPSAAGGPGGPLSVYPGAGGGSGGGSGSSVASLTPTAAHSGSHLFGFPPTPPKE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 FSKTPLHPSAAGGPGGPLSVYPGAGGGSGGGSGSSVASLTPTAAHSGSHLFGFPPTPPKE
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB7 VSPDPSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLRPGLATMGTQP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 VSPDPSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLRPGLATMGTQP
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB7 ATHHPIPTYPSYVPAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKARSCSEGRECVNCGA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 ATHHPIPTYPSYVPAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKARSCSEGRECVNCGA
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB7 TATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTCCANCQTTTTTLW
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 TATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTCCANCQTTTTTLW
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KB7 RRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKGAECFEELSKC
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 RRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKGAECFEELSKC
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KB7 MQEKSSPFSAAALAGHMAPVGHLPPFSHSGHILPTPTPIHPSSSLSFGHPHPSSMVTAMG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 MQEKSSPFSAAALAGHMAPVGHLPPFSHSGHILPTPTPIHPSSSLSFGHPHPSSMVTAMG
              430       440       450       460       470       480

>>CCDS46903.1 GATA2 gene_id:2624|Hs108|chr3               (466 aa)
 initn: 2573 init1: 2417 opt: 2446  Z-score: 1515.1  bits: 289.7 E(32554): 4.5e-78
Smith-Waterman score: 3258; 97.1% identity (97.1% similar) in 480 aa overlap (1-480:1-466)

               10        20        30        40        50        60
pF1KB7 MEVAPEQPRWMAHPAVLNAQHPDSHHPGLAHNYMEPAQLLPPDEVDVFFNHLDSQGNPYY
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 MEVAPEQPRWMAHPAVLNAQHPDSHHPGLAHNYMEPAQLLPPDEVDVFFNHLDSQGNPYY
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB7 ANPAHARARVSYSPAHARLTGGQMCRPHLLHSPGLPWLDGGKAALSAAAAHHHNPWTVSP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 ANPAHARARVSYSPAHARLTGGQMCRPHLLHSPGLPWLDGGKAALSAAAAHHHNPWTVSP
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB7 FSKTPLHPSAAGGPGGPLSVYPGAGGGSGGGSGSSVASLTPTAAHSGSHLFGFPPTPPKE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 FSKTPLHPSAAGGPGGPLSVYPGAGGGSGGGSGSSVASLTPTAAHSGSHLFGFPPTPPKE
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB7 VSPDPSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLRPGLATMGTQP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 VSPDPSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLRPGLATMGTQP
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB7 ATHHPIPTYPSYVPAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKARSCSEGRECVNCGA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 ATHHPIPTYPSYVPAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKARSCSEGRECVNCGA
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB7 TATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTCCANCQTTTTTLW
       :::::::::::::::::::::::::::::::::::::::              :::::::
CCDS46 TATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRL--------------TTTTTLW
              310       320       330                     340      

              370       380       390       400       410       420
pF1KB7 RRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKGAECFEELSKC
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 RRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKGAECFEELSKC
        350       360       370       380       390       400      

              430       440       450       460       470       480
pF1KB7 MQEKSSPFSAAALAGHMAPVGHLPPFSHSGHILPTPTPIHPSSSLSFGHPHPSSMVTAMG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 MQEKSSPFSAAALAGHMAPVGHLPPFSHSGHILPTPTPIHPSSSLSFGHPHPSSMVTAMG
        410       420       430       440       450       460      

>>CCDS31143.1 GATA3 gene_id:2625|Hs108|chr10              (444 aa)
 initn: 1622 init1: 930 opt: 1362  Z-score: 852.2  bits: 167.0 E(32554): 3.8e-41
Smith-Waterman score: 1938; 62.6% identity (78.0% similar) in 486 aa overlap (1-480:1-444)

               10          20        30        40        50        
pF1KB7 MEVAPEQPRWMAH--PAVLNAQHPDSHHPGLAHNYMEPAQLLPPDEVDVFFNHLDSQGN-
       :::. .::::..:  :::::.::::.:::::.:.::. ::   :.::::.:: .:.::: 
CCDS31 MEVTADQPRWVSHHHPAVLNGQHPDTHHPGLSHSYMDAAQYPLPEEVDVLFN-IDGQGNH
               10        20        30        40        50          

          60        70        80        90       100       110     
pF1KB7 --PYYANPAHARARVSYSPAHARLTGGQMCRPHLLHSPGLPWLDGGKAALSAAAAHHH-N
         :::.: ..: ..  : :.:    :.:.::: :::. .:::::::::  :    ::  .
CCDS31 VPPYYGNSVRATVQ-RYPPTHH---GSQVCRPPLLHG-SLPWLDGGKALGS----HHTAS
      60        70         80           90        100           110

          120       130       140       150       160       170    
pF1KB7 PWTVSPFSKTPLHPSAAGGPGGPLSVYPGAGGGSGGGSGSSVASLTPTAAHSGSHLFGFP
       ::..:::::: .:    :.:: :::::: :...: .:.            :.. ::: ::
CCDS31 PWNLSPFSKTSIHH---GSPG-PLSVYPPASSSSLSGG------------HASPHLFTFP
              120           130       140                   150    

          180       190       200       210       220       230    
pF1KB7 PTPPKEVSPDPSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLRPGLA
       :::::.:::::: .   .:.:.   ::: : ..:. .:::: : .:::.::.       :
CCDS31 PTPPKDVSPDPSLS---TPGSA---GSA-RQDEKECLKYQVPLPDSMKLESSHSRGSMTA
          160          170           180       190       200       

          240       250       260       270       280       290    
pF1KB7 TMGTQPATHHPIPTYPSYVPAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKARSCSEGRE
         :.. .::::: ::: :::    .:::::: :...:::  ..:  :.: :::: .::::
CCDS31 LGGASSSTHHPITTYPPYVP----EYSSGLFPPSSLLGGSPTGFGCKSRPKARSSTEGRE
       210       220           230       240       250       260   

          300       310       320       330       340       350    
pF1KB7 CVNCGATATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTCCANCQT
       :::::::.::::::::::::::::::::::::::::::::::::::::::::: ::::::
CCDS31 CVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTSCANCQT
           270       280       290       300       310       320   

          360       370       380       390       400       410    
pF1KB7 TTTTLWRRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKGAECF
       :::::::::::::::::::::::::::.:::::::::::::::::::.:::: ::  . .
CCDS31 TTTTLWRRNANGDPVCNACGLYYKLHNINRPLTMKKEGIQTRNRKMSSKSKKCKKVHDSL
           330       340       350       360       370       380   

          420       430       440       450       460       470    
pF1KB7 EELSKCMQEKSSPFSAAALAGHMAPVGHLPPFSHSGHILPTPTPIHPSSSLSFGHPHPSS
       :.. :     .: :. :::. ::. ..:. :::::.:.: ::::.:: ::::::  ::::
CCDS31 EDFPK-----NSSFNPAALSRHMSSLSHISPFSHSSHMLTTPTPMHPPSSLSFGPHHPSS
                390       400       410       420       430        

          480
pF1KB7 MVTAMG
       ::::::
CCDS31 MVTAMG
      440    

>>CCDS7083.1 GATA3 gene_id:2625|Hs108|chr10               (443 aa)
 initn: 1482 init1: 819 opt: 1347  Z-score: 843.0  bits: 165.3 E(32554): 1.2e-40
Smith-Waterman score: 1923; 62.6% identity (77.8% similar) in 486 aa overlap (1-480:1-443)

               10          20        30        40        50        
pF1KB7 MEVAPEQPRWMAH--PAVLNAQHPDSHHPGLAHNYMEPAQLLPPDEVDVFFNHLDSQGN-
       :::. .::::..:  :::::.::::.:::::.:.::. ::   :.::::.:: .:.::: 
CCDS70 MEVTADQPRWVSHHHPAVLNGQHPDTHHPGLSHSYMDAAQYPLPEEVDVLFN-IDGQGNH
               10        20        30        40        50          

          60        70        80        90       100       110     
pF1KB7 --PYYANPAHARARVSYSPAHARLTGGQMCRPHLLHSPGLPWLDGGKAALSAAAAHHH-N
         :::.: ..: ..  : :.:    :.:.::: :::. .:::::::::  :    ::  .
CCDS70 VPPYYGNSVRATVQ-RYPPTHH---GSQVCRPPLLHG-SLPWLDGGKALGS----HHTAS
      60        70         80           90        100           110

          120       130       140       150       160       170    
pF1KB7 PWTVSPFSKTPLHPSAAGGPGGPLSVYPGAGGGSGGGSGSSVASLTPTAAHSGSHLFGFP
       ::..:::::: .:    :.:: :::::: :...: .:.            :.. ::: ::
CCDS70 PWNLSPFSKTSIHH---GSPG-PLSVYPPASSSSLSGG------------HASPHLFTFP
              120           130       140                   150    

          180       190       200       210       220       230    
pF1KB7 PTPPKEVSPDPSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLRPGLA
       :::::.:::::: .   .:.:.   ::: : ..:. .:::: : .:::.::.       :
CCDS70 PTPPKDVSPDPSLS---TPGSA---GSA-RQDEKECLKYQVPLPDSMKLESSHSRGSMTA
          160          170           180       190       200       

          240       250       260       270       280       290    
pF1KB7 TMGTQPATHHPIPTYPSYVPAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKARSCSEGRE
         :.. .::::: ::: :::    .:::::: :...:::  ..:  :.: :::: : :::
CCDS70 LGGASSSTHHPITTYPPYVP----EYSSGLFPPSSLLGGSPTGFGCKSRPKARS-STGRE
       210       220           230       240       250        260  

          300       310       320       330       340       350    
pF1KB7 CVNCGATATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTCCANCQT
       :::::::.::::::::::::::::::::::::::::::::::::::::::::: ::::::
CCDS70 CVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTSCANCQT
            270       280       290       300       310       320  

          360       370       380       390       400       410    
pF1KB7 TTTTLWRRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKGAECF
       :::::::::::::::::::::::::::.:::::::::::::::::::.:::: ::  . .
CCDS70 TTTTLWRRNANGDPVCNACGLYYKLHNINRPLTMKKEGIQTRNRKMSSKSKKCKKVHDSL
            330       340       350       360       370       380  

          420       430       440       450       460       470    
pF1KB7 EELSKCMQEKSSPFSAAALAGHMAPVGHLPPFSHSGHILPTPTPIHPSSSLSFGHPHPSS
       :.. :     .: :. :::. ::. ..:. :::::.:.: ::::.:: ::::::  ::::
CCDS70 EDFPK-----NSSFNPAALSRHMSSLSHISPFSHSSHMLTTPTPMHPPSSLSFGPHHPSS
                 390       400       410       420       430       

          480
pF1KB7 MVTAMG
       ::::::
CCDS70 MVTAMG
       440   

>>CCDS78303.1 GATA4 gene_id:2626|Hs108|chr8               (443 aa)
 initn: 802 init1: 704 opt: 855  Z-score: 542.0  bits: 109.6 E(32554): 7.2e-24
Smith-Waterman score: 855; 43.4% identity (64.0% similar) in 403 aa overlap (93-472:15-399)

             70        80        90       100       110       120  
pF1KB7 PAHARARVSYSPAHARLTGGQMCRPHLLHSPGLPWLDGGKAALSAAAAHHHNPWTVSPFS
                                     ::  .  :: .:.  .:.   .:  : :  
CCDS78                 MYQSLAMAANHGPPPG-AYEAGGPGAFMHGAGAASSPVYV-P--
                               10         20        30         40  

            130            140       150       160           170   
pF1KB7 KTPLHPSAAGG-----PGGPLSVYPGAGGGSGGGSGSSVASLT----PTAAHSGSHLFGF
        ::  ::.. :      ::  :.  ::.:::.::..:...  :    :  ...:.   ..
CCDS78 -TPRVPSSVLGLSYLQGGGAGSASGGASGGSSGGAASGAGPGTQQGSPGWSQAGADGAAY
                50        60        70        80        90         

           180          190       200       210       220       230
pF1KB7 PPTPPKEVSPD---PSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLR
        : ::  :::    :.:::. . :...:..  : . .. :    ..:  . . . :   :
CCDS78 TP-PP--VSPRFSFPGTTGSLAAAAAAAAAREAAAYSSGGGAAGAGL--AGREQYG---R
     100          110       120       130       140         150    

              240       250          260         270       280     
pF1KB7 PGLATMGTQPATHHPIPTYPSYVPAAAHD---YSSGLFH--PGGFLGGPASSFTPKQRSK
        :.:   ..:   .   .  :.. ::: .   ..: ..:  ::   ..::.   :.  . 
CCDS78 AGFAGSYSSPYPAYMADVGASWAAAAAASAGPFDSPVLHSLPG--RANPAARH-PNLVDM
             160       170       180       190         200         

         290       300       310       320       330       340     
pF1KB7 ARSCSEGRECVNCGATATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRA
         . ::::::::::: .::::::::::::::::::::::::: :::::::.:::::.::.
CCDS78 FDDFSEGRECVNCGAMSTPLWRRDGTGHYLCNACGLYHKMNGINRPLIKPQRRLSASRRV
      210       220       230       240       250       260        

         350       360       370       380       390       400     
pF1KB7 GTCCANCQTTTTTLWRRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSK
       :  ::::::::::::::::.:.:::::::::.:::.: :::.:.:::::::.:: .: .:
CCDS78 GLSCANCQTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRPLAMRKEGIQTRKRKPKNLNK
      270       280       290       300       310       320        

         410       420       430         440        450       460  
pF1KB7 KSKKGAECFEELSKCMQEKSSPFSAAALAG--HMAPVGHLPPFS-HSGHILPTPTPIHPS
       ..  .:    :     .  ::  : :. ..  .: :.   : .: : ::   . .     
CCDS78 SKTPAAPSGSESLPPASGASSNSSNATTSSSEEMRPIKTEPGLSSHYGHS-SSVSQTFSV
      330       340       350       360       370        380       

             470         480                                    
pF1KB7 SSLSFGH-P--HPSSMVTAMG                                    
       :..: :: :  ::                                            
CCDS78 SAMS-GHGPSIHPVLSALKLSPQGYASPVSQSPQTSSKQDSWNSLVLADSHGDIITA
       390        400       410       420       430       440   

>>CCDS5983.1 GATA4 gene_id:2626|Hs108|chr8                (442 aa)
 initn: 794 init1: 704 opt: 846  Z-score: 536.5  bits: 108.5 E(32554): 1.5e-23
Smith-Waterman score: 846; 43.4% identity (64.0% similar) in 403 aa overlap (93-472:15-398)

             70        80        90       100       110       120  
pF1KB7 PAHARARVSYSPAHARLTGGQMCRPHLLHSPGLPWLDGGKAALSAAAAHHHNPWTVSPFS
                                     ::  .  :: .:.  .:.   .:  : :  
CCDS59                 MYQSLAMAANHGPPPG-AYEAGGPGAFMHGAGAASSPVYV-P--
                               10         20        30         40  

            130            140       150       160           170   
pF1KB7 KTPLHPSAAGG-----PGGPLSVYPGAGGGSGGGSGSSVASLT----PTAAHSGSHLFGF
        ::  ::.. :      ::  :.  ::.:::.::..:...  :    :  ...:.   ..
CCDS59 -TPRVPSSVLGLSYLQGGGAGSASGGASGGSSGGAASGAGPGTQQGSPGWSQAGADGAAY
                50        60        70        80        90         

           180          190       200       210       220       230
pF1KB7 PPTPPKEVSPD---PSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLR
        : ::  :::    :.:::. . :...:..  : . .. :    ..:  . . . :   :
CCDS59 TP-PP--VSPRFSFPGTTGSLAAAAAAAAAREAAAYSSGGGAAGAGL--AGREQYG---R
     100          110       120       130       140         150    

              240       250          260         270       280     
pF1KB7 PGLATMGTQPATHHPIPTYPSYVPAAAHD---YSSGLFH--PGGFLGGPASSFTPKQRSK
        :.:   ..:   .   .  :.. ::: .   ..: ..:  ::   ..::.   :.  . 
CCDS59 AGFAGSYSSPYPAYMADVGASWAAAAAASAGPFDSPVLHSLPG--RANPAARH-PNL-DM
             160       170       180       190         200         

         290       300       310       320       330       340     
pF1KB7 ARSCSEGRECVNCGATATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRA
         . ::::::::::: .::::::::::::::::::::::::: :::::::.:::::.::.
CCDS59 FDDFSEGRECVNCGAMSTPLWRRDGTGHYLCNACGLYHKMNGINRPLIKPQRRLSASRRV
       210       220       230       240       250       260       

         350       360       370       380       390       400     
pF1KB7 GTCCANCQTTTTTLWRRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSK
       :  ::::::::::::::::.:.:::::::::.:::.: :::.:.:::::::.:: .: .:
CCDS59 GLSCANCQTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRPLAMRKEGIQTRKRKPKNLNK
       270       280       290       300       310       320       

         410       420       430         440        450       460  
pF1KB7 KSKKGAECFEELSKCMQEKSSPFSAAALAG--HMAPVGHLPPFS-HSGHILPTPTPIHPS
       ..  .:    :     .  ::  : :. ..  .: :.   : .: : ::   . .     
CCDS59 SKTPAAPSGSESLPPASGASSNSSNATTSSSEEMRPIKTEPGLSSHYGHS-SSVSQTFSV
       330       340       350       360       370        380      

             470         480                                    
pF1KB7 SSLSFGH-P--HPSSMVTAMG                                    
       :..: :: :  ::                                            
CCDS59 SAMS-GHGPSIHPVLSALKLSPQGYASPVSQSPQTSSKQDSWNSLVLADSHGDIITA
        390        400       410       420       430       440  

>>CCDS14305.1 GATA1 gene_id:2623|Hs108|chrX               (413 aa)
 initn: 956 init1: 724 opt: 830  Z-score: 527.1  bits: 106.7 E(32554): 4.9e-23
Smith-Waterman score: 846; 43.1% identity (61.3% similar) in 408 aa overlap (115-479:16-407)

           90       100       110       120         130       140  
pF1KB7 CRPHLLHSPGLPWLDGGKAALSAAAAHHHNPWTVSP--FSKTPLHPSAAGGPGGPLSVYP
                                     :  :.:   :.::   :..  :.:: ..  
CCDS14                MEFPGLGSLGTSEPLPQFVDPALVSSTP--ESGVFFPSGPEGLDA
                              10        20          30        40   

            150       160          170        180        190       
pF1KB7 GAGGGSGGGSGSSVASLT---PTAAHSGSHLFG-FPPTPPKEVSPDPST-TGAAS-----
       .:.. . . . ...:.:.    . :.  : .:  .:     :  :  :  .: :      
CCDS14 AASSTAPSTATAAAAALAYYRDAEAYRHSPVFQVYPLLNCMEGIPGGSPYAGWAYGKTGL
            50        60        70        80        90       100   

                200        210       220       230       240       
pF1KB7 -PASS---SAGGSAARG-EDKDGVKYQVSLTESMKMESGSPLRPGLATMGTQPATHHPIP
        :::.   .   :  .. :: :: : ..:. :..: :    : : : :.:    .  :.:
CCDS14 YPASTVCPTREDSPPQAVEDLDG-KGSTSFLETLKTER---LSPDLLTLGPALPSSLPVP
           110       120        130       140          150         

       250       260       270       280         290       300     
pF1KB7 TYPSYVPAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKAR--SCSEGRECVNCGATATPL
       .     :    :.:: .: : :   . :.  .:: :.      : :.:::::::::::::
CCDS14 NSAYGGP----DFSSTFFSPTGSPLNSAAYSSPKLRGTLPLPPC-EARECVNCGATATPL
     160           170       180       190        200       210    

         310       320       330       340       350       360     
pF1KB7 WRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTCCANCQTTTTTLWRRNAN
       :::: :::::::::::::::::::::::.::.:: ...:::: :.::::::::::::::.
CCDS14 WRRDRTGHYLCNACGLYHKMNGQNRPLIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNAS
          220       230       240       250       260       270    

         370       380       390       400       410               
pF1KB7 GDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKG------------AEC
       :::::::::::::::.:::::::.:.:::::::: :.:.:: :.:            :  
CCDS14 GDPVCNACGLYYKLHQVNRPLTMRKDGIQTRNRKASGKGKK-KRGSSLGGTGAAEGPAGG
          280       290       300       310        320       330   

                 420           430       440       450         460 
pF1KB7 FEELS------KCMQEKSS----PFSAAALAGHMAPVGHLPPFSHSGHILPTPTPI--HP
       :  ..      .: .  :.    : ..: :   ..::    : :   :..: : :.   :
CCDS14 FMVVAGGSGSGNCGEVASGLTLGPPGTAHLYQGLGPVVLSGPVS---HLMPFPGPLLGSP
           340       350       360       370          380       390

             470       480     
pF1KB7 SSSLSFGHPHPSSMVTAMG     
       ..:.  : : : .  :..      
CCDS14 TGSFPTG-PMPPTTSTTVVAPLSS
               400       410   

>>CCDS11872.1 GATA6 gene_id:2627|Hs108|chr18              (595 aa)
 initn: 756 init1: 648 opt: 768  Z-score: 486.9  bits: 99.8 E(32554): 8.4e-21
Smith-Waterman score: 781; 40.9% identity (60.7% similar) in 394 aa overlap (42-410:144-506)

              20        30        40        50        60           
pF1KB7 AHPAVLNAQHPDSHHPGLAHNYMEPAQLLPPDEVDVFFNHLDSQGNPYY----------A
                                     :.:.   .  :.:::   :          :
CCDS11 LFTDLDQAATASKLLWSSRGAKLSPFAPEQPEEMYQTLAALSSQGPAAYDGAPGGFVHSA
           120       130       140       150       160       170   

              70        80         90        100         110       
pF1KB7 NPAHARARVSYSPAHARLTG-GQMCRPHLLHSPGLPW-LDGGKA--ALSAAAAHHHNPWT
         : : : .. ::...  :  :.:        ::::. :.:. .  :  :..:  :  : 
CCDS11 AAAAAAAAAASSPVYVPTTRVGSML-------PGLPYHLQGSGSGPANHAGGAGAHPGW-
           180       190              200       210       220      

       120       130       140       150       160       170       
pF1KB7 VSPFSKTPLHPSAAGGPGGPLSVYPGAGGGSGGGSGSSVASLTPTAAHSGSHLFGFPPTP
         : ...   : ..:: .        ::::..: .:.. :     ::: ... : . :.:
CCDS11 --PQASADSPPYGSGGGA--------AGGGAAGPGGAGSA-----AAHVSAR-FPYSPSP
           230       240               250            260          

       180       190       200       210       220       230       
pF1KB7 PKEVSPDPSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLRPGLATMG
       :   .      : :. .:..::: .. : .  ..  .     :..  .. ::  :     
CCDS11 PMANGAAREPGGYAAAGSGGAGGVSGGGSSLAAMGGREPQYSSLS--AARPLN-GTYHHH
     270       280       290       300       310         320       

       240       250             260       270       280           
pF1KB7 TQPATHHPIPTYPSYV-----PA-AAHDYSSGLFHPGGFLGGPASSFTPKQRSKA----R
        .   ::: : :  ::     ::  :  . . ..:    : . :..  :  :. .    .
CCDS11 HHHHHHHPSP-YSPYVGAPLTPAWPAGPFETPVLHS---LQSRAGAPLPVPRGPSADLLE
        330        340       350       360          370       380  

       290       300       310       320       330       340       
pF1KB7 SCSEGRECVNCGATATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGT
       . ::.:::::::.  :::::::::::::::::::: :::: .::::::..:. ..:: : 
CCDS11 DLSESRECVNCGSIQTPLWRRDGTGHYLCNACGLYSKMNGLSRPLIKPQKRVPSSRRLGL
            390       400       410       420       430       440  

       350       360       370       380       390       400       
pF1KB7 CCANCQTTTTTLWRRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSK-K
        ::::.:::::::::::.:.:::::::::.:::.: :::.:::::::::.:: .: .: :
CCDS11 SCANCHTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRPLAMKKEGIQTRKRKPKNINKSK
            450       460       470       480       490       500  

        410       420       430       440       450       460      
pF1KB7 SKKGAECFEELSKCMQEKSSPFSAAALAGHMAPVGHLPPFSHSGHILPTPTPIHPSSSLS
       . .:                                                        
CCDS11 TCSGNSNNSIPMTPTSTSSNSDDCSKNTSPTTQPTASGAGAPVMTGAGESTNPENSELKY
            510       520       530       540       550       560  

>>CCDS78304.1 GATA4 gene_id:2626|Hs108|chr8               (236 aa)
 initn: 748 init1: 704 opt: 730  Z-score: 469.5  bits: 95.2 E(32554): 7.9e-20
Smith-Waterman score: 730; 61.4% identity (75.7% similar) in 189 aa overlap (290-472:6-192)

     260       270       280       290       300       310         
pF1KB7 YSSGLFHPGGFLGGPASSFTPKQRSKARSCSEGRECVNCGATATPLWRRDGTGHYLCNAC
                                     ::::::::::: .:::::::::::::::::
CCDS78                          MFDDFSEGRECVNCGAMSTPLWRRDGTGHYLCNAC
                                        10        20        30     

     320       330       340       350       360       370         
pF1KB7 GLYHKMNGQNRPLIKPKRRLSAARRAGTCCANCQTTTTTLWRRNANGDPVCNACGLYYKL
       :::::::: :::::::.:::::.::.:  ::::::::::::::::.:.:::::::::.::
CCDS78 GLYHKMNGINRPLIKPQRRLSASRRVGLSCANCQTTTTTLWRRNAEGEPVCNACGLYMKL
          40        50        60        70        80        90     

     380       390       400       410       420       430         
pF1KB7 HNVNRPLTMKKEGIQTRNRKMSNKSKKSKKGAECFEELSKCMQEKSSPFSAAALAG--HM
       :.: :::.:.:::::::.:: .: .:..  .:    :     .  ::  : :. ..  .:
CCDS78 HGVPRPLAMRKEGIQTRKRKPKNLNKSKTPAAPSGSESLPPASGASSNSSNATTSSSEEM
         100       110       120       130       140       150     

       440        450       460        470         480             
pF1KB7 APVGHLPPFS-HSGHILPTPTPIHPSSSLSFGH-P--HPSSMVTAMG             
        :.   : .: : ::   . .     :..: :: :  ::                     
CCDS78 RPIKTEPGLSSHYGHS-SSVSQTFSVSAMS-GHGPSIHPVLSALKLSPQGYASPVSQSPQ
         160       170        180        190       200       210   

CCDS78 TSSKQDSWNSLVLADSHGDIITA
           220       230      

>>CCDS13499.1 GATA5 gene_id:140628|Hs108|chr20            (397 aa)
 initn: 736 init1: 671 opt: 722  Z-score: 461.3  bits: 94.5 E(32554): 2.3e-19
Smith-Waterman score: 786; 41.5% identity (64.5% similar) in 369 aa overlap (102-464:13-348)

              80        90       100       110       120        130
pF1KB7 YSPAHARLTGGQMCRPHLLHSPGLPWLDGGKAALSAAAAHHHNPWTVSPFSKTPLH-PSA
                                     .:: . ...  : : . ::.   : . :: 
CCDS13                   MYQSLALAASPRQAAYADSGSFLHAPGAGSPMFVPPARVPSM
                                 10        20        30        40  

                140       150       160       170       180        
pF1KB7 AGGPGG--PLSVYPGAGGGSGGGSGSSVASLTPTAAHSGSHLFGFPPTPPKEVSPDPSTT
        .  .:  : :  :   ..  : . ...:.   .:   ::      : ::    :  .. 
CCDS13 LSYLSGCEP-SPQPPELAARPGWAQTATAD--SSAFGPGS------PHPPAAHPPGATAF
             50         60        70                80        90   

       190       200       210       220        230       240      
pF1KB7 G-AASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPL-RPGLATMGTQPATHHPI
         : ::.. ..::::.    .::  :: .:    . . ..:: ::    .::. ..    
CCDS13 PFAHSPSGPGSGGSAG---GRDGSAYQGALLP--REQFAAPLGRP----VGTSYSA----
           100          110       120         130           140    

        250        260       270       280       290       300     
pF1KB7 PTYPSYV-PAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKARSCSEGRECVNCGATATPL
        :::.:: : .:.....: :  . . : :.   :  .    .  .:::::::::: .:::
CCDS13 -TYPAYVSPDVAQSWTAGPFDGSVLHGLPGRRPTFVSDFLEEFPGEGRECVNCGALSTPL
               150       160       170       180       190         

         310       320       330       340       350       360     
pF1KB7 WRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTCCANCQTTTTTLWRRNAN
       :::::::::::::::::::::: ::::..:..:::..:::: ::.::.::.:::::::..
CCDS13 WRRDGTGHYLCNACGLYHKMNGVNRPLVRPQKRLSSSRRAGLCCTNCHTTNTTLWRRNSE
     200       210       220       230       240       250         

         370       380       390       400       410       420     
pF1KB7 GDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKGAECFEELSKCMQEKS
       :.:::::::::.:::.: :::.::::.::::.::   :.  . .:.      :   .. :
CCDS13 GEPVCNACGLYMKLHGVPRPLAMKKESIQTRKRK--PKTIAKARGS------SGSTRNAS
     260       270       280       290         300             310 

         430       440       450       460       470       480     
pF1KB7 SPFSAAALAGHMAPVGHLPPFSHSGHILPTPTPIHPSSSLSFGHPHPSSMVTAMG     
       .  ::.: .   : ...  : : .. . : :. . :..:                     
CCDS13 ASPSAVASTDSSAATSKAKP-SLASPVCPGPS-MAPQASGQEDDSLAPGHLEFKFEPEDF
             320       330        340        350       360         

CCDS13 AFPSTAPSPQAGLRGALRQEAWCALALA
     370       380       390       




480 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Fri Nov  4 09:17:12 2016 done: Fri Nov  4 09:17:12 2016
 Total Scan time:  3.050 Total Display time:  0.050

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com