Result of FASTA (ccds) for pF1KB7045
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB7045, 476 aa
  1>>>pF1KB7045 476 - 476 aa - 476 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 11.5172+/-0.000991; mu= -8.1016+/- 0.059
 mean_var=452.2533+/-94.784, 0's: 0 Z-trim(117.3): 804  B-trim: 0 in 0/53
 Lambda= 0.060309
 statistics sampled from 17109 (18009) to 17109 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.819), E-opt: 0.2 (0.553), width:  16
 Scan time:  4.240

The best scores are:                                      opt bits E(32554)
CCDS7267.1 EGR2 gene_id:1959|Hs108|chr10           ( 476) 3331 303.8 2.6e-82
CCDS44409.1 EGR2 gene_id:1959|Hs108|chr10          ( 426) 3007 275.6 7.2e-74
CCDS4206.1 EGR1 gene_id:1958|Hs108|chr5            ( 543)  823 85.7 1.4e-16
CCDS56528.1 EGR3 gene_id:1960|Hs108|chr8           ( 349)  768 80.7 2.8e-15
CCDS6033.1 EGR3 gene_id:1960|Hs108|chr8            ( 387)  768 80.7   3e-15


>>CCDS7267.1 EGR2 gene_id:1959|Hs108|chr10                (476 aa)
 initn: 3331 init1: 3331 opt: 3331  Z-score: 1591.4  bits: 303.8 E(32554): 2.6e-82
Smith-Waterman score: 3331; 100.0% identity (100.0% similar) in 476 aa overlap (1-476:1-476)

               10        20        30        40        50        60
pF1KB7 MMTAKAVDKIPVTLSGFVHQLSDNIYPVEDLAATSVTIFPNAELGGPFDQMNGVAGDGMI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 MMTAKAVDKIPVTLSGFVHQLSDNIYPVEDLAATSVTIFPNAELGGPFDQMNGVAGDGMI
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB7 NIDMTGEKRSLDLPYPSSFAPVSAPRNQTFTYMGKFSIDPQYPGASCYPEGIINIVSAGI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 NIDMTGEKRSLDLPYPSSFAPVSAPRNQTFTYMGKFSIDPQYPGASCYPEGIINIVSAGI
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB7 LQGVTSPASTTASSSVTSASPNPLATGPLGVCTMSQTQPDLDHLYSPPPPPPPYSGCAGD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 LQGVTSPASTTASSSVTSASPNPLATGPLGVCTMSQTQPDLDHLYSPPPPPPPYSGCAGD
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB7 LYQDPSAFLSAATTSTSSSLAYPPPPSYPSPKPATDPGLFPMIPDYPGFFPSQCQRDLHG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 LYQDPSAFLSAATTSTSSSLAYPPPPSYPSPKPATDPGLFPMIPDYPGFFPSQCQRDLHG
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB7 TAGPDRKPFPCPLDTLRVPPPLTPLSTIRNFTLGGPSAGVTGPGASGGSEGPRLPGSSSA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 TAGPDRKPFPCPLDTLRVPPPLTPLSTIRNFTLGGPSAGVTGPGASGGSEGPRLPGSSSA
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB7 AAAAAAAAAYNPHHLPLRPILRPRKYPNRPSKTPVHERPYPCPAEGCDRRFSRSDELTRH
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 AAAAAAAAAYNPHHLPLRPILRPRKYPNRPSKTPVHERPYPCPAEGCDRRFSRSDELTRH
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KB7 IRIHTGHKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACDYCGRKFARSDERKRHTKIH
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 IRIHTGHKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACDYCGRKFARSDERKRHTKIH
              370       380       390       400       410       420

              430       440       450       460       470      
pF1KB7 LRQKERKSSAPSASVPAPSTASCSGGVQPGGTLCSSNSSSLGGGPLAPCSSRTRTP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 LRQKERKSSAPSASVPAPSTASCSGGVQPGGTLCSSNSSSLGGGPLAPCSSRTRTP
              430       440       450       460       470      

>>CCDS44409.1 EGR2 gene_id:1959|Hs108|chr10               (426 aa)
 initn: 3007 init1: 3007 opt: 3007  Z-score: 1439.6  bits: 275.6 E(32554): 7.2e-74
Smith-Waterman score: 3007; 100.0% identity (100.0% similar) in 426 aa overlap (51-476:1-426)

               30        40        50        60        70        80
pF1KB7 LSDNIYPVEDLAATSVTIFPNAELGGPFDQMNGVAGDGMINIDMTGEKRSLDLPYPSSFA
                                     ::::::::::::::::::::::::::::::
CCDS44                               MNGVAGDGMINIDMTGEKRSLDLPYPSSFA
                                             10        20        30

               90       100       110       120       130       140
pF1KB7 PVSAPRNQTFTYMGKFSIDPQYPGASCYPEGIINIVSAGILQGVTSPASTTASSSVTSAS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 PVSAPRNQTFTYMGKFSIDPQYPGASCYPEGIINIVSAGILQGVTSPASTTASSSVTSAS
               40        50        60        70        80        90

              150       160       170       180       190       200
pF1KB7 PNPLATGPLGVCTMSQTQPDLDHLYSPPPPPPPYSGCAGDLYQDPSAFLSAATTSTSSSL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 PNPLATGPLGVCTMSQTQPDLDHLYSPPPPPPPYSGCAGDLYQDPSAFLSAATTSTSSSL
              100       110       120       130       140       150

              210       220       230       240       250       260
pF1KB7 AYPPPPSYPSPKPATDPGLFPMIPDYPGFFPSQCQRDLHGTAGPDRKPFPCPLDTLRVPP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 AYPPPPSYPSPKPATDPGLFPMIPDYPGFFPSQCQRDLHGTAGPDRKPFPCPLDTLRVPP
              160       170       180       190       200       210

              270       280       290       300       310       320
pF1KB7 PLTPLSTIRNFTLGGPSAGVTGPGASGGSEGPRLPGSSSAAAAAAAAAAYNPHHLPLRPI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 PLTPLSTIRNFTLGGPSAGVTGPGASGGSEGPRLPGSSSAAAAAAAAAAYNPHHLPLRPI
              220       230       240       250       260       270

              330       340       350       360       370       380
pF1KB7 LRPRKYPNRPSKTPVHERPYPCPAEGCDRRFSRSDELTRHIRIHTGHKPFQCRICMRNFS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 LRPRKYPNRPSKTPVHERPYPCPAEGCDRRFSRSDELTRHIRIHTGHKPFQCRICMRNFS
              280       290       300       310       320       330

              390       400       410       420       430       440
pF1KB7 RSDHLTTHIRTHTGEKPFACDYCGRKFARSDERKRHTKIHLRQKERKSSAPSASVPAPST
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 RSDHLTTHIRTHTGEKPFACDYCGRKFARSDERKRHTKIHLRQKERKSSAPSASVPAPST
              340       350       360       370       380       390

              450       460       470      
pF1KB7 ASCSGGVQPGGTLCSSNSSSLGGGPLAPCSSRTRTP
       ::::::::::::::::::::::::::::::::::::
CCDS44 ASCSGGVQPGGTLCSSNSSSLGGGPLAPCSSRTRTP
              400       410       420      

>>CCDS4206.1 EGR1 gene_id:1958|Hs108|chr5                 (543 aa)
 initn: 896 init1: 708 opt: 823  Z-score: 411.3  bits: 85.7 E(32554): 1.4e-16
Smith-Waterman score: 1019; 43.1% identity (66.7% similar) in 448 aa overlap (32-476:80-469)

              10        20        30        40         50        60
pF1KB7 MTAKAVDKIPVTLSGFVHQLSDNIYPVEDLAATSVTIFPNAELG-GPFDQMNGVAGDGMI
                                     ...: :. :.:. :  :....   ..... 
CCDS42 GAAGAPEGSGSNSSSSSSGGGGGGGGGSNSSSSSSTFNPQADTGEQPYEHL---TAESFP
      50        60        70        80        90       100         

               70        80        90       100        110         
pF1KB7 NIDMTGEKRSLDLPYPSSFAPVSAPRNQTFTYMGKFSIDPQ-YPGASCYPEGIINIVSAG
       .:....::  ..  :::.     . :   .:: :.::..:    : . .:: ....:: :
CCDS42 DISLNNEKVLVETSYPSQ-----TTRLPPITYTGRFSLEPAPNSGNTLWPEPLFSLVS-G
        110       120            130       140       150        160

     120       130       140       150       160       170         
pF1KB7 ILQGVTSPASTTASSSVTSASPNPLATGPLGVCTMSQTQPDLDHLYSPPPP-PPPYSGCA
       ... .. :::.... : ...: .   . ::. :.. ..  : . .::  :  : : .   
CCDS42 LVSMTNPPASSSSAPSPAASSASASQSPPLS-CAVPSN--DSSPIYSAAPTFPTPNT---
              170       180       190          200       210       

      180       190       200       210       220       230        
pF1KB7 GDLYQDPSAFLSAATTSTSSSLAYPPPPSYPSPKPATDPGLFPMIPDYPGFFPSQCQRDL
        :.. .:..  .:   :....: :::: .::. : . .    ::::::  .::.: : ::
CCDS42 -DIFPEPQS--QAFPGSAGTALQYPPP-AYPAAKGGFQ---VPMIPDY--LFPQQ-QGDL
           220         230        240          250         260     

      240       250       260       270       280       290        
pF1KB7 HGTAGPDRKPFPCPLDTLRVPPPLTPLSTIRNFTLGGPSAGVTGPGASGGSEGPRLPGSS
        : . ::.:::   :..    : :::::::. :.            ...::.  .     
CCDS42 -GLGTPDQKPFQ-GLESRTQQPSLTPLSTIKAFA------------TQSGSQDLK-----
           270        280       290                   300          

      300       310       320       330       340       350        
pF1KB7 SAAAAAAAAAAYNPHHLPLRPILRPRKYPNRPSKTPVHERPYPCPAEGCDRRFSRSDELT
             :  ..:. . .  .:  : ::::::::::: ::::: ::.:.::::::::::::
CCDS42 ------ALNTSYQSQLI--KPS-RMRKYPNRPSKTPPHERPYACPVESCDRRFSRSDELT
               310          320       330       340       350      

      360       370       380       390       400       410        
pF1KB7 RHIRIHTGHKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACDYCGRKFARSDERKRHTK
       ::::::::.:::::::::::::::::::::::::::::::::: ::::::::::::::::
CCDS42 RHIRIHTGQKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACDICGRKFARSDERKRHTK
        360       370       380       390       400       410      

      420       430       440       450       460       470        
pF1KB7 IHLRQKERKSSAPSASVPAPSTASCSGGVQPGGTLCSSNSSSLGGGPLAPCSSRTRTP  
       ::::::..:..    :: : :.:. : .  :. .  :  :    . : .: ..   .:  
CCDS42 IHLRQKDKKADK---SVVA-SSATSSLSSYPSPVATSYPSPVTTSYP-SPATTSYPSPVP
        420          430        440       450        460       470 

CCDS42 TSFSSPGSSTYPSPVHSGFPSPSVATTYSSVPPAFPAQVSSFPSSAVTNSFSASTGLSDM
             480       490       500       510       520       530 

>>CCDS56528.1 EGR3 gene_id:1960|Hs108|chr8                (349 aa)
 initn: 1136 init1: 731 opt: 768  Z-score: 387.9  bits: 80.7 E(32554): 2.8e-15
Smith-Waterman score: 1115; 51.3% identity (68.8% similar) in 398 aa overlap (57-444:14-349)

         30        40        50        60        70        80      
pF1KB7 PVEDLAATSVTIFPNAELGGPFDQMNGVAGDGMINIDMTGEKRSLDLPYPSSFAPVSAPR
                                     .....: .:.:: . .: : .:: :  :: 
CCDS56                  MEPCAAWSPRGGRENVMDIGLTNEKPNPELSYSGSFQP--APG
                                10        20        30          40 

         90       100       110       120       130       140      
pF1KB7 NQTFTYMGKFSIDPQYPGASCYPEGIINIVSAGILQGVTSPASTTASSSVTSASPNPLAT
       :.: ::.:::..:   :.  :  ..::...::::: ::  ::: . :.....::   .. 
CCDS56 NKTVTYLGKFAFDS--PSNWCQ-DNIISLMSAGIL-GVP-PASGALSTQTSTAS---MVQ
              50          60         70          80        90      

        150       160       170       180       190       200      
pF1KB7 GPLGVCTMSQTQPDLDHLYSPPPPPPPYSGCAGDLYQDPSAFLSAATTSTSSSLAYPPPP
        : :         :.. .:   :  ::::.: ::::..: .: .    . . .::: :  
CCDS56 PPQG---------DVEAMY---PALPPYSNC-GDLYSEPVSFHD---PQGNPGLAYSPQ-
                    100          110        120          130       

        210       220       230        240       250        260    
pF1KB7 SYPSPKPATDPGLFPMIPDYPGFF-PSQCQRDLHGTAGPDRKPFPCPLDTLRV-PPPLTP
       .: : ::: : .::::::::  .  :.    :. :.  :..:::   .: .:: :::.::
CCDS56 DYQSAKPALDSNLFPMIPDYNLYHHPN----DM-GSI-PEHKPFQ-GMDPIRVNPPPITP
        140       150       160             170        180         

          270       280       290       300       310       320    
pF1KB7 LSTIRNFTLGGPSAGVTGPGASGGSEGPRLPGSSSAAAAAAAAAAYNPHHLPLRPILRPR
       : ::. :     .     ::   ::  :. :                   : :.:: :::
CCDS56 LETIKAF-----KDKQIHPGF--GSL-PQPP-------------------LTLKPI-RPR
     190            200          210                           220 

          330       340       350       360       370       380    
pF1KB7 KYPNRPSKTPVHERPYPCPAEGCDRRFSRSDELTRHIRIHTGHKPFQCRICMRNFSRSDH
       ::::::::::.::::. :::::::::::::::::::.::::::::::::::::.::::::
CCDS56 KYPNRPSKTPLHERPHACPAEGCDRRFSRSDELTRHLRIHTGHKPFQCRICMRSFSRSDH
             230       240       250       260       270       280 

          390       400       410       420          430           
pF1KB7 LTTHIRTHTGEKPFACDYCGRKFARSDERKRHTKIHLRQKERKS---SAPSAS-VP----
       ::::::::::::::::..::::::::::::::.::::.:::.:.   .::::: .:    
CCDS56 LTTHIRTHTGEKPFACEFCGRKFARSDERKRHAKIHLKQKEKKAEKGGAPSASSAPPVSL
             290       300       310       320       330       340 

        440       450       460       470      
pF1KB7 APSTASCSGGVQPGGTLCSSNSSSLGGGPLAPCSSRTRTP
       :: ...:.                                
CCDS56 APVVTTCA                                
                                               

>>CCDS6033.1 EGR3 gene_id:1960|Hs108|chr8                 (387 aa)
 initn: 1228 init1: 731 opt: 768  Z-score: 387.3  bits: 80.7 E(32554): 3e-15
Smith-Waterman score: 1208; 48.9% identity (69.0% similar) in 452 aa overlap (2-444:1-387)

               10        20        30        40        50        60
pF1KB7 MMTAKAVDKIPVTLSGFVHQLSDNIYPVEDLAATSVTIFPNAELGGPFDQMNGVAGDGMI
        ::.: ..:.:::.:....:: ::.:: :    .....: ..  .    ..: .: ....
CCDS60  MTGKLAEKLPVTMSSLLNQLPDNLYPEE--IPSALNLFSGS--SDSVVHYNQMATENVM
                10        20          30          40        50     

               70        80        90       100       110       120
pF1KB7 NIDMTGEKRSLDLPYPSSFAPVSAPRNQTFTYMGKFSIDPQYPGASCYPEGIINIVSAGI
       .: .:.:: . .: : .:: :  :: :.: ::.:::..:   :.  :  ..::...::::
CCDS60 DIGLTNEKPNPELSYSGSFQP--APGNKTVTYLGKFAFDS--PSNWCQ-DNIISLMSAGI
          60        70          80        90          100       110

              130       140       150       160       170       180
pF1KB7 LQGVTSPASTTASSSVTSASPNPLATGPLGVCTMSQTQPDLDHLYSPPPPPPPYSGCAGD
       : ::  ::: . :.....::   ..  : :         :.. .:   :  ::::.: ::
CCDS60 L-GVP-PASGALSTQTSTAS---MVQPPQG---------DVEAMY---PALPPYSNC-GD
                120          130                140          150   

              190       200       210       220       230       240
pF1KB7 LYQDPSAFLSAATTSTSSSLAYPPPPSYPSPKPATDPGLFPMIPDYPGFFPSQCQRDLHG
       ::..: .: .    . . .::: :  .: : ::: : .::::::::  .   .   :. :
CCDS60 LYSEPVSFHDP---QGNPGLAYSPQ-DYQSAKPALDSNLFPMIPDYNLY---HHPNDM-G
            160          170        180       190          200     

              250        260       270       280       290         
pF1KB7 TAGPDRKPFPCPLDTLRV-PPPLTPLSTIRNFTLGGPSAGVTGPGASGGSEGPRLPGSSS
       .  :..:::   .: .:: :::.::: ::. :     .     ::   ::  :. :    
CCDS60 SI-PEHKPFQ-GMDPIRVNPPPITPLETIKAF-----KDKQIHPGF--GSL-PQPP----
           210        220       230            240          250    

     300       310       320       330       340       350         
pF1KB7 AAAAAAAAAAYNPHHLPLRPILRPRKYPNRPSKTPVHERPYPCPAEGCDRRFSRSDELTR
                      : :.:: :::::::::::::.::::. ::::::::::::::::::
CCDS60 ---------------LTLKPI-RPRKYPNRPSKTPLHERPHACPAEGCDRRFSRSDELTR
                              260       270       280       290    

     360       370       380       390       400       410         
pF1KB7 HIRIHTGHKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACDYCGRKFARSDERKRHTKI
       :.::::::::::::::::.::::::::::::::::::::::..::::::::::::::.::
CCDS60 HLRIHTGHKPFQCRICMRSFSRSDHLTTHIRTHTGEKPFACEFCGRKFARSDERKRHAKI
          300       310       320       330       340       350    

     420          430            440       450       460       470 
pF1KB7 HLRQKERKS---SAPSAS-VP----APSTASCSGGVQPGGTLCSSNSSSLGGGPLAPCSS
       ::.:::.:.   .::::: .:    :: ...:.                           
CCDS60 HLKQKEKKAEKGGAPSASSAPPVSLAPVVTTCA                           
          360       370       380                                  

            
pF1KB7 RTRTP




476 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Fri Nov  4 04:13:08 2016 done: Fri Nov  4 04:13:09 2016
 Total Scan time:  4.240 Total Display time:  0.030

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com