Result of FASTA (ccds) for pF1KB9653
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB9653, 276 aa
  1>>>pF1KB9653 276 - 276 aa - 276 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 8.1396+/-0.000859; mu= 4.0049+/- 0.051
 mean_var=202.3890+/-42.708, 0's: 0 Z-trim(114.0): 80  B-trim: 8 in 1/51
 Lambda= 0.090153
 statistics sampled from 14512 (14592) to 14512 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.777), E-opt: 0.2 (0.448), width:  16
 Scan time:  2.570

The best scores are:                                      opt bits E(32554)
CCDS9473.1 SOX21 gene_id:11166|Hs108|chr13         ( 276) 1856 253.1 1.6e-67
CCDS3094.1 SOX14 gene_id:8403|Hs108|chr3           ( 240)  664 98.0 6.6e-21
CCDS3239.1 SOX2 gene_id:6657|Hs108|chr3            ( 317)  620 92.4 4.3e-19
CCDS9523.1 SOX1 gene_id:6656|Hs108|chr13           ( 391)  611 91.3 1.1e-18
CCDS14669.1 SOX3 gene_id:6658|Hs108|chrX           ( 446)  602 90.2 2.8e-18
CCDS32549.1 SOX15 gene_id:6665|Hs108|chr17         ( 233)  471 72.9 2.3e-13
CCDS4547.1 SOX4 gene_id:6659|Hs108|chr6            ( 474)  456 71.3 1.5e-12
CCDS12995.1 SOX12 gene_id:6666|Hs108|chr20         ( 315)  439 68.9 5.2e-12
CCDS10428.1 SOX8 gene_id:30812|Hs108|chr16         ( 446)  428 67.6 1.8e-11
CCDS11689.1 SOX9 gene_id:6662|Hs108|chr17          ( 509)  423 67.0 3.1e-11
CCDS14772.1 SRY gene_id:6736|Hs108|chrY            ( 204)  409 64.8 5.6e-11
CCDS1654.1 SOX11 gene_id:6664|Hs108|chr2           ( 441)  415 65.9 5.8e-11
CCDS13964.1 SOX10 gene_id:6663|Hs108|chr22         ( 466)  410 65.3 9.5e-11


>>CCDS9473.1 SOX21 gene_id:11166|Hs108|chr13              (276 aa)
 initn: 1856 init1: 1856 opt: 1856  Z-score: 1325.9  bits: 253.1 E(32554): 1.6e-67
Smith-Waterman score: 1856; 100.0% identity (100.0% similar) in 276 aa overlap (1-276:1-276)

               10        20        30        40        50        60
pF1KB9 MSKPVDHVKRPMNAFMVWSRAQRRKMAQENPKMHNSEISKRLGAEWKLLTESEKRPFIDE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS94 MSKPVDHVKRPMNAFMVWSRAQRRKMAQENPKMHNSEISKRLGAEWKLLTESEKRPFIDE
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB9 AKRLRAMHMKEHPDYKYRPRRKPKTLLKKDKFAFPVPYGLGGVADAEHPALKAGAGLHAG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS94 AKRLRAMHMKEHPDYKYRPRRKPKTLLKKDKFAFPVPYGLGGVADAEHPALKAGAGLHAG
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB9 AGGGLVPESLLANPEKAAAAAAAAAARVFFPQSAAAAAAAAAAAAAGSPYSLLDLGSKMA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS94 AGGGLVPESLLANPEKAAAAAAAAAARVFFPQSAAAAAAAAAAAAAGSPYSLLDLGSKMA
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB9 EISSSSSGLPYASSLGYPTAGAGAFHGAAAAAAAAAAAAGGHTHSHPSPGNPGYMIPCNC
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS94 EISSSSSGLPYASSLGYPTAGAGAFHGAAAAAAAAAAAAGGHTHSHPSPGNPGYMIPCNC
              190       200       210       220       230       240

              250       260       270      
pF1KB9 SAWPSPGLQPPLAYILLPGMGKPQLDPYPAAYAAAL
       ::::::::::::::::::::::::::::::::::::
CCDS94 SAWPSPGLQPPLAYILLPGMGKPQLDPYPAAYAAAL
              250       260       270      

>>CCDS3094.1 SOX14 gene_id:8403|Hs108|chr3                (240 aa)
 initn: 1046 init1: 627 opt: 664  Z-score: 488.8  bits: 98.0 E(32554): 6.6e-21
Smith-Waterman score: 978; 57.9% identity (73.7% similar) in 285 aa overlap (1-276:1-240)

               10        20        30        40        50        60
pF1KB9 MSKPVDHVKRPMNAFMVWSRAQRRKMAQENPKMHNSEISKRLGAEWKLLTESEKRPFIDE
       :::: ::.::::::::::::.::::::::::::::::::::::::::::.:.::::.:::
CCDS30 MSKPSDHIKRPMNAFMVWSRGQRRKMAQENPKMHNSEISKRLGAEWKLLSEAEKRPYIDE
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB9 AKRLRAMHMKEHPDYKYRPRRKPKTLLKKDKFAFPVPYGLGGVADAEHPALKAGAGLHAG
       ::::::.:::::::::::::::::.:::::...::.:: ::   :.. : ::: ::: .:
CCDS30 AKRLRAQHMKEHPDYKYRPRRKPKNLLKKDRYVFPLPY-LG---DTD-P-LKA-AGLPVG
               70        80        90        100             110   

              130       140       150       160       170          
pF1KB9 AGGGLVPESLLANPEKAAAAAAAAAARVFFPQSAAAAAAAAAAAAAGSPYSLLDLGS---
       :. ::     :. ::::         :.:.: ..:             :::::: ..   
CCDS30 ASDGL-----LSAPEKA---------RAFLPPASA-------------PYSLLDPAQFSS
                120                130                    140      

           180         190       200       210       220       230 
pF1KB9 ----KMAEISSS--SSGLPYASSLGYPTAGAGAFHGAAAAAAAAAAAAGGHTHSHPSPGN
           ::.:.  .  ...:::::.::: .   ::: :. .  .        :::.:::: :
CCDS30 SAIQKMGEVPHTLATGALPYASTLGYQN---GAF-GSLSCPSQ-------HTHTHPSPTN
        150       160       170           180              190     

             240       250       260       270      
pF1KB9 PGYMIPCNCSAWPSPGLQPPLAYILLPGMGKPQLDPYPAAYAAAL
       :::..::::.:: .  ::::.::::.::: :  .::: .:.:.:.
CCDS30 PGYVVPCNCTAWSASTLQPPVAYILFPGMTKTGIDPYSSAHATAM
         200       210       220       230       240

>>CCDS3239.1 SOX2 gene_id:6657|Hs108|chr3                 (317 aa)
 initn: 624 init1: 569 opt: 620  Z-score: 456.3  bits: 92.4 E(32554): 4.3e-19
Smith-Waterman score: 620; 43.0% identity (62.9% similar) in 272 aa overlap (6-269:39-304)

                                        10        20        30     
pF1KB9                          MSKPVDHVKRPMNAFMVWSRAQRRKMAQENPKMHN
                                     :.:::::::::::::.::::::::::::::
CCDS32 LKPPGPQQTSGGGGGNSTAAAAGGNQKNSPDRVKRPMNAFMVWSRGQRRKMAQENPKMHN
       10        20        30        40        50        60        

          40        50        60        70        80        90     
pF1KB9 SEISKRLGAEWKLLTESEKRPFIDEAKRLRAMHMKEHPDYKYRPRRKPKTLLKKDKFAFP
       ::::::::::::::.:.::::::::::::::.::::::::::::::: :::.::::...:
CCDS32 SEISKRLGAEWKLLSETEKRPFIDEAKRLRALHMKEHPDYKYRPRRKTKTLMKKDKYTLP
       70        80        90       100       110       120        

         100       110       120         130       140       150   
pF1KB9 VPYGLGGVADAEHPALKAGAGLHAGAGGGLVP--ESLLANPEKAAAAAAAAAARVFFPQS
            ::.      .. .:.:. :: :.:.    .:       . .. .    .. .:: 
CCDS32 -----GGLLAPGGNSMASGVGVGAGLGAGVNQRMDSYAHMNGWSNGSYSMMQDQLGYPQH
           130       140       150       160       170       180   

           160       170        180       190           200        
pF1KB9 AAAAAAAAAAAAAGSPYSLLDLG-SKMAEISSSSSGLP-YA---SSLGYPTAGAGAFHGA
        .  : .::       :..  :  ..:.  ..  .: : :.   :. : :  . :.. :.
CCDS32 PGLNAHGAAQMQPMHRYDVSALQYNSMTSSQTYMNGSPTYSMSYSQQGTPGMALGSM-GS
           190       200       210       220       230       240   

      210       220        230       240       250       260       
pF1KB9 AAAAAAAAAAAGGHTHSHP-SPGNPGYMIPCNCSAWPSPGLQPPLAYILLPGMGKPQLDP
       .. . :...     . ::  .: . : .        :.  .  : :   :    . :  :
CCDS32 VVKSEASSSPPVVTSSSHSRAPCQAGDLRDMISMYLPGAEVPEPAAPSRLHMSQHYQSGP
            250       260       270       280       290       300  

       270            
pF1KB9 YPAAYAAAL      
        :             
CCDS32 VPGTAINGTLPLSHM
            310       

>>CCDS9523.1 SOX1 gene_id:6656|Hs108|chr13                (391 aa)
 initn: 742 init1: 555 opt: 611  Z-score: 448.8  bits: 91.3 E(32554): 1.1e-18
Smith-Waterman score: 684; 46.2% identity (64.9% similar) in 305 aa overlap (6-258:49-349)

                                        10        20        30     
pF1KB9                          MSKPVDHVKRPMNAFMVWSRAQRRKMAQENPKMHN
                                     :.:::::::::::::.::::::::::::::
CCDS95 PTNLSGPAGAGGGGGGGGGGGGGGGAKANQDRVKRPMNAFMVWSRGQRRKMAQENPKMHN
       20        30        40        50        60        70        

          40        50        60        70        80        90     
pF1KB9 SEISKRLGAEWKLLTESEKRPFIDEAKRLRAMHMKEHPDYKYRPRRKPKTLLKKDKFAFP
       ::::::::::::...:.::::::::::::::.::::::::::::::: ::::::::... 
CCDS95 SEISKRLGAEWKVMSEAEKRPFIDEAKRLRALHMKEHPDYKYRPRRKTKTLLKKDKYSLA
       80        90       100       110       120       130        

            100       110                 120       130            
pF1KB9 ---VPYGLGGVADAEHPALKAGAGLHA----------GAGGGLVPESLLAN---PEKAAA
          .  : :: . :   .. .:.:  :          .:::: .  .  ::   : ..::
CCDS95 GGLLAAGAGGGGAAVAMGVGVGVGAAAVGQRLESPGGAAGGGYAHVNGWANGAYPGSVAA
      140       150       160       170       180       190        

     140           150       160                    170        180 
pF1KB9 AAAAAA----ARVFFPQSAAAAAAAAAAAAAG-------------SPYSLLDLGS-KMAE
       ::::::    :.. . :  .:..:   :  :              .:.   :.:. ... 
CCDS95 AAAAAAMMQEAQLAYGQHPGAGGAHPHAHPAHPHPHHPHAHPHNPQPMHRYDMGALQYSP
      200       210       220       230       240       250        

                       190       200       210               220   
pF1KB9 ISSSSS----------GLPYASSLGYPTAGAGAFHGAAAAAAAAAAAA--------GGHT
       ::.:..          ::::... .  .:..:: ...:.:::::::::        :. .
CCDS95 ISNSQGYMSASPSGYGGLPYGAAAAAAAAAGGAHQNSAVAAAAAAAAASSGALGALGSLV
      260       270       280       290       300       310        

           230       240       250       260       270             
pF1KB9 HSHPSPGNPGYMIPCNCSAWPSPGLQPPLAYILLPGMGKPQLDPYPAAYAAAL       
       .:.:: . :.   : .  : : ::    .  . ::                         
CCDS95 KSEPSGSPPA---PAHSRA-PCPGDLREMISMYLPAGEGGDPAAAAAAAAQSRLHSLPQH
      320          330        340       350       360       370    

CCDS95 YQGAGAGVNGTVPLTHI
          380       390 

>>CCDS14669.1 SOX3 gene_id:6658|Hs108|chrX                (446 aa)
 initn: 565 init1: 565 opt: 602  Z-score: 441.7  bits: 90.2 E(32554): 2.8e-18
Smith-Waterman score: 612; 48.2% identity (66.3% similar) in 249 aa overlap (6-232:137-383)

                                        10        20        30     
pF1KB9                          MSKPVDHVKRPMNAFMVWSRAQRRKMAQENPKMHN
                                     :.:::::::::::::.:::::: :::::::
CCDS14 GKSSANAAGGANSGGGSSGGASGGGGGTDQDRVKRPMNAFMVWSRGQRRKMALENPKMHN
        110       120       130       140       150       160      

          40        50        60        70        80        90     
pF1KB9 SEISKRLGAEWKLLTESEKRPFIDEAKRLRAMHMKEHPDYKYRPRRKPKTLLKKDKFAFP
       :::::::::.:::::..::::::::::::::.::::.:::::::::: ::::::::...:
CCDS14 SEISKRLGADWKLLTDAEKRPFIDEAKRLRAVHMKEYPDYKYRPRRKTKTLLKKDKYSLP
        170       180       190       200       210       220      

         100       110       120       130       140       150     
pF1KB9 VPYGLGGVADAEHPALKAGAGLHAGAGGGLVPESLLANPEKAAAAAAAAAARVFFPQSAA
             :.: :   :  :.:.  . .: :   ..       : .: . .  .. . :  .
CCDS14 SGLLPPGAAAAAAAAAAAAAAASSPVGVGQRLDTYTHVNGWANGAYSLVQEQLGYAQPPS
        230       240       250       260       270       280      

         160               170            180       190       200  
pF1KB9 AAAAAAAAA--------AAGSPYS-LLDLGSK----MAEISSSSSGLPYASSLGYPTAGA
        ..     :         ::  :: ..  :..    .:  ....::  :..     ::.:
CCDS14 MSSPPPPPALPPMHRYDMAGLQYSPMMPPGAQSYMNVAAAAAAASG--YGGMAPSATAAA
        290       300       310       320       330         340    

               210             220       230       240       250   
pF1KB9 GAFHG---AAAAAAAAAAAA------GGHTHSHPSPGNPGYMIPCNCSAWPSPGLQPPLA
       .: .:   :.::::::::::      :. ..:.::   :                     
CCDS14 AAAYGQQPATAAAAAAAAAAMSLGPMGSVVKSEPSSPPPAIASHSQRACLGDLRDMISMY
          350       360       370       380       390       400    

           260       270                         
pF1KB9 YILLPGMGKPQLDPYPAAYAAAL                   
                                                 
CCDS14 LPPGGDAADAASPLPGGRLHGVHQHYQGAGTAVNGTVPLTHI
          410       420       430       440      

>>CCDS32549.1 SOX15 gene_id:6665|Hs108|chr17              (233 aa)
 initn: 476 init1: 458 opt: 471  Z-score: 353.3  bits: 72.9 E(32554): 2.3e-13
Smith-Waterman score: 474; 43.6% identity (62.7% similar) in 204 aa overlap (4-202:45-226)

                                          10        20        30   
pF1KB9                            MSKPVDHVKRPMNAFMVWSRAQRRKMAQENPKM
                                     :...:::::::::::: ::::.:::.::::
CCDS32 EPPAATAAASSSSGPQEREGAGSPAAPGTLPLEKVKRPMNAFMVWSSAQRRQMAQQNPKM
           20        30        40        50        60        70    

            40        50        60        70        80        90   
pF1KB9 HNSEISKRLGAEWKLLTESEKRPFIDEAKRLRAMHMKEHPDYKYRPRRKPKTLLKKDKFA
       :::::::::::.:::: :.:::::..::::::: :....:::::::::: :.        
CCDS32 HNSEISKRLGAQWKLLDEDEKRPFVEEAKRLRARHLRDYPDYKYRPRRKAKS--------
           80        90       100       110       120              

           100       110       120         130       140       150 
pF1KB9 FPVPYGLGGVADAEHPALKAGAGLHAGAGGGLV--PESLLANPEKAAAAAAAAAARVFFP
            : :       :. . : :    :.:: .  :    ..: .. .    . . ...:
CCDS32 ----SGAG-------PS-RCGQGRGNLASGGPLWGPGYATTQPSRGFGYRPPSYSTAYLP
            130               140       150       160       170    

             160        170       180       190         200        
pF1KB9 QSAAAAAAAAAAAAAGS-PYSLLDLGSKMAEISSSSSGLPYASSLGY--PTAGAGAFHGA
        : ...     : .  : : :   : ...  . . .  :: .:   :  : :::      
CCDS32 GSYGSSHCKLEAPSPCSLPQSDPRLQGEL--LPTYTHYLPPGSPTPYNPPLAGAPMPLTH
          180       190       200         210       220       230  

      210       220       230       240       250       260        
pF1KB9 AAAAAAAAAAAGGHTHSHPSPGNPGYMIPCNCSAWPSPGLQPPLAYILLPGMGKPQLDPY
                                                                   
CCDS32 L                                                           
                                                                   

>>CCDS4547.1 SOX4 gene_id:6659|Hs108|chr6                 (474 aa)
 initn: 505 init1: 393 opt: 456  Z-score: 338.7  bits: 71.3 E(32554): 1.5e-12
Smith-Waterman score: 464; 40.2% identity (65.2% similar) in 244 aa overlap (4-222:55-287)

                                          10        20        30   
pF1KB9                            MSKPVDHVKRPMNAFMVWSRAQRRKMAQENPKM
                                     :  :.:::::::::::. .:::. ...: :
CCDS45 GLELGIASSPTPGSTASTGGKADDPSWCKTPSGHIKRPMNAFMVWSQIERRKIMEQSPDM
           30        40        50        60        70        80    

            40        50        60        70        80        90   
pF1KB9 HNSEISKRLGAEWKLLTESEKRPFIDEAKRLRAMHMKEHPDYKYRPRRKPKTLLKKDKFA
       ::.::::::: .:::: .:.: ::: ::.:::  :: ..::::::::.: :.   ... .
CCDS45 HNAEISKRLGKRWKLLKDSDKIPFIREAERLRLKHMADYPDYKYRPRKKVKSGNANSSSS
           90       100       110       120       130       140    

                  100       110       120               130        
pF1KB9 F-----PVPYG--LGGVADAEHPALKAGAGLHAGAGGGLV--------PESLLANPEKAA
             :   :  .:: . . : .  .:.. .::.::: .        : .  .   :.:
CCDS45 AAASSKPGEKGDKVGGSGGGGHGGGGGGGSSNAGGGGGGASGGGANSKPAQKKSCGSKVA
          150       160       170       180       190       200    

      140           150             160       170       180        
pF1KB9 AAAAAAA----ARVFFP------QSAAAAAAAAAAAAAGSPYSLLDLGSKMAEISSSSSG
       ..:....    :....       ..::::::. ::  ::.  .:: ::.     ...  .
CCDS45 GGAGGGVSKPHAKLILAGGGGGGKAAAAAAASFAAEQAGAA-ALLPLGA-----AADHHS
          210       220       230       240        250             

      190       200       210       220       230       240        
pF1KB9 LPYASSLGYPTAGAGAFHGAAAAAAAAAAAAGGHTHSHPSPGNPGYMIPCNCSAWPSPGL
       :  : .   :.:.:.:  ..::.:.:: :: : :                          
CCDS45 LYKART---PSASASA--SSAASASAALAAPGKHLAEKKVKRVYLFGGLGTSSSPVGGVG
      260          270         280       290       300       310   

      250       260       270                                      
pF1KB9 QPPLAYILLPGMGKPQLDPYPAAYAAAL                                
                                                                   
CCDS45 AGADPSDPLGLYEEEGAGCSPDAPSLSGRSSAASSPAAGRSPADHRGYASLRAASPAPSS
           320       330       340       350       360       370   

>>CCDS12995.1 SOX12 gene_id:6666|Hs108|chr20              (315 aa)
 initn: 487 init1: 385 opt: 439  Z-score: 329.1  bits: 68.9 E(32554): 5.2e-12
Smith-Waterman score: 439; 34.4% identity (58.2% similar) in 273 aa overlap (4-265:36-295)

                                          10        20        30   
pF1KB9                            MSKPVDHVKRPMNAFMVWSRAQRRKMAQENPKM
                                     :  :.:::::::::::. .:::. .. : :
CCDS12 GARAKRDGGPPPPGPGPAEEGAREPGWCKTPSGHIKRPMNAFMVWSQHERRKIMDQWPDM
          10        20        30        40        50        60     

            40        50        60        70        80        90   
pF1KB9 HNSEISKRLGAEWKLLTESEKRPFIDEAKRLRAMHMKEHPDYKYRPRRKPKTLLKKDKFA
       ::.::::::: .:.:: .::: ::. ::.:::  :: ..::::::::.: :    :   :
CCDS12 HNAEISKRLGRRWQLLQDSEKIPFVREAERLRLKHMADYPDYKYRPRKKSKGAPAK---A
          70        80        90       100       110       120     

           100       110        120            130       140       
pF1KB9 FPVPYGLGGVADAEHPALK-AGAGLHAGAGGGL-----VPESLLANPEKAAAAA--AAAA
        : : : .: ..  .:. .  : : . .::: :     .::.   . ..    .  . . 
CCDS12 RPRPPGGSGGGSRLKPGPQLPGRGGRRAAGGPLGGGAAAPEDDDEDDDEELLEVRLVETP
            130       140       150       160       170       180  

         150       160       170       180       190       200     
pF1KB9 ARVFFPQSAAAAAAAAAAAAAGSPYSLLDLGSKMAEISSSSSGLPYASSLGYPTAGAGAF
       .: .. .  :. :: . :  : .: .    ..  :  . : .  :          .:.: 
CCDS12 GRELWRMVPAGRAARGQAERAQGPSGEGAAAAAAASPTPSEDEEPEEEE----EEAAAAE
            190       200       210       220       230            

         210       220       230       240        250         260  
pF1KB9 HGAAAAAAAAAAAAGGHTHSHPSPGNPGYMIPCNCSAWP-SPGLQPP--LAYILLPGMGK
       .:   ..:..  . :  ..  :.:..       .:::   .: ::::   ... .: .  
CCDS12 EGEEETVASGEESLGFLSRLPPGPAG------LDCSALDRDPDLQPPSGTSHFEFPDYCT
      240       250       260             270       280       290  

            270               
pF1KB9 PQLDPYPAAYAAAL         
       :..                    
CCDS12 PEVTEMIAGDWRPSSIADLVFTY
            300       310     

>>CCDS10428.1 SOX8 gene_id:30812|Hs108|chr16              (446 aa)
 initn: 466 init1: 393 opt: 428  Z-score: 319.4  bits: 67.6 E(32554): 1.8e-11
Smith-Waterman score: 428; 34.4% identity (58.0% similar) in 262 aa overlap (2-247:98-346)

                                            10        20        30 
pF1KB9                              MSKPVDHVKRPMNAFMVWSRAQRRKMAQENP
                                     .::  ::::::::::::..: :::.:.. :
CCDS10 IRDAVSQVLKGYDWSLVPMPVRGGGGGALKAKP--HVKRPMNAFMVWAQAARRKLADQYP
        70        80        90       100         110       120     

              40        50        60        70        80           
pF1KB9 KMHNSEISKRLGAEWKLLTESEKRPFIDEAKRLRAMHMKEHPDYKYRPRRKPKTLL---K
       ..::.:.:: ::  :.::.:::::::..::.:::..: :.::::::.:::. ..      
CCDS10 HLHNAELSKTLGKLWRLLSESEKRPFVEEAERLRVQHKKDHPDYKYQPRRRKSAKAGHSD
         130       140       150       160       170       180     

       90       100       110         120       130       140      
pF1KB9 KDKFAFPVPYGLGGVADAEHPALKAGA--GLHAGAGGGLVPESLLANPEKAAAAAAAAAA
       .:. :   :.  ::..   . .:  :   : :.:   :  : .  ..:.     :.:   
CCDS10 SDSGAELGPHPGGGAVYKAEAGLGDGHHHGDHTGQTHG--PPTPPTTPKTELQQAGAK--
         190       200       210       220         230       240   

        150       160       170       180       190                
pF1KB9 RVFFPQSAAAAAAAAAAAAAGSPYSLLDLGSKMAEISSSSSGLPYAS-----SLGYPT--
           :.    .   . ..  .  .: .:..   .:. .. ...          :: :.  
CCDS10 ----PELKLEGRRPVDSGRQNIDFSNVDISELSSEVMGTMDAFDVHEFDQYLPLGGPAPP
                 250       260       270       280       290       

         200       210       220       230       240       250     
pF1KB9 ----AGAGAFHGAAAAAAAAAAAAGGHTHSHPSPGNPGYMIPCNCSAWPSPGLQPPLAYI
           : .::.  :.:. . :  .: . . :    : :    :   .  ::::        
CCDS10 EPGQAYGGAYFHAGASPVWAHKSAPSASASPTETGPPR---PHIKTEQPSPGHYGDQPRG
       300       310       320       330          340       350    

         260       270                                             
pF1KB9 LLPGMGKPQLDPYPAAYAAAL                                       
                                                                   
CCDS10 SPDYGSCSGQSSATPAAPAGPFAGSQGDYGDLQASSYYGAYPGYAPGLYQYPCFHSPRRP
          360       370       380       390       400       410    

>>CCDS11689.1 SOX9 gene_id:6662|Hs108|chr17               (509 aa)
 initn: 422 init1: 396 opt: 423  Z-score: 315.1  bits: 67.0 E(32554): 3.1e-11
Smith-Waterman score: 433; 32.5% identity (55.4% similar) in 289 aa overlap (2-271:99-364)

                                            10        20        30 
pF1KB9                              MSKPVDHVKRPMNAFMVWSRAQRRKMAQENP
                                     ::   ::::::::::::..: :::.:.. :
CCDS11 FPVCIREAVSQVLKGYDWTLVPMPVRVNGSSKNKPHVKRPMNAFMVWAQAARRKLADQYP
       70        80        90       100       110       120        

              40        50        60        70        80        90 
pF1KB9 KMHNSEISKRLGAEWKLLTESEKRPFIDEAKRLRAMHMKEHPDYKYRPRRKPKTLLKKDK
       ..::.:.:: ::  :.::.:::::::..::.:::..: :.::::::.:::. :.. . . 
CCDS11 HLHNAELSKTLGKLWRLLNESEKRPFVEEAERLRVQHKKDHPDYKYQPRRR-KSVKNGQA
      130       140       150       160       170        180       

                    100       110             120       130        
pF1KB9 FAFPV-------PYGLGGVADAEHPALKAGA------GLHAGAGGGLVPESLLANPEKAA
        :  .       : ..  . .:. :  ..:       : :.: . :  : .  ..:.  .
CCDS11 EAEEATEQTHISPNAIFKALQADSPHSSSGMSEVHSPGEHSGQSQG--PPTPPTTPKTDV
       190       200       210       220       230         240     

      140       150       160       170       180       190        
pF1KB9 AAAAAAAARVFFPQSAAAAAAAAAAAAAGSPYSLLDLGSKMAEISSSSSGLP------YA
         . :   :   :   ..             .  .:.:   ... :.   .       : 
CCDS11 QPGKADLKREGRPLPEGGRQPPI-------DFRDVDIGELSSDVISNIETFDVNEFDQYL
         250       260              270       280       290        

            200       210       220       230       240       250  
pF1KB9 SSLGYPTAGAGAFHGAAAAAAAAAAAAGGHTHSHPSPGNPGYMIPCNCSAWPSPGLQPPL
          :.:  :. : :: .. ...      : . .  .:.. :..   . .: : :  ::: 
CCDS11 PPNGHP--GVPATHGQVTYTGSY-----GISSTAATPASAGHVWMSKQQAPPPPPQQPPQ
      300         310            320       330       340       350 

            260       270                                          
pF1KB9 AYILLPGMGKPQLDPYPAAYAAAL                                    
       :    :.   ::  : : :                                         
CCDS11 AP---PA---PQAPPQPQAAPPQQPAAPPQQPQAHTLTTLSSEPGQSQRTHIKTEQLSPS
                   360       370       380       390       400     




276 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Fri Nov  4 17:59:13 2016 done: Fri Nov  4 17:59:14 2016
 Total Scan time:  2.570 Total Display time:  0.030

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com