Result of FASTA (ccds) for pF1KB9720
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB9720, 404 aa
  1>>>pF1KB9720 404 - 404 aa - 404 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 5.8087+/-0.000718; mu= 17.2516+/- 0.044
 mean_var=106.7027+/-21.256, 0's: 0 Z-trim(113.2): 126  B-trim: 0 in 0/51
 Lambda= 0.124161
 statistics sampled from 13771 (13898) to 13771 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.76), E-opt: 0.2 (0.427), width:  16
 Scan time:  2.970

The best scores are:                                      opt bits E(32554)
CCDS12352.1 NR2F6 gene_id:2063|Hs108|chr19         ( 404) 2748 502.3 3.3e-142
CCDS4068.1 NR2F1 gene_id:7025|Hs108|chr5           ( 423) 1243 232.7 4.9e-61
CCDS10375.1 NR2F2 gene_id:7026|Hs108|chr15         ( 414) 1200 225.0   1e-58
CCDS45359.1 NR2F2 gene_id:7026|Hs108|chr15         ( 261) 1162 218.0 8.1e-57
CCDS45358.1 NR2F2 gene_id:7026|Hs108|chr15         ( 281) 1162 218.0 8.5e-57
CCDS9850.2 ESRRB gene_id:2103|Hs108|chr14          ( 508)  667 129.6 6.4e-30
CCDS41667.1 ESRRA gene_id:2101|Hs108|chr11         ( 423)  653 127.0 3.2e-29
CCDS60830.1 ESRRA gene_id:2101|Hs108|chr11         ( 422)  648 126.1 5.9e-29
CCDS73750.1 NR2E3 gene_id:10002|Hs108|chr15        ( 410)  633 123.4 3.7e-28
CCDS58061.1 ESRRG gene_id:2104|Hs108|chr1          ( 470)  627 122.4 8.7e-28
CCDS1517.1 ESRRG gene_id:2104|Hs108|chr1           ( 435)  624 121.8 1.2e-27
CCDS41468.1 ESRRG gene_id:2104|Hs108|chr1          ( 458)  624 121.9 1.2e-27
CCDS41790.1 RARG gene_id:5916|Hs108|chr12          ( 443)  620 121.1   2e-27
CCDS58236.1 RARG gene_id:5916|Hs108|chr12          ( 382)  615 120.2 3.3e-27
CCDS8850.1 RARG gene_id:5916|Hs108|chr12           ( 454)  615 120.3 3.8e-27
CCDS11366.1 RARA gene_id:5914|Hs108|chr17          ( 462)  613 119.9 4.9e-27
CCDS42317.1 RARA gene_id:5914|Hs108|chr17          ( 457)  601 117.7 2.2e-26
CCDS2642.1 RARB gene_id:5915|Hs108|chr3            ( 448)  583 114.5   2e-25
CCDS2201.1 NR4A2 gene_id:4929|Hs108|chr2           ( 598)  580 114.1 3.5e-25
CCDS5063.1 NR2E1 gene_id:7101|Hs108|chr6           ( 385)  540 106.8 3.7e-23
CCDS69165.1 NR2E1 gene_id:7101|Hs108|chr6          ( 422)  540 106.8   4e-23
CCDS6743.1 NR4A3 gene_id:8013|Hs108|chr9           ( 626)  501 100.0 6.7e-21
CCDS6742.1 NR4A3 gene_id:8013|Hs108|chr9           ( 637)  501 100.0 6.8e-21
CCDS73751.1 NR2E3 gene_id:10002|Hs108|chr15        ( 367)  497 99.0 7.5e-21
CCDS58237.1 RARG gene_id:5916|Hs108|chr12          ( 432)  485 96.9 3.7e-20
CCDS74905.1 NR2C2 gene_id:7182|Hs108|chr3          ( 596)  457 92.1 1.5e-18
CCDS2621.1 NR2C2 gene_id:7182|Hs108|chr3           ( 615)  457 92.1 1.6e-18
CCDS4278.1 NR3C1 gene_id:2908|Hs108|chr5           ( 777)  455 91.8 2.4e-18
CCDS34258.1 NR3C1 gene_id:2908|Hs108|chr5          ( 778)  453 91.5   3e-18
CCDS43965.1 AR gene_id:367|Hs108|chrX              ( 388)  444 89.6 5.6e-18
CCDS61470.1 ESR2 gene_id:2100|Hs108|chr14          ( 474)  443 89.5 7.3e-18
CCDS55920.1 ESR2 gene_id:2100|Hs108|chr14          ( 481)  443 89.5 7.4e-18
CCDS32096.1 ESR2 gene_id:2100|Hs108|chr14          ( 495)  443 89.5 7.6e-18
CCDS9762.1 ESR2 gene_id:2100|Hs108|chr14           ( 530)  443 89.5 7.9e-18
CCDS47298.1 NR3C1 gene_id:2908|Hs108|chr5          ( 742)  444 89.8 8.9e-18
CCDS8818.1 NR4A1 gene_id:3164|Hs108|chr12          ( 598)  442 89.4 9.8e-18
CCDS55828.1 NR4A1 gene_id:3164|Hs108|chr12         ( 611)  442 89.4   1e-17
CCDS73471.1 NR4A1 gene_id:3164|Hs108|chr12         ( 652)  442 89.4   1e-17
CCDS14387.1 AR gene_id:367|Hs108|chrX              ( 920)  444 89.9   1e-17
CCDS4768.1 RXRB gene_id:6257|Hs108|chr6            ( 533)  432 87.5 3.1e-17
CCDS59007.1 RXRB gene_id:6257|Hs108|chr6           ( 537)  432 87.5 3.1e-17
CCDS1248.1 RXRG gene_id:6258|Hs108|chr1            ( 463)  427 86.6 5.2e-17
CCDS35172.1 RXRA gene_id:6256|Hs108|chr9           ( 462)  422 85.7 9.7e-17
CCDS41821.1 NR2C1 gene_id:7181|Hs108|chr12         ( 467)  422 85.7 9.8e-17
CCDS44953.1 NR2C1 gene_id:7181|Hs108|chr12         ( 483)  422 85.7   1e-16
CCDS1228.1 NR1I3 gene_id:9970|Hs108|chr1           ( 348)  419 85.0 1.2e-16
CCDS9051.1 NR2C1 gene_id:7181|Hs108|chr12          ( 603)  422 85.8 1.2e-16
CCDS8310.1 PGR gene_id:5241|Hs108|chr11            ( 933)  424 86.3 1.3e-16
CCDS72970.1 RXRG gene_id:6258|Hs108|chr1           ( 340)  417 84.7 1.5e-16
CCDS74728.1 HNF4A gene_id:3172|Hs108|chr20         ( 449)  417 84.8 1.8e-16


>>CCDS12352.1 NR2F6 gene_id:2063|Hs108|chr19              (404 aa)
 initn: 2748 init1: 2748 opt: 2748  Z-score: 2666.5  bits: 502.3 E(32554): 3.3e-142
Smith-Waterman score: 2748; 100.0% identity (100.0% similar) in 404 aa overlap (1-404:1-404)

               10        20        30        40        50        60
pF1KB9 MAMVTGGWGGPGGDTNGVDKAGGYPRAAEDDSASPPGAASDAEPGDEERPGLQVDCVVCG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 MAMVTGGWGGPGGDTNGVDKAGGYPRAAEDDSASPPGAASDAEPGDEERPGLQVDCVVCG
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB9 DKSSGKHYGVFTCEGCKSFFKRSIRRNLSYTCRSNRDCQIDQHHRNQCQYCRLKKCFRVG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 DKSSGKHYGVFTCEGCKSFFKRSIRRNLSYTCRSNRDCQIDQHHRNQCQYCRLKKCFRVG
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB9 MRKEAVQRGRIPHSLPGAVAASSGSPPGSALAAVASGGDLFPGQPVSELIAQLLRAEPYP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 MRKEAVQRGRIPHSLPGAVAASSGSPPGSALAAVASGGDLFPGQPVSELIAQLLRAEPYP
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB9 AAAGRFGAGGGAAGAVLGIDNVCELAARLLFSTVEWARHAPFFPELPVADQVALLRLSWS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 AAAGRFGAGGGAAGAVLGIDNVCELAARLLFSTVEWARHAPFFPELPVADQVALLRLSWS
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB9 ELFVLNAAQAALPLHTAPLLAAAGLHAAPMAAERAVAFMDQVRAFQEQVDKLGRLQVDSA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 ELFVLNAAQAALPLHTAPLLAAAGLHAAPMAAERAVAFMDQVRAFQEQVDKLGRLQVDSA
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB9 EYGCLKAIALFTPDACGLSDPAHVESLQEKAQVALTEYVRAQYPSQPQRFGRLLLRLPAL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 EYGCLKAIALFTPDACGLSDPAHVESLQEKAQVALTEYVRAQYPSQPQRFGRLLLRLPAL
              310       320       330       340       350       360

              370       380       390       400    
pF1KB9 RAVPASLISQLFFMRLVGKTPIETLIRDMLLSGSTFNWPYGSGQ
       ::::::::::::::::::::::::::::::::::::::::::::
CCDS12 RAVPASLISQLFFMRLVGKTPIETLIRDMLLSGSTFNWPYGSGQ
              370       380       390       400    

>>CCDS4068.1 NR2F1 gene_id:7025|Hs108|chr5                (423 aa)
 initn: 1660 init1: 1089 opt: 1243  Z-score: 1209.3  bits: 232.7 E(32554): 4.9e-61
Smith-Waterman score: 1713; 64.3% identity (82.0% similar) in 406 aa overlap (9-404:32-421)

                                     10        20         30       
pF1KB9                       MAMVTGGWGGPGGDTNGVDKAG-GYPRAAEDDSASPPG
                                     :: ::  .  ..:: : :.. .  . . ::
CCDS40 AMVVSSWRDPQDDVAGGNPGGPNPAAQAARGGGGGAGEQQQQAGSGAPHTPQ--TPGQPG
              10        20        30        40        50           

         40          50             60        70        80         
pF1KB9 A-ASDAEPGDEER--PG-----LQVDCVVCGDKSSGKHYGVFTCEGCKSFFKRSIRRNLS
       : :. .  ::. .  ::      ...:::::::::::::: :::::::::::::.::::.
CCDS40 APATPGTAGDKGQGPPGSGQSQQHIECVVCGDKSSGKHYGQFTCEGCKSFFKRSVRRNLT
      60        70        80        90       100       110         

      90       100       110       120       130       140         
pF1KB9 YTCRSNRDCQIDQHHRNQCQYCRLKKCFRVGMRKEAVQRGRIPHSLPGAVAASSGSPPGS
       ::::.::.: :::::::::::::::::..::::.:::::::.: . :        .:   
CCDS40 YTCRANRNCPIDQHHRNQCQYCRLKKCLKVGMRREAVQRGRMPPTQP--------NPGQY
     120       130       140       150       160               170 

     150       160        170       180       190       200        
pF1KB9 ALAAVASGGDLFPGQ-PVSELIAQLLRAEPYPAAAGRFGAGGGAAGAVLGIDNVCELAAR
       ::    ..:: . :.  .:  :. ::::::::..  :.:.     . ..::.:.::::::
CCDS40 AL----TNGDPLNGHCYLSGYISLLLRAEPYPTS--RYGSQCMQPNNIMGIENICELAAR
                 180       190       200         210       220     

      210       220       230       240       250       260        
pF1KB9 LLFSTVEWARHAPFFPELPVADQVALLRLSWSELFVLNAAQAALPLHTAPLLAAAGLHAA
       ::::.:::::. ::::.: ..:::.::::.::::::::::: ..:::.:::::::::::.
CCDS40 LLFSAVEWARNIPFFPDLQITDQVSLLRLTWSELFVLNAAQCSMPLHVAPLLAAAGLHAS
         230       240       250       260       270       280     

      270       280       290       300       310       320        
pF1KB9 PMAAERAVAFMDQVRAFQEQVDKLGRLQVDSAEYGCLKAIALFTPDACGLSDPAHVESLQ
       ::.:.:.:::::..: :::::.::  :.::::::.:::::.::: ::::::: ::.::::
CCDS40 PMSADRVVAFMDHIRIFQEQVEKLKALHVDSAEYSCLKAIVLFTSDACGLSDAAHIESLQ
         290       300       310       320       330       340     

      330       340       350       360       370       380        
pF1KB9 EKAQVALTEYVRAQYPSQPQRFGRLLLRLPALRAVPASLISQLFFMRLVGKTPIETLIRD
       ::.: :: ::::.:::.::.:::.::::::.::.: .:.: ::::.::::::::::::::
CCDS40 EKSQCALEEYVRSQYPNQPSRFGKLLLRLPSLRTVSSSVIEQLFFVRLVGKTPIETLIRD
         350       360       370       380       390       400     

      390       400      
pF1KB9 MLLSGSTFNWPYGSGQ  
       ::::::.::::: : :  
CCDS40 MLLSGSSFNWPYMSIQCS
         410       420   

>>CCDS10375.1 NR2F2 gene_id:7026|Hs108|chr15              (414 aa)
 initn: 1725 init1: 1111 opt: 1200  Z-score: 1167.7  bits: 225.0 E(32554): 1e-58
Smith-Waterman score: 1701; 64.2% identity (81.5% similar) in 400 aa overlap (9-404:31-414)

                                     10        20         30       
pF1KB9                       MAMVTGGWGGPGGDTNGVDKAG-GYPRAAEDDSASPPG
                                     : : :  .  .  : : : ..  ..:.  :
CCDS10 MAMVVSTWRDPQDEVPGSQGSQASQAPPVPGPPPGAPHTPQTPGQGGPASTPAQTAAG-G
               10        20        30        40        50          

        40         50        60        70        80        90      
pF1KB9 AASDAEPG-DEERPGLQVDCVVCGDKSSGKHYGVFTCEGCKSFFKRSIRRNLSYTCRSNR
        .. . :: :...   ...:::::::::::::: :::::::::::::.:::::::::.::
CCDS10 QGGPGGPGSDKQQQQQHIECVVCGDKSSGKHYGQFTCEGCKSFFKRSVRRNLSYTCRANR
      60        70        80        90       100       110         

        100       110       120       130         140       150    
pF1KB9 DCQIDQHHRNQCQYCRLKKCFRVGMRKEAVQRGRIPHSLP--GAVAASSGSPPGSALAAV
       .: :::::::::::::::::..::::.:::::::.: . :  :  : ..:.:        
CCDS10 NCPIDQHHRNQCQYCRLKKCLKVGMRREAVQRGRMPPTQPTHGQFALTNGDP--------
     120       130       140       150       160       170         

          160       170       180       190       200       210    
pF1KB9 ASGGDLFPGQPVSELIAQLLRAEPYPAAAGRFGAGGGAAGAVLGIDNVCELAARLLFSTV
            :   . .:  :. ::::::::..  :::.     . ..::.:.::::::.:::.:
CCDS10 -----LNCHSYLSGYISLLLRAEPYPTS--RFGSQCMQPNNIMGIENICELAARMLFSAV
                  180       190         200       210       220    

          220       230       240       250       260       270    
pF1KB9 EWARHAPFFPELPVADQVALLRLSWSELFVLNAAQAALPLHTAPLLAAAGLHAAPMAAER
       ::::. ::::.: ..::::::::.::::::::::: ..:::.:::::::::::.::.:.:
CCDS10 EWARNIPFFPDLQITDQVALLRLTWSELFVLNAAQCSMPLHVAPLLAAAGLHASPMSADR
          230       240       250       260       270       280    

          280       290       300       310       320       330    
pF1KB9 AVAFMDQVRAFQEQVDKLGRLQVDSAEYGCLKAIALFTPDACGLSDPAHVESLQEKAQVA
       .:::::..: :::::.::  :.::::::.:::::.::: ::::::: :::::::::.: :
CCDS10 VVAFMDHIRIFQEQVEKLKALHVDSAEYSCLKAIVLFTSDACGLSDVAHVESLQEKSQCA
          290       300       310       320       330       340    

          340       350       360       370       380       390    
pF1KB9 LTEYVRAQYPSQPQRFGRLLLRLPALRAVPASLISQLFFMRLVGKTPIETLIRDMLLSGS
       : ::::.:::.:: :::.::::::.::.: .:.: ::::.::::::::::::::::::::
CCDS10 LEEYVRSQYPNQPTRFGKLLLRLPSLRTVSSSVIEQLFFVRLVGKTPIETLIRDMLLSGS
          350       360       370       380       390       400    

          400    
pF1KB9 TFNWPYGSGQ
       .::::: . :
CCDS10 SFNWPYMAIQ
          410    

>>CCDS45359.1 NR2F2 gene_id:7026|Hs108|chr15              (261 aa)
 initn: 1111 init1: 1111 opt: 1162  Z-score: 1133.6  bits: 218.0 E(32554): 8.1e-57
Smith-Waterman score: 1162; 67.7% identity (85.8% similar) in 260 aa overlap (145-404:4-261)

          120       130       140       150       160       170    
pF1KB9 KCFRVGMRKEAVQRGRIPHSLPGAVAASSGSPPGSALAAVASGGDLFPGQPVSELIAQLL
                                     . :  .  :...:  :   . .:  :. ::
CCDS45                            MPPTQPTHGQFALTNGDPLNCHSYLSGYISLLL
                                          10        20        30   

          180       190       200       210       220       230    
pF1KB9 RAEPYPAAAGRFGAGGGAAGAVLGIDNVCELAARLLFSTVEWARHAPFFPELPVADQVAL
       ::::::..  :::.     . ..::.:.::::::.:::.:::::. ::::.: ..:::::
CCDS45 RAEPYPTS--RFGSQCMQPNNIMGIENICELAARMLFSAVEWARNIPFFPDLQITDQVAL
            40          50        60        70        80        90 

          240       250       260       270       280       290    
pF1KB9 LRLSWSELFVLNAAQAALPLHTAPLLAAAGLHAAPMAAERAVAFMDQVRAFQEQVDKLGR
       :::.::::::::::: ..:::.:::::::::::.::.:.:.:::::..: :::::.::  
CCDS45 LRLTWSELFVLNAAQCSMPLHVAPLLAAAGLHASPMSADRVVAFMDHIRIFQEQVEKLKA
             100       110       120       130       140       150 

          300       310       320       330       340       350    
pF1KB9 LQVDSAEYGCLKAIALFTPDACGLSDPAHVESLQEKAQVALTEYVRAQYPSQPQRFGRLL
       :.::::::.:::::.::: ::::::: :::::::::.: :: ::::.:::.:: :::.::
CCDS45 LHVDSAEYSCLKAIVLFTSDACGLSDVAHVESLQEKSQCALEEYVRSQYPNQPTRFGKLL
             160       170       180       190       200       210 

          360       370       380       390       400    
pF1KB9 LRLPALRAVPASLISQLFFMRLVGKTPIETLIRDMLLSGSTFNWPYGSGQ
       ::::.::.: .:.: ::::.::::::::::::::::::::.::::: . :
CCDS45 LRLPSLRTVSSSVIEQLFFVRLVGKTPIETLIRDMLLSGSSFNWPYMAIQ
             220       230       240       250       260 

>>CCDS45358.1 NR2F2 gene_id:7026|Hs108|chr15              (281 aa)
 initn: 1156 init1: 1111 opt: 1162  Z-score: 1133.1  bits: 218.0 E(32554): 8.5e-57
Smith-Waterman score: 1185; 65.6% identity (82.3% similar) in 282 aa overlap (125-404:15-281)

          100       110       120       130         140       150  
pF1KB9 NRDCQIDQHHRNQCQYCRLKKCFRVGMRKEAVQRGRIPHSLP--GAVAASSGSPPGSALA
                                     ::::::.: . :  :  : ..:.:      
CCDS45                 MQAVWDLEQGKYGFAVQRGRMPPTQPTHGQFALTNGDP------
                               10        20        30              

            160       170       180       190       200       210  
pF1KB9 AVASGGDLFPGQPVSELIAQLLRAEPYPAAAGRFGAGGGAAGAVLGIDNVCELAARLLFS
              :   . .:  :. ::::::::..  :::.     . ..::.:.::::::.:::
CCDS45 -------LNCHSYLSGYISLLLRAEPYPTS--RFGSQCMQPNNIMGIENICELAARMLFS
              40        50        60          70        80         

            220       230       240       250       260       270  
pF1KB9 TVEWARHAPFFPELPVADQVALLRLSWSELFVLNAAQAALPLHTAPLLAAAGLHAAPMAA
       .:::::. ::::.: ..::::::::.::::::::::: ..:::.:::::::::::.::.:
CCDS45 AVEWARNIPFFPDLQITDQVALLRLTWSELFVLNAAQCSMPLHVAPLLAAAGLHASPMSA
      90       100       110       120       130       140         

            280       290       300       310       320       330  
pF1KB9 ERAVAFMDQVRAFQEQVDKLGRLQVDSAEYGCLKAIALFTPDACGLSDPAHVESLQEKAQ
       .:.:::::..: :::::.::  :.::::::.:::::.::: ::::::: :::::::::.:
CCDS45 DRVVAFMDHIRIFQEQVEKLKALHVDSAEYSCLKAIVLFTSDACGLSDVAHVESLQEKSQ
     150       160       170       180       190       200         

            340       350       360       370       380       390  
pF1KB9 VALTEYVRAQYPSQPQRFGRLLLRLPALRAVPASLISQLFFMRLVGKTPIETLIRDMLLS
        :: ::::.:::.:: :::.::::::.::.: .:.: ::::.::::::::::::::::::
CCDS45 CALEEYVRSQYPNQPTRFGKLLLRLPSLRTVSSSVIEQLFFVRLVGKTPIETLIRDMLLS
     210       220       230       240       250       260         

            400    
pF1KB9 GSTFNWPYGSGQ
       ::.::::: . :
CCDS45 GSSFNWPYMAIQ
     270       280 

>>CCDS9850.2 ESRRB gene_id:2103|Hs108|chr14               (508 aa)
 initn: 708 init1: 320 opt: 667  Z-score: 650.6  bits: 129.6 E(32554): 6.4e-30
Smith-Waterman score: 680; 32.6% identity (59.6% similar) in 399 aa overlap (5-390:42-429)

                                          10        20             
pF1KB9                           MAMVTGGWG-GPGGDTNGVDKA--------GGYP
                                     .::.: . :  .::.:.         :: :
CCDS98 CGSFIKTEPSSPSSGIDALSHHSPSGSSDASGGFGLALGTHANGLDSPPMFAGAGLGGTP
              20        30        40        50        60        70 

           30        40        50          60        70        80  
pF1KB9 -RAAEDDSASPPGAASDAEPGDEERPGL--QVDCVVCGDKSSGKHYGVFTCEGCKSFFKR
        : . .: ::  :   :.    :   .   .  :.:::: .:: :::: .::.::.::::
CCDS98 CRKSYEDCAS--GIMEDSAIKCEYMLNAIPKRLCLVCGDIASGYHYGVASCEACKAFFKR
              80          90       100       110       120         

             90       100       110       120       130        140 
pF1KB9 SIRRNLSYTCRSNRDCQIDQHHRNQCQYCRLKKCFRVGMRKEAVQRGRIPHSLPG-AVAA
       .:. :. :.: .. .:.: ...:..:: ::. ::..::: ::.:.  :.  .        
CCDS98 TIQGNIEYSCPATNECEITKRRRKSCQACRFMKCLKVGMLKEGVRLDRVRGGRQKYKRRL
     130       140       150       160       170       180         

             150       160       170       180       190       200 
pF1KB9 SSGSPPGSALAAVASGGDLFPGQPVSELIAQLLRAEPYPAAAGRFGAGGGAAGAVLGIDN
       .: : :  .:     .      .:...... :: :::    :  .   :   : . .. .
CCDS98 DSESSPYLSLQISPPAK-----KPLTKIVSYLLVAEPDKLYA--MPPPGMPEGDIKALTT
     190       200            210       220         230       240  

             210       220       230       240       250       260 
pF1KB9 VCELAARLLFSTVEWARHAPFFPELPVADQVALLRLSWSELFVLNAAQAALPLHTAPLLA
       .:.:: : :   . ::.: : :  : ..::..::. .: :...:. .  .::      :.
CCDS98 LCDLADRELVVIIGWAKHIPGFSSLSLGDQMSLLQSAWMEILILGIVYRSLPYDDK--LV
            250       260       270       280       290         300

             270       280       290       300       310       320 
pF1KB9 AAGLHAAPMAAERAVAFMDQVRAFQEQVDKLGRLQVDSAEYGCLKAIALFTPDACGLSDP
        :  .       : .....  ::. . : .  .:.:.. :.  :::.:: . :.  . : 
CCDS98 YAEDYIMDEEHSRLAGLLELYRAILQLVRRYKKLKVEKEEFVTLKALALANSDSMYIEDL
              310       320       330       340       350       360

             330       340       350       360       370       380 
pF1KB9 AHVESLQEKAQVALTEYVRAQYPSQPQRFGRLLLRLPALRAVPASLISQLFFMRLVGKTP
         :..::.  . :: .:  .:   .: : :.::: :: :: . :. ..... ..: ::.:
CCDS98 EAVQKLQDLLHEALQDYELSQRHEEPWRTGKLLLTLPLLRQTAAKAVQHFYSVKLQGKVP
              370       380       390       400       410       420

             390       400                                         
pF1KB9 IETLIRDMLLSGSTFNWPYGSGQ                                     
       .. :. .::                                                   
CCDS98 MHKLFLEMLEAKVGQEQLRGSPKDERMSSHDGKCPFQSAAFTSRDQSNSPGIPNPRPSSP
              430       440       450       460       470       480

>>CCDS41667.1 ESRRA gene_id:2101|Hs108|chr11              (423 aa)
 initn: 670 init1: 319 opt: 653  Z-score: 638.1  bits: 127.0 E(32554): 3.2e-29
Smith-Waterman score: 654; 34.0% identity (61.2% similar) in 379 aa overlap (26-390:51-418)

                    10        20        30        40        50     
pF1KB9      MAMVTGGWGGPGGDTNGVDKAGGYPRAAEDDSASPPGAASDAEPGDEERPGLQVD
                                     .  ::  .. ::  . ..      :  .  
CCDS41 DSPKGSSETETEPPVALAPGPAPTRCLPGHKEEEDGEGAGPGEQGGGKLVLSSLP--KRL
               30        40        50        60        70          

          60        70        80        90       100       110     
pF1KB9 CVVCGDKSSGKHYGVFTCEGCKSFFKRSIRRNLSYTCRSNRDCQIDQHHRNQCQYCRLKK
       :.:::: .:: :::: .::.::.::::.:. .. :.: .. .:.: ...:. :: ::. :
CCDS41 CLVCGDVASGYHYGVASCEACKAFFKRTIQGSIEYSCPASNECEITKRRRKACQACRFTK
       80        90       100       110       120       130        

         120                 130       140       150       160     
pF1KB9 CFRVGMRKEAVQ----RG------RIPHSLPGAVAASSGSPPGSALAAVASGGDLFPGQP
       :.:::: ::.:.    ::      : :.  :       :  :.. ::.  .::    . :
CCDS41 CLRVGMLKEGVRLDRVRGGRQKYKRRPEVDPLPFP---GPFPAGPLAV--AGGPRKTAAP
      140       150       160       170          180         190   

         170       180       190       200       210       220     
pF1KB9 VSELIAQLLRAEPYPAAAGRFGAGGGAAGAVLGIDNVCELAARLLFSTVEWARHAPFFPE
       :. :...:: .::    :  .   .:  : . .. ..:.:  : .  :. ::.  : :  
CCDS41 VNALVSHLLVVEPEKLYA--MPDPAGPDGHLPAVATLCDLFDREIVVTISWAKSIPGFSS
           200       210         220       230       240       250 

         230       240       250       260       270       280     
pF1KB9 LPVADQVALLRLSWSELFVLNAAQAALPLHTAPLLAAAGLHAAPMAAERAVAFMDQVRAF
       : ..::...:.  : :..::..:: .:::.    :: :   .    . ::... .   :.
CCDS41 LSLSDQMSVLQSVWMEVLVLGVAQRSLPLQDE--LAFAEDLVLDEEGARAAGLGELGAAL
             260       270       280         290       300         

         290       300       310       320       330       340     
pF1KB9 QEQVDKLGRLQVDSAEYGCLKAIALFTPDACGLSDPAHVESLQEKAQVALTEYVRAQY-P
        . : .:  :...  ::  :::.:: . :.  . :   ::.:.:  . :: ::  ..  :
CCDS41 LQLVRRLQALRLEREEYVLLKALALANSDSVHIEDAEAVEQLREALHEALLEYEAGRAGP
     310       320       330       340       350       360         

             350       360       370       380       390       400 
pF1KB9 ---SQPQRFGRLLLRLPALRAVPASLISQLFFMRLVGKTPIETLIRDMLLSGSTFNWPYG
          .. .: ::::: :: :: . ........ ..: ::.:.. :. .::           
CCDS41 GGGAERRRAGRLLLTLPLLRQTAGKVLAHFYGVKLEGKVPMHKLFLEMLEAMMD      
     370       380       390       400       410       420         

          
pF1KB9 SGQ

>>CCDS60830.1 ESRRA gene_id:2101|Hs108|chr11              (422 aa)
 initn: 568 init1: 319 opt: 648  Z-score: 633.3  bits: 126.1 E(32554): 5.9e-29
Smith-Waterman score: 648; 33.5% identity (61.1% similar) in 373 aa overlap (26-390:51-417)

                    10        20        30        40        50     
pF1KB9      MAMVTGGWGGPGGDTNGVDKAGGYPRAAEDDSASPPGAASDAEPGDEERPGLQVD
                                     .  ::  .. ::  . ..      :  .  
CCDS60 DSPKGSSETETEPPVALAPGPAPTRCLPGHKEEEDGEGAGPGEQGGGKLVLSSLP--KRL
               30        40        50        60        70          

          60        70        80        90       100       110     
pF1KB9 CVVCGDKSSGKHYGVFTCEGCKSFFKRSIRRNLSYTCRSNRDCQIDQHHRNQCQYCRLKK
       :.:::: .:: :::: .::.::.::::.:. .. :.: .. .:.: ...:. :: ::. :
CCDS60 CLVCGDVASGYHYGVASCEACKAFFKRTIQGSIEYSCPASNECEITKRRRKACQACRFTK
       80        90       100       110       120       130        

         120       130       140          150        160       170 
pF1KB9 CFRVGMRKEAVQRGRIPHSLPGAVAASSGSP---PGSALAA-VASGGDLFPGQPVSELIA
       :.:::: ::.:.  :.  .          .:   ::   :. .: .:      ::. :..
CCDS60 CLRVGMLKEGVRLDRVRGGRQKYKRRPEVDPLPFPGPFPAGPLAVAGGPRKTAPVNALVS
      140       150       160       170       180       190        

             180       190       200       210       220       230 
pF1KB9 QLLRAEPYPAAAGRFGAGGGAAGAVLGIDNVCELAARLLFSTVEWARHAPFFPELPVADQ
       .:: .::    :  .   .:  : . .. ..:.:  : .  :. ::.  : :  : ..::
CCDS60 HLLVVEPEKLYA--MPDPAGPDGHLPAVATLCDLFDREIVVTISWAKSIPGFSSLSLSDQ
      200       210         220       230       240       250      

             240       250       260       270       280       290 
pF1KB9 VALLRLSWSELFVLNAAQAALPLHTAPLLAAAGLHAAPMAAERAVAFMDQVRAFQEQVDK
       ...:.  : :..::..:: .:::.    :: :   .    . ::... .   :. . : .
CCDS60 MSVLQSVWMEVLVLGVAQRSLPLQDE--LAFAEDLVLDEEGARAAGLGELGAALLQLVRR
        260       270       280         290       300       310    

             300       310       320       330       340           
pF1KB9 LGRLQVDSAEYGCLKAIALFTPDACGLSDPAHVESLQEKAQVALTEYVRAQY-P---SQP
       :  :...  ::  :::.:: . :.  . :   ::.:.:  . :: ::  ..  :   .. 
CCDS60 LQALRLEREEYVLLKALALANSDSVHIEDAEAVEQLREALHEALLEYEAGRAGPGGGAER
          320       330       340       350       360       370    

       350       360       370       380       390       400    
pF1KB9 QRFGRLLLRLPALRAVPASLISQLFFMRLVGKTPIETLIRDMLLSGSTFNWPYGSGQ
       .: ::::: :: :: . ........ ..: ::.:.. :. .::              
CCDS60 RRAGRLLLTLPLLRQTAGKVLAHFYGVKLEGKVPMHKLFLEMLEAMMD         
          380       390       400       410       420           

>>CCDS73750.1 NR2E3 gene_id:10002|Hs108|chr15             (410 aa)
 initn: 955 init1: 573 opt: 633  Z-score: 618.9  bits: 123.4 E(32554): 3.7e-28
Smith-Waterman score: 956; 41.1% identity (65.5% similar) in 397 aa overlap (21-390:14-408)

               10        20        30        40        50        60
pF1KB9 MAMVTGGWGGPGGDTNGVDKAGGYPRAAEDDSASPPGAASDAEPGDEERPGLQVDCVVCG
                           :.. : :.  .    ::  . .:      :.::  : :::
CCDS73        METRPTALMSSTVAAAAPAAGAASRKESPGRWGLGEDPTGVSPSLQ--CRVCG
                      10        20        30        40          50 

               70        80        90        100       110         
pF1KB9 DKSSGKHYGVFTCEGCKSFFKRSIRRNLSYTCRSNRD-CQIDQHHRNQCQYCRLKKCFRV
       :.:::::::...:.::..:::::.:: : : :. .   : .:. :::::: ::::::...
CCDS73 DSSSGKHYGIYACNGCSGFFKRSVRRRLIYRCQVGAGMCPVDKAHRNQCQACRLKKCLQA
              60        70        80        90       100       110 

     120       130           140       150       160               
pF1KB9 GMRKEAVQRGRIPHSLP----GAVAASSGSPPGSALAAVASGGDLFPGQ-PVS-------
       :: ..:::  : :.:       .. ... : : : .:  : .:    :  :.:       
CCDS73 GMNQDAVQNERQPRSTAQVHLDSMESNTESRPESLVAPPAPAGRSPRGPTPMSAARALGH
             120       130       140       150       160       170 

       170             180               190       200       210   
pF1KB9 ELIAQLLRAE------PYPAAAG--------RFGAGGGAAGAVLGIDNVCELAARLLFST
       ...:.:. ::      :  :  .        .: ..  ....  :.:.. : .::::: .
CCDS73 HFMASLITAETCAKLEPEDADENIDVTSNDPEFPSSPYSSSSPCGLDSIHETSARLLFMA
             180       190       200       210       220       230 

           220       230       240       250       260       270   
pF1KB9 VEWARHAPFFPELPVADQVALLRLSWSELFVLNAAQAALPLHTAPLLAAAGLHAAPMAAE
       :.::.. : :  ::  ::: ::. .:::::.:.: : .::: . ::::     ::  :  
CCDS73 VKWAKNLPVFSSLPFRDQVILLEEAWSELFLLGAIQWSLPLDSCPLLAPPEASAAGGAQG
             240       250       260       270       280       290 

           280       290       300       310       320       330   
pF1KB9 RAVAFMDQVRAFQEQVDKLGRLQVDSAEYGCLKAIALFTPDACGLSDPAHVESLQEKAQV
       : .    ..:..:: ....  : :: .:..:.::..:: :.. ::.:: :::.::...::
CCDS73 RLTLASMETRVLQETISRFRALAVDPTEFACMKALVLFKPETRGLKDPEHVEALQDQSQV
             300       310       320       330       340       350 

           340       350       360       370       380       390   
pF1KB9 ALTEYVRAQYPSQPQRFGRLLLRLPALRAVPASLISQLFFMRLVGKTPIETLIRDMLLSG
        :... .:..:::: :::.::: ::.:: . :  :  ::: . .:.::.: :. ::.   
CCDS73 MLSQHSKAHHPSQPVRFGKLLLLLPSLRFITAERIELLFFRKTIGNTPMEKLLCDMFKN 
             360       370       380       390       400       410 

           400    
pF1KB9 STFNWPYGSGQ

>>CCDS58061.1 ESRRG gene_id:2104|Hs108|chr1               (470 aa)
 initn: 623 init1: 320 opt: 627  Z-score: 612.3  bits: 122.4 E(32554): 8.7e-28
Smith-Waterman score: 632; 29.8% identity (59.4% similar) in 392 aa overlap (13-390:79-466)

                                 10        20        30        40  
pF1KB9                   MAMVTGGWGGPGGDTNGVDKAGGYPRAAEDDSASPPGAASDA
                                     :  ::.:.   :: :    ...:     : 
CCDS58 SSPASLTDSVNHHSPGGSSDASGSYSSTMNGHQNGLDSPPLYPSAPILGGSGPVRKLYDD
       50        60        70        80        90       100        

              50                  60        70        80        90 
pF1KB9 EPGD-EERPGLQVD----------CVVCGDKSSGKHYGVFTCEGCKSFFKRSIRRNLSYT
         .   : :  . .          :.:::: .:: :::: .::.::.::::.:. :. :.
CCDS58 CSSTIVEDPQTKCEYMLNSMPKRLCLVCGDIASGYHYGVASCEACKAFFKRTIQGNIEYS
      110       120       130       140       150       160        

             100       110       120       130          140        
pF1KB9 CRSNRDCQIDQHHRNQCQYCRLKKCFRVGMRKEAVQRGRIP---HSLPGAVAASSGSPPG
       : .. .:.: ...:..:: ::. ::..::: ::.:.  :.    ..    . : ..   .
CCDS58 CPATNECEITKRRRKSCQACRFMKCLKVGMLKEGVRLDRVRGGRQKYKRRIDAENSPYLN
      170       180       190       200       210       220        

      150       160       170       180       190       200        
pF1KB9 SALAAVASGGDLFPGQPVSELIAQLLRAEPYPAAAGRFGAGGGAAGAVLGIDNVCELAAR
         :.  :.   :.     ......:: :::    :  .       . . .. ..:.:: :
CCDS58 PQLVQPAKKPLLWSDPADNKIVSHLLVAEPEKIYA--MPDPTVPDSDIKALTTLCDLADR
      230       240       250       260         270       280      

      210       220       230       240       250       260        
pF1KB9 LLFSTVEWARHAPFFPELPVADQVALLRLSWSELFVLNAAQAALPLHTAPLLAAAGLHAA
        :   . ::.: : :  : .:::..::. .: :...:...  .: ..    :. :  .  
CCDS58 ELVVIIGWAKHIPGFSTLSLADQMSLLQSAWMEILILGVVYRSLSFEDE--LVYADDYIM
        290       300       310       320       330         340    

      270       280       290       300       310       320        
pF1KB9 PMAAERAVAFMDQVRAFQEQVDKLGRLQVDSAEYGCLKAIALFTPDACGLSDPAHVESLQ
            . ....:   :. . : :   ..... :.  :::::: . :.  . :   :..::
CCDS58 DEDQSKLAGLLDLNNAILQLVKKYKSMKLEKEEFVTLKAIALANSDSMHIEDVEAVQKLQ
          350       360       370       380       390       400    

      330       340       350       360       370       380        
pF1KB9 EKAQVALTEYVRAQYPSQPQRFGRLLLRLPALRAVPASLISQLFFMRLVGKTPIETLIRD
       .  . :: .:  .:.  .:.: :..:. :: :: . .. ..... ..: ::.:.. :. .
CCDS58 DVLHEALQDYEAGQHMEDPRRAGKMLMTLPLLRQTSTKAVQHFYNIKLEGKVPMHKLFLE
          410       420       430       440       450       460    

      390       400    
pF1KB9 MLLSGSTFNWPYGSGQ
       ::              
CCDS58 MLEAKV          
          470          




404 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Fri Nov  4 18:31:31 2016 done: Fri Nov  4 18:31:32 2016
 Total Scan time:  2.970 Total Display time:  0.040

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com