FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE3637, 518 aa
1>>>pF1KE3637 518 - 518 aa - 518 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.5402+/-0.000936; mu= 9.2535+/- 0.057
mean_var=148.5123+/-28.618, 0's: 0 Z-trim(111.2): 121 B-trim: 0 in 0/51
Lambda= 0.105243
statistics sampled from 12108 (12230) to 12108 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.73), E-opt: 0.2 (0.376), width: 16
Scan time: 3.120
The best scores are: opt bits E(32554)
CCDS1004.1 RORC gene_id:6097|Hs108|chr1 ( 518) 3535 548.4 6.9e-156
CCDS30856.1 RORC gene_id:6097|Hs108|chr1 ( 497) 3382 525.2 6.6e-149
CCDS45271.1 RORA gene_id:6095|Hs108|chr15 ( 468) 950 155.9 9.1e-38
CCDS10177.1 RORA gene_id:6095|Hs108|chr15 ( 523) 950 156.0 9.9e-38
CCDS10178.1 RORA gene_id:6095|Hs108|chr15 ( 548) 950 156.0 1e-37
CCDS10179.1 RORA gene_id:6095|Hs108|chr15 ( 556) 950 156.0 1e-37
CCDS6646.1 RORB gene_id:6096|Hs108|chr9 ( 459) 877 144.8 1.9e-34
CCDS11361.1 NR1D1 gene_id:9572|Hs108|chr17 ( 614) 434 77.7 4.3e-14
CCDS33718.1 NR1D2 gene_id:9975|Hs108|chr3 ( 579) 421 75.7 1.6e-13
CCDS41790.1 RARG gene_id:5916|Hs108|chr12 ( 443) 410 73.9 4.2e-13
CCDS8850.1 RARG gene_id:5916|Hs108|chr12 ( 454) 410 73.9 4.3e-13
CCDS58236.1 RARG gene_id:5916|Hs108|chr12 ( 382) 403 72.8 7.7e-13
CCDS2610.2 PPARG gene_id:5468|Hs108|chr3 ( 477) 403 72.9 9.2e-13
CCDS2609.1 PPARG gene_id:5468|Hs108|chr3 ( 505) 403 72.9 9.7e-13
CCDS2642.1 RARB gene_id:5915|Hs108|chr3 ( 448) 398 72.1 1.5e-12
CCDS4768.1 RXRB gene_id:6257|Hs108|chr6 ( 533) 393 71.4 2.9e-12
CCDS59007.1 RXRB gene_id:6257|Hs108|chr6 ( 537) 393 71.4 2.9e-12
CCDS35172.1 RXRA gene_id:6256|Hs108|chr9 ( 462) 391 71.1 3.2e-12
CCDS9051.1 NR2C1 gene_id:7181|Hs108|chr12 ( 603) 393 71.4 3.2e-12
CCDS10375.1 NR2F2 gene_id:7026|Hs108|chr15 ( 414) 389 70.7 3.6e-12
CCDS42317.1 RARA gene_id:5914|Hs108|chr17 ( 457) 388 70.6 4.3e-12
CCDS11366.1 RARA gene_id:5914|Hs108|chr17 ( 462) 388 70.6 4.4e-12
CCDS4068.1 NR2F1 gene_id:7025|Hs108|chr5 ( 423) 386 70.3 5e-12
CCDS6744.1 NR4A3 gene_id:8013|Hs108|chr9 ( 443) 386 70.3 5.2e-12
CCDS33669.1 PPARA gene_id:5465|Hs108|chr22 ( 468) 384 70.0 6.7e-12
CCDS6743.1 NR4A3 gene_id:8013|Hs108|chr9 ( 626) 386 70.4 6.9e-12
CCDS6742.1 NR4A3 gene_id:8013|Hs108|chr9 ( 637) 386 70.4 7e-12
CCDS4804.1 PPARD gene_id:5467|Hs108|chr6 ( 361) 377 68.9 1.1e-11
CCDS54994.1 PPARD gene_id:5467|Hs108|chr6 ( 402) 377 68.9 1.2e-11
CCDS4803.1 PPARD gene_id:5467|Hs108|chr6 ( 441) 377 68.9 1.3e-11
CCDS72970.1 RXRG gene_id:6258|Hs108|chr1 ( 340) 375 68.5 1.3e-11
CCDS6856.1 NR5A1 gene_id:2516|Hs108|chr9 ( 461) 377 68.9 1.4e-11
CCDS5063.1 NR2E1 gene_id:7101|Hs108|chr6 ( 385) 375 68.6 1.5e-11
CCDS41821.1 NR2C1 gene_id:7181|Hs108|chr12 ( 467) 376 68.8 1.6e-11
CCDS44953.1 NR2C1 gene_id:7181|Hs108|chr12 ( 483) 376 68.8 1.6e-11
CCDS1248.1 RXRG gene_id:6258|Hs108|chr1 ( 463) 375 68.6 1.7e-11
CCDS74905.1 NR2C2 gene_id:7182|Hs108|chr3 ( 596) 372 68.2 2.9e-11
CCDS2621.1 NR2C2 gene_id:7182|Hs108|chr3 ( 615) 372 68.3 3e-11
CCDS55340.1 NR6A1 gene_id:2649|Hs108|chr9 ( 475) 369 67.7 3.3e-11
CCDS65127.1 NR6A1 gene_id:2649|Hs108|chr9 ( 476) 369 67.7 3.3e-11
CCDS60383.1 NR5A2 gene_id:2494|Hs108|chr1 ( 469) 368 67.6 3.6e-11
CCDS1400.1 NR5A2 gene_id:2494|Hs108|chr1 ( 495) 368 67.6 3.8e-11
CCDS1401.1 NR5A2 gene_id:2494|Hs108|chr1 ( 541) 368 67.6 4.1e-11
CCDS69165.1 NR2E1 gene_id:7101|Hs108|chr6 ( 422) 366 67.2 4.1e-11
CCDS35137.1 NR6A1 gene_id:2649|Hs108|chr9 ( 480) 363 66.8 6.3e-11
CCDS12352.1 NR2F6 gene_id:2063|Hs108|chr19 ( 404) 361 66.5 6.7e-11
>>CCDS1004.1 RORC gene_id:6097|Hs108|chr1 (518 aa)
initn: 3535 init1: 3535 opt: 3535 Z-score: 2912.1 bits: 548.4 E(32554): 6.9e-156
Smith-Waterman score: 3535; 100.0% identity (100.0% similar) in 518 aa overlap (1-518:1-518)
10 20 30 40 50 60
pF1KE3 MDRAPQRQHRASRELLAAKKTHTSQIEVIPCKICGDKSSGIHYGVITCEGCKGFFRRSQR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 MDRAPQRQHRASRELLAAKKTHTSQIEVIPCKICGDKSSGIHYGVITCEGCKGFFRRSQR
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE3 CNAAYSCTRQQNCPIDRTSRNRCQHCRLQKCLALGMSRDAVKFGRMSKKQRDSLHAEVQK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 CNAAYSCTRQQNCPIDRTSRNRCQHCRLQKCLALGMSRDAVKFGRMSKKQRDSLHAEVQK
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE3 QLQQRQQQQQEPVVKTPPAGAQGADTLTYTLGLPDGQLPLGSSPDLPEASACPPGLLKAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 QLQQRQQQQQEPVVKTPPAGAQGADTLTYTLGLPDGQLPLGSSPDLPEASACPPGLLKAS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE3 GSGPSYSNNLAKAGLNGASCHLEYSPERGKAEGRESFYSTGSQLTPDRCGLRFEEHRHPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 GSGPSYSNNLAKAGLNGASCHLEYSPERGKAEGRESFYSTGSQLTPDRCGLRFEEHRHPG
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE3 LGELGQGPDSYGSPSFRSTPEAPYASLTEIEHLVQSVCKSYRETCQLRLEDLLRQRSNIF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 LGELGQGPDSYGSPSFRSTPEAPYASLTEIEHLVQSVCKSYRETCQLRLEDLLRQRSNIF
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE3 SREEVTGYQRKSMWEMWERCAHHLTEAIQYVVEFAKRLSGFMELCQNDQIVLLKAGAMEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 SREEVTGYQRKSMWEMWERCAHHLTEAIQYVVEFAKRLSGFMELCQNDQIVLLKAGAMEV
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE3 VLVRMCRAYNADNRTVFFEGKYGGMELFRALGCSELISSIFDFSHSLSALHFSEDEIALY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 VLVRMCRAYNADNRTVFFEGKYGGMELFRALGCSELISSIFDFSHSLSALHFSEDEIALY
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE3 TALVLINAHRPGLQEKRKVEQLQYNLELAFHHHLCKTHRQSILAKLPPKGKLRSLCSQHV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 TALVLINAHRPGLQEKRKVEQLQYNLELAFHHHLCKTHRQSILAKLPPKGKLRSLCSQHV
430 440 450 460 470 480
490 500 510
pF1KE3 ERLQIFQHLHPIVVQAAFPPLYKELFSTETESPVGLSK
::::::::::::::::::::::::::::::::::::::
CCDS10 ERLQIFQHLHPIVVQAAFPPLYKELFSTETESPVGLSK
490 500 510
>>CCDS30856.1 RORC gene_id:6097|Hs108|chr1 (497 aa)
initn: 3382 init1: 3382 opt: 3382 Z-score: 2786.8 bits: 525.2 E(32554): 6.6e-149
Smith-Waterman score: 3382; 99.8% identity (100.0% similar) in 495 aa overlap (24-518:3-497)
10 20 30 40 50 60
pF1KE3 MDRAPQRQHRASRELLAAKKTHTSQIEVIPCKICGDKSSGIHYGVITCEGCKGFFRRSQR
.::::::::::::::::::::::::::::::::::::
CCDS30 MRTQIEVIPCKICGDKSSGIHYGVITCEGCKGFFRRSQR
10 20 30
70 80 90 100 110 120
pF1KE3 CNAAYSCTRQQNCPIDRTSRNRCQHCRLQKCLALGMSRDAVKFGRMSKKQRDSLHAEVQK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 CNAAYSCTRQQNCPIDRTSRNRCQHCRLQKCLALGMSRDAVKFGRMSKKQRDSLHAEVQK
40 50 60 70 80 90
130 140 150 160 170 180
pF1KE3 QLQQRQQQQQEPVVKTPPAGAQGADTLTYTLGLPDGQLPLGSSPDLPEASACPPGLLKAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 QLQQRQQQQQEPVVKTPPAGAQGADTLTYTLGLPDGQLPLGSSPDLPEASACPPGLLKAS
100 110 120 130 140 150
190 200 210 220 230 240
pF1KE3 GSGPSYSNNLAKAGLNGASCHLEYSPERGKAEGRESFYSTGSQLTPDRCGLRFEEHRHPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 GSGPSYSNNLAKAGLNGASCHLEYSPERGKAEGRESFYSTGSQLTPDRCGLRFEEHRHPG
160 170 180 190 200 210
250 260 270 280 290 300
pF1KE3 LGELGQGPDSYGSPSFRSTPEAPYASLTEIEHLVQSVCKSYRETCQLRLEDLLRQRSNIF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 LGELGQGPDSYGSPSFRSTPEAPYASLTEIEHLVQSVCKSYRETCQLRLEDLLRQRSNIF
220 230 240 250 260 270
310 320 330 340 350 360
pF1KE3 SREEVTGYQRKSMWEMWERCAHHLTEAIQYVVEFAKRLSGFMELCQNDQIVLLKAGAMEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 SREEVTGYQRKSMWEMWERCAHHLTEAIQYVVEFAKRLSGFMELCQNDQIVLLKAGAMEV
280 290 300 310 320 330
370 380 390 400 410 420
pF1KE3 VLVRMCRAYNADNRTVFFEGKYGGMELFRALGCSELISSIFDFSHSLSALHFSEDEIALY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 VLVRMCRAYNADNRTVFFEGKYGGMELFRALGCSELISSIFDFSHSLSALHFSEDEIALY
340 350 360 370 380 390
430 440 450 460 470 480
pF1KE3 TALVLINAHRPGLQEKRKVEQLQYNLELAFHHHLCKTHRQSILAKLPPKGKLRSLCSQHV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 TALVLINAHRPGLQEKRKVEQLQYNLELAFHHHLCKTHRQSILAKLPPKGKLRSLCSQHV
400 410 420 430 440 450
490 500 510
pF1KE3 ERLQIFQHLHPIVVQAAFPPLYKELFSTETESPVGLSK
::::::::::::::::::::::::::::::::::::::
CCDS30 ERLQIFQHLHPIVVQAAFPPLYKELFSTETESPVGLSK
460 470 480 490
>>CCDS45271.1 RORA gene_id:6095|Hs108|chr15 (468 aa)
initn: 1625 init1: 785 opt: 950 Z-score: 791.5 bits: 155.9 E(32554): 9.1e-38
Smith-Waterman score: 1531; 49.3% identity (72.5% similar) in 499 aa overlap (15-511:5-461)
10 20 30 40 50 60
pF1KE3 MDRAPQRQHRASRELLAAKKTHTSQIEVIPCKICGDKSSGIHYGVITCEGCKGFFRRSQR
..:: : .:::.:::::::::::::::::::::::::::::::.
CCDS45 MMYFVIAAMK---AQIEIIPCKICGDKSSGIHYGVITCEGCKGFFRRSQQ
10 20 30 40
70 80 90 100 110 120
pF1KE3 CNAAYSCTRQQNCPIDRTSRNRCQHCRLQKCLALGMSRDAVKFGRMSKKQRDSLHAEVQK
::.::: ::.:: :::::::::::::::::::.::::::::::::::::::::.:::::
CCDS45 SNATYSCPRQKNCLIDRTSRNRCQHCRLQKCLAVGMSRDAVKFGRMSKKQRDSLYAEVQK
50 60 70 80 90 100
130 140 150 160 170 180
pF1KE3 QLQQRQQQQQEPVVKTPPAGAQGADTLTYTLGLPDGQLPLGSSPDLPEASACPPGLLKAS
. .:.::.... : : . : : . :: .
CCDS45 HRMQQQQRDHQ-------------------------QQPGEAEPLTPTYNISANGLTELH
110 120 130 140
190 200 210 220 230 240
pF1KE3 GSGPSYSNNLAKAGLNGASCHLEYSPERGKAEGRESFYSTGSQLTPDRCGLRFEEHRHPG
. .: ..: ..:: .::.. : . : .::. :: .. .
CCDS45 DDLSNY--------IDG------HTPEGSKADSAVSSFYLDIQPSPDQSGLDINGIKPEP
150 160 170 180
250 260 270 280 290 300
pF1KE3 LGELGQGPDSYGSPSFRSTPEAPYASLTEIEHLVQSVCKSYRETCQLRLEDLLRQRSNIF
. . . . :: . .: .:..:.:::.:.. ::. :::: :.: . . :
CCDS45 ICDYTPASGFFPYCSFTNGETSPTVSMAELEHLAQNISKSHLETCQYLREELQQITWQTF
190 200 210 220 230 240
310 320 330 340 350 360
pF1KE3 SREEVTGYQRKSMWEMWERCAHHLTEAIQYVVEFAKRLSGFMELCQNDQIVLLKAGAMEV
.::. .:: :. ::. :: ..:::::::::::::..:::::::::::::::::..::
CCDS45 LQEEIENYQNKQREVMWQLCAIKITEAIQYVVEFAKRIDGFMELCQNDQIVLLKAGSLEV
250 260 270 280 290 300
370 380 390 400 410 420
pF1KE3 VLVRMCRAYNADNRTVFFEGKYGGMELFRALGCSELISSIFDFSHSLSALHFSEDEIALY
:..:::::....: ::.:.:::.. ..:..::: ..:: .:.:..:: ..:..::::::.
CCDS45 VFIRMCRAFDSQNNTVYFDGKYASPDVFKSLGCEDFISFVFEFGKSLCSMHLTEDEIALF
310 320 330 340 350 360
430 440 450 460 470
pF1KE3 TALVLINAHRPGLQEKRKVEQLQYNLELAFHHHLCKTHRQS-ILAKLPPK-GKLRSLCSQ
.:.::..: : :::: :.:.:: ...::..: : :.::.. ::.:: : . ::.::..
CCDS45 SAFVLMSADRSWLQEKVKIEKLQQKIQLALQHVLQKNHREDGILTKLICKVSTLRALCGR
370 380 390 400 410 420
480 490 500 510
pF1KE3 HVERLQIFQHLHPIVVQAAFPPLYKELFSTETESPVGLSK
:.:.:. :. ..: .:. :::::::::..: :
CCDS45 HTEKLMAFKAIYPDIVRLHFPPLYKELFTSEFEPAMQIDG
430 440 450 460
>>CCDS10177.1 RORA gene_id:6095|Hs108|chr15 (523 aa)
initn: 1672 init1: 785 opt: 950 Z-score: 790.9 bits: 156.0 E(32554): 9.9e-38
Smith-Waterman score: 1578; 49.5% identity (72.7% similar) in 513 aa overlap (4-511:43-516)
10 20 30
pF1KE3 MDRAPQRQHR---ASRELLAAKKTHTSQIEVIP
:: :.. .:: . ..:::::::::.::
CCDS10 SEPGSSGADAAAGSRETPLNQESARKSEPPAPVRRQSYSSTSRGISVTKKTHTSQIEIIP
20 30 40 50 60 70
40 50 60 70 80 90
pF1KE3 CKICGDKSSGIHYGVITCEGCKGFFRRSQRCNAAYSCTRQQNCPIDRTSRNRCQHCRLQK
:::::::::::::::::::::::::::::. ::.::: ::.:: ::::::::::::::::
CCDS10 CKICGDKSSGIHYGVITCEGCKGFFRRSQQSNATYSCPRQKNCLIDRTSRNRCQHCRLQK
80 90 100 110 120 130
100 110 120 130 140 150
pF1KE3 CLALGMSRDAVKFGRMSKKQRDSLHAEVQKQLQQRQQQQQEPVVKTPPAGAQGADTLTYT
:::.::::::::::::::::::::.:::::. .:.::....
CCDS10 CLAVGMSRDAVKFGRMSKKQRDSLYAEVQKHRMQQQQRDHQ-------------------
140 150 160 170
160 170 180 190 200 210
pF1KE3 LGLPDGQLPLGSSPDLPEASACPPGLLKASGSGPSYSNNLAKAGLNGASCHLEYSPERGK
: : . : : . :: . . .: ..: ..:: .:
CCDS10 ------QQPGEAEPLTPTYNISANGLTELHDDLSNY--------IDG------HTPEGSK
180 190 200 210
220 230 240 250 260 270
pF1KE3 AEGRESFYSTGSQLTPDRCGLRFEEHRHPGLGELGQGPDSYGSPSFRSTPEAPYASLTEI
:.. : . : .::. :: .. . . . . . :: . .: .:..:.
CCDS10 ADSAVSSFYLDIQPSPDQSGLDINGIKPEPICDYTPASGFFPYCSFTNGETSPTVSMAEL
220 230 240 250 260 270
280 290 300 310 320 330
pF1KE3 EHLVQSVCKSYRETCQLRLEDLLRQRSNIFSREEVTGYQRKSMWEMWERCAHHLTEAIQY
:::.:.. ::. :::: :.: . . : .::. .:: :. ::. :: ..::::::
CCDS10 EHLAQNISKSHLETCQYLREELQQITWQTFLQEEIENYQNKQREVMWQLCAIKITEAIQY
280 290 300 310 320 330
340 350 360 370 380 390
pF1KE3 VVEFAKRLSGFMELCQNDQIVLLKAGAMEVVLVRMCRAYNADNRTVFFEGKYGGMELFRA
:::::::..:::::::::::::::::..:::..:::::....: ::.:.:::.. ..:..
CCDS10 VVEFAKRIDGFMELCQNDQIVLLKAGSLEVVFIRMCRAFDSQNNTVYFDGKYASPDVFKS
340 350 360 370 380 390
400 410 420 430 440 450
pF1KE3 LGCSELISSIFDFSHSLSALHFSEDEIALYTALVLINAHRPGLQEKRKVEQLQYNLELAF
::: ..:: .:.:..:: ..:..::::::..:.::..: : :::: :.:.:: ...::.
CCDS10 LGCEDFISFVFEFGKSLCSMHLTEDEIALFSAFVLMSADRSWLQEKVKIEKLQQKIQLAL
400 410 420 430 440 450
460 470 480 490 500
pF1KE3 HHHLCKTHRQS-ILAKLPPK-GKLRSLCSQHVERLQIFQHLHPIVVQAAFPPLYKELFST
.: : :.::.. ::.:: : . ::.::..:.:.:. :. ..: .:. :::::::::..
CCDS10 QHVLQKNHREDGILTKLICKVSTLRALCGRHTEKLMAFKAIYPDIVRLHFPPLYKELFTS
460 470 480 490 500 510
510
pF1KE3 ETESPVGLSK
: :
CCDS10 EFEPAMQIDG
520
>>CCDS10178.1 RORA gene_id:6095|Hs108|chr15 (548 aa)
initn: 1625 init1: 785 opt: 950 Z-score: 790.6 bits: 156.0 E(32554): 1e-37
Smith-Waterman score: 1530; 49.6% identity (72.9% similar) in 490 aa overlap (24-511:91-541)
10 20 30 40 50
pF1KE3 MDRAPQRQHRASRELLAAKKTHTSQIEVIPCKICGDKSSGIHYGVITCEGCKG
.:::.:::::::::::::::::::::::::
CCDS10 LEHINWDGATAKNFINLREFFSFLLPALRKAQIEIIPCKICGDKSSGIHYGVITCEGCKG
70 80 90 100 110 120
60 70 80 90 100 110
pF1KE3 FFRRSQRCNAAYSCTRQQNCPIDRTSRNRCQHCRLQKCLALGMSRDAVKFGRMSKKQRDS
::::::. ::.::: ::.:: :::::::::::::::::::.:::::::::::::::::::
CCDS10 FFRRSQQSNATYSCPRQKNCLIDRTSRNRCQHCRLQKCLAVGMSRDAVKFGRMSKKQRDS
130 140 150 160 170 180
120 130 140 150 160 170
pF1KE3 LHAEVQKQLQQRQQQQQEPVVKTPPAGAQGADTLTYTLGLPDGQLPLGSSPDLPEASACP
:.:::::. .:.::.... : : . : : .
CCDS10 LYAEVQKHRMQQQQRDHQ-------------------------QQPGEAEPLTPTYNISA
190 200 210
180 190 200 210 220 230
pF1KE3 PGLLKASGSGPSYSNNLAKAGLNGASCHLEYSPERGKAEGRESFYSTGSQLTPDRCGLRF
:: . . .: ..: ..:: .::.. : . : .::. :: .
CCDS10 NGLTELHDDLSNY--------IDG------HTPEGSKADSAVSSFYLDIQPSPDQSGLDI
220 230 240 250 260
240 250 260 270 280 290
pF1KE3 EEHRHPGLGELGQGPDSYGSPSFRSTPEAPYASLTEIEHLVQSVCKSYRETCQLRLEDLL
. . . . . . :: . .: .:..:.:::.:.. ::. :::: :.:
CCDS10 NGIKPEPICDYTPASGFFPYCSFTNGETSPTVSMAELEHLAQNISKSHLETCQYLREELQ
270 280 290 300 310 320
300 310 320 330 340 350
pF1KE3 RQRSNIFSREEVTGYQRKSMWEMWERCAHHLTEAIQYVVEFAKRLSGFMELCQNDQIVLL
. . : .::. .:: :. ::. :: ..:::::::::::::..::::::::::::::
CCDS10 QITWQTFLQEEIENYQNKQREVMWQLCAIKITEAIQYVVEFAKRIDGFMELCQNDQIVLL
330 340 350 360 370 380
360 370 380 390 400 410
pF1KE3 KAGAMEVVLVRMCRAYNADNRTVFFEGKYGGMELFRALGCSELISSIFDFSHSLSALHFS
:::..:::..:::::....: ::.:.:::.. ..:..::: ..:: .:.:..:: ..:..
CCDS10 KAGSLEVVFIRMCRAFDSQNNTVYFDGKYASPDVFKSLGCEDFISFVFEFGKSLCSMHLT
390 400 410 420 430 440
420 430 440 450 460 470
pF1KE3 EDEIALYTALVLINAHRPGLQEKRKVEQLQYNLELAFHHHLCKTHRQS-ILAKLPPK-GK
::::::..:.::..: : :::: :.:.:: ...::..: : :.::.. ::.:: : .
CCDS10 EDEIALFSAFVLMSADRSWLQEKVKIEKLQQKIQLALQHVLQKNHREDGILTKLICKVST
450 460 470 480 490 500
480 490 500 510
pF1KE3 LRSLCSQHVERLQIFQHLHPIVVQAAFPPLYKELFSTETESPVGLSK
::.::..:.:.:. :. ..: .:. :::::::::..: :
CCDS10 LRALCGRHTEKLMAFKAIYPDIVRLHFPPLYKELFTSEFEPAMQIDG
510 520 530 540
>>CCDS10179.1 RORA gene_id:6095|Hs108|chr15 (556 aa)
initn: 1625 init1: 785 opt: 950 Z-score: 790.5 bits: 156.0 E(32554): 1e-37
Smith-Waterman score: 1532; 48.1% identity (72.3% similar) in 509 aa overlap (5-511:82-549)
10 20 30
pF1KE3 MDRAPQRQHRASRELLAAKKTHTSQIEVIPCKIC
: ... ..:. .. ..:::.::::::
CCDS10 ILQILHQCILSSGDAFVLTGVCCSWRQNGKPPYSQKEDKEVQTGY--MNAQIEIIPCKIC
60 70 80 90 100
40 50 60 70 80 90
pF1KE3 GDKSSGIHYGVITCEGCKGFFRRSQRCNAAYSCTRQQNCPIDRTSRNRCQHCRLQKCLAL
:::::::::::::::::::::::::. ::.::: ::.:: :::::::::::::::::::.
CCDS10 GDKSSGIHYGVITCEGCKGFFRRSQQSNATYSCPRQKNCLIDRTSRNRCQHCRLQKCLAV
110 120 130 140 150 160
100 110 120 130 140 150
pF1KE3 GMSRDAVKFGRMSKKQRDSLHAEVQKQLQQRQQQQQEPVVKTPPAGAQGADTLTYTLGLP
::::::::::::::::::::.:::::. .:.::....
CCDS10 GMSRDAVKFGRMSKKQRDSLYAEVQKHRMQQQQRDHQ-----------------------
170 180 190 200
160 170 180 190 200 210
pF1KE3 DGQLPLGSSPDLPEASACPPGLLKASGSGPSYSNNLAKAGLNGASCHLEYSPERGKAEGR
: : . : : . :: . . .: ..: ..:: .::..
CCDS10 --QQPGEAEPLTPTYNISANGLTELHDDLSNY--------IDG------HTPEGSKADSA
210 220 230 240 250
220 230 240 250 260 270
pF1KE3 ESFYSTGSQLTPDRCGLRFEEHRHPGLGELGQGPDSYGSPSFRSTPEAPYASLTEIEHLV
: . : .::. :: .. . . . . . :: . .: .:..:.:::.
CCDS10 VSSFYLDIQPSPDQSGLDINGIKPEPICDYTPASGFFPYCSFTNGETSPTVSMAELEHLA
260 270 280 290 300 310
280 290 300 310 320 330
pF1KE3 QSVCKSYRETCQLRLEDLLRQRSNIFSREEVTGYQRKSMWEMWERCAHHLTEAIQYVVEF
:.. ::. :::: :.: . . : .::. .:: :. ::. :: ..::::::::::
CCDS10 QNISKSHLETCQYLREELQQITWQTFLQEEIENYQNKQREVMWQLCAIKITEAIQYVVEF
320 330 340 350 360 370
340 350 360 370 380 390
pF1KE3 AKRLSGFMELCQNDQIVLLKAGAMEVVLVRMCRAYNADNRTVFFEGKYGGMELFRALGCS
:::..:::::::::::::::::..:::..:::::....: ::.:.:::.. ..:..:::
CCDS10 AKRIDGFMELCQNDQIVLLKAGSLEVVFIRMCRAFDSQNNTVYFDGKYASPDVFKSLGCE
380 390 400 410 420 430
400 410 420 430 440 450
pF1KE3 ELISSIFDFSHSLSALHFSEDEIALYTALVLINAHRPGLQEKRKVEQLQYNLELAFHHHL
..:: .:.:..:: ..:..::::::..:.::..: : :::: :.:.:: ...::..: :
CCDS10 DFISFVFEFGKSLCSMHLTEDEIALFSAFVLMSADRSWLQEKVKIEKLQQKIQLALQHVL
440 450 460 470 480 490
460 470 480 490 500 510
pF1KE3 CKTHRQS-ILAKLPPK-GKLRSLCSQHVERLQIFQHLHPIVVQAAFPPLYKELFSTETES
:.::.. ::.:: : . ::.::..:.:.:. :. ..: .:. :::::::::..: :
CCDS10 QKNHREDGILTKLICKVSTLRALCGRHTEKLMAFKAIYPDIVRLHFPPLYKELFTSEFEP
500 510 520 530 540 550
pF1KE3 PVGLSK
CCDS10 AMQIDG
>>CCDS6646.1 RORB gene_id:6096|Hs108|chr9 (459 aa)
initn: 1471 init1: 692 opt: 877 Z-score: 731.8 bits: 144.8 E(32554): 1.9e-34
Smith-Waterman score: 1471; 49.2% identity (72.6% similar) in 492 aa overlap (24-509:3-453)
10 20 30 40 50 60
pF1KE3 MDRAPQRQHRASRELLAAKKTHTSQIEVIPCKICGDKSSGIHYGVITCEGCKGFFRRSQR
.:::::::::::::::::::::::::::::::::::.
CCDS66 MRAQIEVIPCKICGDKSSGIHYGVITCEGCKGFFRRSQQ
10 20 30
70 80 90 100 110 120
pF1KE3 CNAAYSCTRQQNCPIDRTSRNRCQHCRLQKCLALGMSRDAVKFGRMSKKQRDSLHAEVQK
::.::: ::.:: ::::.:::::::::::::::::::::::::::::::::::.:::::
CCDS66 NNASYSCPRQRNCLIDRTNRNRCQHCRLQKCLALGMSRDAVKFGRMSKKQRDSLYAEVQK
40 50 60 70 80 90
130 140 150 160 170 180
pF1KE3 QLQQRQQQQQEPVVKTPPAGAQGADTLTYTLGLPDGQLPLGSSPDLPEASACPPGLLKAS
. :. :.:.:. .: : . .:. .. .: :.. ..:
CCDS66 HQQRLQEQRQQQ------SGEAEALARVYSSSISNGLSNLNN---------------ETS
100 110 120 130
190 200 210 220 230
pF1KE3 GSGPSYSNNLAKAGLNGASCHLEYSPERGKAEGRESFYSTGS-QLTPDRCGLRF---EEH
:. :.:. :. : :.:: .:.. : : .::. :: . ..
CCDS66 GT---YANG-----------HVIDLP---KSEG---YYNVDSGQPSPDQSGLDMTGIKQI
140 150 160 170
240 250 260 270 280 290
pF1KE3 RHPGLGELGQGPDSYGSPSFRSTPEAPYASLTEIEHLVQSVCKSYRETCQLRLEDLLRQR
.. . .: . :. . :: . :: ..:::....:.. ::. :::: .:.: .
CCDS66 KQEPIYDLTSVPNLFTYSSFNNGQLAPGITMTEIDRIAQNIIKSHLETCQYTMEELHQLA
180 190 200 210 220 230
300 310 320 330 340 350
pF1KE3 SNIFSREEVTGYQRKSMWEMWERCAHHLTEAIQYVVEFAKRLSGFMELCQNDQIVLLKAG
. . ::. .:: :: .:..:: ..:.:::::::::::..:::::::::::.:::.:
CCDS66 WQTHTYEEIKAYQSKSREALWQQCAIQITHAIQYVVEFAKRITGFMELCQNDQILLLKSG
240 250 260 270 280 290
360 370 380 390 400 410
pF1KE3 AMEVVLVRMCRAYNADNRTVFFEGKYGGMELFRALGCSELISSIFDFSHSLSALHFSEDE
.::::::::::.: : ::.::::::::..:.::: ..:.. :::...: .:...:.:
CCDS66 CLEVVLVRMCRAFNPLNNTVLFEGKYGGMQMFKALGSDDLVNEAFDFAKNLCSLQLTEEE
300 310 320 330 340 350
420 430 440 450 460 470
pF1KE3 IALYTALVLINAHRPGLQEKRKVEQLQYNLELAFHHHLCKTHRQS-ILAKLPPK-GKLRS
:::... :::. : : : :::..:: .. .:..: . :.: .. :::: : . .
CCDS66 IALFSSAVLISPDRAWLIEPRKVQKLQEKIYFALQHVIQKNHLDDETLAKLIAKIPTITA
360 370 380 390 400 410
480 490 500 510
pF1KE3 LCSQHVERLQIFQHLHPIVVQAAFPPLYKELFSTETESPVGLSK
.:. : :.::.:.. :: .:.. :::::::::. .
CCDS66 VCNLHGEKLQVFKQSHPEIVNTLFPPLYKELFNPDCATGCK
420 430 440 450
>>CCDS11361.1 NR1D1 gene_id:9572|Hs108|chr17 (614 aa)
initn: 757 init1: 244 opt: 434 Z-score: 366.4 bits: 77.7 E(32554): 4.3e-14
Smith-Waterman score: 804; 34.2% identity (64.0% similar) in 494 aa overlap (28-487:129-610)
10 20 30 40 50
pF1KE3 MDRAPQRQHRASRELLAAKKTHTSQIEVIPCKICGDKSSGIHYGVITCEGCKGFFRR
:. ::.::: .::.:::: .::::::::::
CCDS11 PPGSLQVAMEDSSRVSPSKSTSNITKLNGMVLLCKVCGDVASGFHYGVHACEGCKGFFRR
100 110 120 130 140 150
60 70 80 90 100 110
pF1KE3 SQRCNAAYS-CTRQQNCPIDRTSRNRCQHCRLQKCLALGMSRDAVKFGRMSKKQRDSLHA
: . : :. : ...:: : : .:::::.::..:::..:::::::.:::. :.... . :
CCDS11 SIQQNIQYKRCLKNENCSIVRINRNRCQQCRFKKCLSVGMSRDAVRFGRIPKREKQRMLA
160 170 180 190 200 210
120 130 140 150 160
pF1KE3 EVQK--QLQQRQQQQQEPVVKTP---PA-GAQG-----ADTLTYTLGLPD--GQL--PLG
:.:. .: . : ..: :. .: :. : .: : . . .:. . :: : .
CCDS11 EMQSAMNLANNQLSSQCPLETSPTQHPTPGPMGPSPPPAPVPSPLVGFSQFPQQLTPPRS
220 230 240 250 260 270
170 180 190 200 210 220
pF1KE3 SSPDLPEASACPPGLLKASGSGPSYSNN-LAKAGLNGASCHLEYSPERGKAEGRESFYST
::. : . . .: .:... :... : . : :: : . . .
CCDS11 PSPE-PTVEDVISQVARAHREIFTYAHDKLGSSPGNFNANHASGSPP---ATTPHRWENQ
280 290 300 310 320 330
230 240 250 260 270
pF1KE3 GSQLTPDRCGLRFEEHRHPGLGELGQGPDSYGSPSFRSTPEAP-YASLTEIEHLVQSVCK
: .:. . .... .:. : :.:.:: :.. : .: . : . . . .:
CCDS11 GCPPAPNDNNTLAAQRHNEALNGLRQAPSSY-PPTW---PPGPAHHSCHQSNSNGHRLCP
340 350 360 370 380 390
280 290 300 310 320 330
pF1KE3 S--YRETCQLRLEDLLRQ--RSNIFSREEVTGYQR----KSMWEMWERCAHHLTEAIQYV
. : . :: .:.. .. : . ... :.:: . .: :.. :
CCDS11 THVYAAPEGKAPANSPRQGNSKNVLLACPMNMYPHGRSGRTVQEIWEDFSMSFTPAVREV
400 410 420 430 440 450
340 350 360 370 380
pF1KE3 VEFAKRLSGFMELCQNDQIVLLKAGAMEVVLVRMCRAYNADNRTVFFEGK--YGGMELFR
:::::.. :: .: :.::..:::::..::..::. .:. ..::.: .. :. .::
CCDS11 VEFAKHIPGFRDLSQHDQVTLLKAGTFEVLMVRFASLFNVKDQTVMFLSRTTYSLQEL-G
460 470 480 490 500
390 400 410 420 430 440
pF1KE3 ALGCSELISSIFDFSHSLSALHFSEDEIALYTALVLINAHRPGLQEKRKVEQLQYNL---
:.: ..:.:..::::..:..: ..:.:..:.::.::..: : :.... .::::: .:
CCDS11 AMGMGDLLSAMFDFSEKLNSLALTEEELGLFTAVVLVSADRSGMENSASVEQLQETLLRA
510 520 530 540 550 560
450 460 470 480 490 500
pF1KE3 --ELAFHHHLCKTHR-QSILAKLPPKGKLRSLCSQHVERLQIFQHLHPIVVQAAFPPLYK
:..... .: : ..: ::: ::.: ..: :.: :.
CCDS11 LRALVLKNRPLETSRFTKLLLKLPD---LRTLNNMHSEKLLSFRVDAQ
570 580 590 600 610
510
pF1KE3 ELFSTETESPVGLSK
>>CCDS33718.1 NR1D2 gene_id:9975|Hs108|chr3 (579 aa)
initn: 603 init1: 224 opt: 421 Z-score: 356.1 bits: 75.7 E(32554): 1.6e-13
Smith-Waterman score: 800; 34.4% identity (61.9% similar) in 491 aa overlap (28-491:100-579)
10 20 30 40 50
pF1KE3 MDRAPQRQHRASRELLAAKKTHTSQIEVIPCKICGDKSSGIHYGVITCEGCKGFFRR
:. ::.::: .::.:::: .::::::::::
CCDS33 DRIDCSMKTSKSSAPGMTKSHSGVTKFSGMVLLCKVCGDVASGFHYGVHACEGCKGFFRR
70 80 90 100 110 120
60 70 80 90 100 110
pF1KE3 SQRCNAAYS-CTRQQNCPIDRTSRNRCQHCRLQKCLALGMSRDAVKFGRMSKKQRDSLHA
: . : :. : ...:: : : .:::::.::..:::..:::::::.:::. :.... .
CCDS33 SIQQNIQYKKCLKNENCSIMRMNRNRCQQCRFKKCLSVGMSRDAVRFGRIPKREKQRMLI
130 140 150 160 170 180
120 130 140 150 160 170
pF1KE3 EVQKQLQQRQQQQQEPVVKTPPAGAQGADTLTY---TLGLPDGQLPLGSSPDLPEA---S
:.:. .. ...: .: :::. .:: .: : .:.: . :
CCDS33 EMQSAMKTMMNSQF--------SGHLQNDTLVEHHEQTALP-AQEQLRPKPQLEQENIKS
190 200 210 220 230 240
180 190 200 210 220
pF1KE3 ACPPGLLKASGSGPSYSNNLAKAGLNGASCHLEYSPERGKAEGRESFYSTGSQ--LTPDR
. ::. :. .. . : . . . : : : . . : . .. : :. :.
CCDS33 SSPPSSDFAKEEVIGMVTRAHKDTFMYNQEQQENSAESMQPQRGERIPKNMEQYNLNHDH
250 260 270 280 290 300
230 240 250 260 270
pF1KE3 CGLRFEEH-----RHPGLGELGQGPDSYGSPSFRSTPEAPYASLTEIEHLVQSVCK----
:: . : . :. .: . . :. .. : .. . .: ::
CCDS33 CGNGLSSHFPCSESQQHLNGQFKGRNIMHYPNGHAICIANGHCMNFSNAYTQRVCDRVPI
310 320 330 340 350 360
280 290 300 310 320 330
pF1KE3 ---SYRETCQLRLEDLLRQRSNIFSREEVTGY--QRKSMWEMWERCAHHLTEAIQYVVEF
: :. . : . : .. . : .:: :.::. . .: :.. ::::
CCDS33 DGFSQNENKNSYLCNT-GGRMHLVCPMSKSPYVDPHKSGHEIWEEFSMSFTPAVKEVVEF
370 380 390 400 410
340 350 360 370 380 390
pF1KE3 AKRLSGFMELCQNDQIVLLKAGAMEVVLVRMCRAYNADNRTV-FFEGKYGGMELFRALGC
:::. :: .: :.::. :::::..::..::. ..: .::: :. :: ... ....:
CCDS33 AKRIPGFRDLSQHDQVNLLKAGTFEVLMVRFASLFDAKERTVTFLSGKKYSVDDLHSMGA
420 430 440 450 460 470
400 410 420 430 440 450
pF1KE3 SELISSIFDFSHSLSALHFSEDEIALYTALVLINAHRPGLQEKRKVEQLQYNLELAFHHH
..:..:.:.::..:.::..:..:..:.::.::..: : :... .:: :: .: :..
CCDS33 GDLLNSMFEFSEKLNALQLSDEEMSLFTAVVLVSADRSGIENVNSVEALQETLIRALRTL
480 490 500 510 520 530
460 470 480 490 500 510
pF1KE3 LCKTH--RQSILAKLPPK-GKLRSLCSQHVERLQIFQHLHPIVVQAAFPPLYKELFSTET
. :.: . ::..:: : :::: ..: :.: :. .::
CCDS33 IMKNHPNEASIFTKLLLKLPDLRSLNNMHSEELLAFK-VHP
540 550 560 570
pF1KE3 ESPVGLSK
>>CCDS41790.1 RARG gene_id:5916|Hs108|chr12 (443 aa)
initn: 528 init1: 393 opt: 410 Z-score: 348.8 bits: 73.9 E(32554): 4.2e-13
Smith-Waterman score: 430; 27.2% identity (48.3% similar) in 507 aa overlap (6-506:53-405)
10 20 30
pF1KE3 MDRAPQRQHRASRELLAAKKTHTSQIEVI-PCKIC
. : .:.:.. .. . .: :: .:
CCDS41 AGLLRRATGGSCFAGLESFAWPQPASLQSVETQSTSSEEMVPSSPSPPPPPRVYKPCFVC
30 40 50 60 70 80
40 50 60 70 80 90
pF1KE3 GDKSSGIHYGVITCEGCKGFFRRSQRCNAAYSCTRQQNCPIDRTSRNRCQHCRLQKCLAL
.::::: :::: .::::::::::: . : .:.: :..:: :....:::::.::::::. .
CCDS41 NDKSSGYHYGVSSCEGCKGFFRRSIQKNMVYTCHRDKNCIINKVTRNRCQYCRLQKCFEV
90 100 110 120 130 140
100 110 120 130 140 150
pF1KE3 GMSRDAVKFGRMSKKQRDSLHAEVQKQLQQRQQQQQEPVVKTPPAGAQGADTLTYTLGLP
:::..::. : .::. ::... : :
CCDS41 GMSKEAVRNDRNKKKK------EVKEE------------------------------GSP
150 160
160 170 180 190 200 210
pF1KE3 DGQLPLGSSPDLPEASACPPGLLKASGSGPSYSNNLAKAGLNGASCHLEYSPERGKAEGR
:. ::.: : . :.: :: : .
CCDS41 DSYE---LSPQLEEL------ITKVS-----------KA-------H------------Q
170 180
220 230 240 250 260 270
pF1KE3 ESFYSTGSQLTPDRCGLRFEEHRHPGLGELGQGPDSYGSPSFRSTPEAPYASLTEIEHLV
:.: :.: .::. :.. . .: :
CCDS41 ETF---------------------PSLCQLGK-----------------YTTNSSADHRV
190 200
280 290 300 310 320 330
pF1KE3 QSVCKSYRETCQLRLEDLLRQRSNIFSREEVTGYQRKSMWEMWERCAHHLTEAIQYVVEF
: :: : .:.. .. :. : .:::
CCDS41 QL--------------DL--------------G--------LWDKFSELATKCIIKIVEF
210 220 230
340 350 360 370 380 390
pF1KE3 AKRLSGFMELCQNDQIVLLKAGAMEVVLVRMCRAYNADNRTVFF-EGKYGGMELFRALGC
:::: :: : :::.::::. ......:.: :. .. :. : .: . .. :
CCDS41 AKRLPGFTGLSIADQITLLKAACLDILMLRICTRYTPEQDTMTFSDGLTLNRTQMHNAGF
240 250 260 270 280 290
400 410 420 430 440 450
pF1KE3 SELISSIFDFSHSLSALHFSEDEIALYTALVLINAHRPGLQEKRKVEQLQYNLELAFHHH
. : . .: :. .: :.... : .: .:. :: . : :.: .::..:: : :.. .
CCDS41 GPLTDLVFAFAGQLLPLEMDDTETGLLSAICLICGDRMDLEEPEKVDKLQEPLLEALRLY
300 310 320 330 340 350
460 470 480 490 500
pF1KE3 LCKTHRQS---ILAKLPPK-GKLRSLCSQHVERLQIFQHLHPIVVQAAFPPLYKELFSTE
. .: : .. .. : ::.. .. .:: .. : . .::: .:..
CCDS41 -ARRRRPSQPYMFPRMLMKITDLRGISTKGAERAITLKMEIP----GPMPPLIREMLENP
360 370 380 390 400
510
pF1KE3 TESPVGLSK
CCDS41 EMFEDDSSQPGPHPNASSEDEVPGGQGKGGLKSPA
410 420 430 440
518 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 17:36:45 2016 done: Tue Nov 8 17:36:46 2016
Total Scan time: 3.120 Total Display time: 0.090
Function used was FASTA [36.3.4 Apr, 2011]