FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB9131, 579 aa
1>>>pF1KB9131 579 - 579 aa - 579 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.8811+/-0.00093; mu= 12.3689+/- 0.057
mean_var=102.9714+/-20.279, 0's: 0 Z-trim(108.5): 124 B-trim: 19 in 1/52
Lambda= 0.126391
statistics sampled from 10109 (10233) to 10109 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.664), E-opt: 0.2 (0.314), width: 16
Scan time: 3.550
The best scores are: opt bits E(32554)
CCDS33718.1 NR1D2 gene_id:9975|Hs108|chr3 ( 579) 3895 720.8 1.1e-207
CCDS11361.1 NR1D1 gene_id:9572|Hs108|chr17 ( 614) 1722 324.6 2.2e-88
CCDS4804.1 PPARD gene_id:5467|Hs108|chr6 ( 361) 462 94.8 2e-19
CCDS10177.1 RORA gene_id:6095|Hs108|chr15 ( 523) 448 92.3 1.6e-18
CCDS33669.1 PPARA gene_id:5465|Hs108|chr22 ( 468) 447 92.1 1.7e-18
CCDS44585.1 NR1H3 gene_id:10062|Hs108|chr11 ( 402) 436 90.1 5.9e-18
CCDS7929.1 NR1H3 gene_id:10062|Hs108|chr11 ( 447) 436 90.1 6.5e-18
CCDS73285.1 NR1H3 gene_id:10062|Hs108|chr11 ( 453) 436 90.1 6.5e-18
CCDS45271.1 RORA gene_id:6095|Hs108|chr15 ( 468) 428 88.6 1.9e-17
CCDS10178.1 RORA gene_id:6095|Hs108|chr15 ( 548) 428 88.7 2.1e-17
CCDS10179.1 RORA gene_id:6095|Hs108|chr15 ( 556) 428 88.7 2.1e-17
CCDS6646.1 RORB gene_id:6096|Hs108|chr9 ( 459) 426 88.3 2.3e-17
CCDS46775.1 RARB gene_id:5915|Hs108|chr3 ( 336) 423 87.6 2.6e-17
CCDS2642.1 RARB gene_id:5915|Hs108|chr3 ( 448) 423 87.7 3.4e-17
CCDS30856.1 RORC gene_id:6097|Hs108|chr1 ( 497) 421 87.4 4.7e-17
CCDS1004.1 RORC gene_id:6097|Hs108|chr1 ( 518) 421 87.4 4.9e-17
CCDS45671.1 RARA gene_id:5914|Hs108|chr17 ( 365) 414 86.0 8.7e-17
CCDS42317.1 RARA gene_id:5914|Hs108|chr17 ( 457) 414 86.1 1.1e-16
CCDS11366.1 RARA gene_id:5914|Hs108|chr17 ( 462) 414 86.1 1.1e-16
CCDS58236.1 RARG gene_id:5916|Hs108|chr12 ( 382) 412 85.7 1.2e-16
CCDS58237.1 RARG gene_id:5916|Hs108|chr12 ( 432) 412 85.7 1.3e-16
CCDS41790.1 RARG gene_id:5916|Hs108|chr12 ( 443) 412 85.7 1.3e-16
CCDS8850.1 RARG gene_id:5916|Hs108|chr12 ( 454) 412 85.7 1.4e-16
CCDS58673.1 NR1H2 gene_id:7376|Hs108|chr19 ( 363) 409 85.1 1.6e-16
CCDS42593.1 NR1H2 gene_id:7376|Hs108|chr19 ( 460) 409 85.2 2e-16
CCDS2610.2 PPARG gene_id:5468|Hs108|chr3 ( 477) 388 81.3 3e-15
CCDS2609.1 PPARG gene_id:5468|Hs108|chr3 ( 505) 388 81.3 3.1e-15
CCDS9850.2 ESRRB gene_id:2103|Hs108|chr14 ( 508) 379 79.7 9.7e-15
CCDS42316.1 THRA gene_id:7067|Hs108|chr17 ( 410) 371 78.2 2.2e-14
CCDS12352.1 NR2F6 gene_id:2063|Hs108|chr19 ( 404) 369 77.8 2.8e-14
CCDS54995.1 PPARD gene_id:5467|Hs108|chr6 ( 343) 367 77.4 3.1e-14
CCDS35172.1 RXRA gene_id:6256|Hs108|chr9 ( 462) 368 77.7 3.6e-14
CCDS54994.1 PPARD gene_id:5467|Hs108|chr6 ( 402) 367 77.5 3.6e-14
CCDS4803.1 PPARD gene_id:5467|Hs108|chr6 ( 441) 367 77.5 3.9e-14
CCDS6744.1 NR4A3 gene_id:8013|Hs108|chr9 ( 443) 367 77.5 3.9e-14
CCDS6743.1 NR4A3 gene_id:8013|Hs108|chr9 ( 626) 367 77.6 5.3e-14
CCDS6742.1 NR4A3 gene_id:8013|Hs108|chr9 ( 637) 367 77.6 5.4e-14
CCDS8818.1 NR4A1 gene_id:3164|Hs108|chr12 ( 598) 361 76.5 1.1e-13
CCDS55828.1 NR4A1 gene_id:3164|Hs108|chr12 ( 611) 361 76.5 1.1e-13
CCDS73471.1 NR4A1 gene_id:3164|Hs108|chr12 ( 652) 361 76.5 1.2e-13
CCDS2201.1 NR4A2 gene_id:4929|Hs108|chr2 ( 598) 360 76.3 1.2e-13
CCDS55340.1 NR6A1 gene_id:2649|Hs108|chr9 ( 475) 355 75.3 1.9e-13
CCDS4068.1 NR2F1 gene_id:7025|Hs108|chr5 ( 423) 354 75.1 2e-13
CCDS60383.1 NR5A2 gene_id:2494|Hs108|chr1 ( 469) 352 74.8 2.8e-13
CCDS65127.1 NR6A1 gene_id:2649|Hs108|chr9 ( 476) 352 74.8 2.8e-13
CCDS35137.1 NR6A1 gene_id:2649|Hs108|chr9 ( 480) 352 74.8 2.8e-13
CCDS1400.1 NR5A2 gene_id:2494|Hs108|chr1 ( 495) 352 74.8 2.9e-13
CCDS58546.1 THRA gene_id:7067|Hs108|chr17 ( 451) 351 74.6 3e-13
CCDS1401.1 NR5A2 gene_id:2494|Hs108|chr1 ( 541) 352 74.8 3.1e-13
CCDS1248.1 RXRG gene_id:6258|Hs108|chr1 ( 463) 346 73.7 5.8e-13
>>CCDS33718.1 NR1D2 gene_id:9975|Hs108|chr3 (579 aa)
initn: 3895 init1: 3895 opt: 3895 Z-score: 3842.1 bits: 720.8 E(32554): 1.1e-207
Smith-Waterman score: 3895; 100.0% identity (100.0% similar) in 579 aa overlap (1-579:1-579)
10 20 30 40 50 60
pF1KB9 MEVNAGGVIAYISSSSSASSPASCHSEGSENSFQSSSSSVPSSPNSSNSDTNGNPKNGDL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 MEVNAGGVIAYISSSSSASSPASCHSEGSENSFQSSSSSVPSSPNSSNSDTNGNPKNGDL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB9 ANIEGILKNDRIDCSMKTSKSSAPGMTKSHSGVTKFSGMVLLCKVCGDVASGFHYGVHAC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 ANIEGILKNDRIDCSMKTSKSSAPGMTKSHSGVTKFSGMVLLCKVCGDVASGFHYGVHAC
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB9 EGCKGFFRRSIQQNIQYKKCLKNENCSIMRMNRNRCQQCRFKKCLSVGMSRDAVRFGRIP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 EGCKGFFRRSIQQNIQYKKCLKNENCSIMRMNRNRCQQCRFKKCLSVGMSRDAVRFGRIP
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB9 KREKQRMLIEMQSAMKTMMNSQFSGHLQNDTLVEHHEQTALPAQEQLRPKPQLEQENIKS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 KREKQRMLIEMQSAMKTMMNSQFSGHLQNDTLVEHHEQTALPAQEQLRPKPQLEQENIKS
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB9 SSPPSSDFAKEEVIGMVTRAHKDTFMYNQEQQENSAESMQPQRGERIPKNMEQYNLNHDH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SSPPSSDFAKEEVIGMVTRAHKDTFMYNQEQQENSAESMQPQRGERIPKNMEQYNLNHDH
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB9 CGNGLSSHFPCSESQQHLNGQFKGRNIMHYPNGHAICIANGHCMNFSNAYTQRVCDRVPI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 CGNGLSSHFPCSESQQHLNGQFKGRNIMHYPNGHAICIANGHCMNFSNAYTQRVCDRVPI
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB9 DGFSQNENKNSYLCNTGGRMHLVCPMSKSPYVDPHKSGHEIWEEFSMSFTPAVKEVVEFA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 DGFSQNENKNSYLCNTGGRMHLVCPMSKSPYVDPHKSGHEIWEEFSMSFTPAVKEVVEFA
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB9 KRIPGFRDLSQHDQVNLLKAGTFEVLMVRFASLFDAKERTVTFLSGKKYSVDDLHSMGAG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 KRIPGFRDLSQHDQVNLLKAGTFEVLMVRFASLFDAKERTVTFLSGKKYSVDDLHSMGAG
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB9 DLLNSMFEFSEKLNALQLSDEEMSLFTAVVLVSADRSGIENVNSVEALQETLIRALRTLI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 DLLNSMFEFSEKLNALQLSDEEMSLFTAVVLVSADRSGIENVNSVEALQETLIRALRTLI
490 500 510 520 530 540
550 560 570
pF1KB9 MKNHPNEASIFTKLLLKLPDLRSLNNMHSEELLAFKVHP
:::::::::::::::::::::::::::::::::::::::
CCDS33 MKNHPNEASIFTKLLLKLPDLRSLNNMHSEELLAFKVHP
550 560 570
>>CCDS11361.1 NR1D1 gene_id:9572|Hs108|chr17 (614 aa)
initn: 1836 init1: 910 opt: 1722 Z-score: 1700.3 bits: 324.6 E(32554): 2.2e-88
Smith-Waterman score: 1783; 51.1% identity (72.5% similar) in 614 aa overlap (4-577:9-611)
10 20 30 40 50
pF1KB9 MEVNAGGVIAYISSSSSA---SSPASCHSEGSENSFQSSSSSVPSS-PNSSNSDT
:.::::.::.::.:. .:: : .:..:..:::: ... :. : : ...
CCDS11 MTTLDSNNNTGGVITYIGSSGSSPSRTSPESLYSDNSNGSFQSLTQGCPTYFPPSPTGSL
10 20 30 40 50 60
60 70 80 90
pF1KB9 NGNPKNGDLANIEGILKNDRIDCSMKTSKSSA--------PGM-------------TKSH
. .: . ...: :..: : ..:.::. :: .::
CCDS11 TQDPARS-FGSIPPSLSDDGSPSSSSSSSSSSSSFYNGSPPGSLQVAMEDSSRVSPSKST
70 80 90 100 110
100 110 120 130 140 150
pF1KB9 SGVTKFSGMVLLCKVCGDVASGFHYGVHACEGCKGFFRRSIQQNIQYKKCLKNENCSIMR
:..::..:::::::::::::::::::::::::::::::::::::::::.:::::::::.:
CCDS11 SNITKLNGMVLLCKVCGDVASGFHYGVHACEGCKGFFRRSIQQNIQYKRCLKNENCSIVR
120 130 140 150 160 170
160 170 180 190 200 210
pF1KB9 MNRNRCQQCRFKKCLSVGMSRDAVRFGRIPKREKQRMLIEMQSAMKTMMNSQFSGHLQND
.::::::::::::::::::::::::::::::::::::: ::::::. . :.:.:.. .
CCDS11 INRNRCQQCRFKKCLSVGMSRDAVRFGRIPKREKQRMLAEMQSAMN-LANNQLSSQCPLE
180 190 200 210 220 230
220 230 240 250 260
pF1KB9 TLVEHHEQTALPAQEQLRPKP---------QLEQENIKSSSPPSSDFAKEEVIGMVTRAH
: .: : : . : : :. :. . :: . . :.::..:.:::
CCDS11 TSPTQHP-TPGPMGPSPPPAPVPSPLVGFSQFPQQ-LTPPRSPSPEPTVEDVISQVARAH
240 250 260 270 280 290
270 280 290 300 310
pF1KB9 KDTFMYNQEQQENSAESMQPQRGERIPKNMEQYNLNHDHCGNGLSSHFPCSESQQH---L
.. : : ... .: ... ... : . ... : . ... . .:.: :
CCDS11 REIFTYAHDKLGSSPGNFNANHASGSPPATTPHRWENQGCPPAPNDNNTLA-AQRHNEAL
300 310 320 330 340 350
320 330 340 350 360 370
pF1KB9 NGQFKGRNIMHYPNGHAICIANGHCMNFSNAYTQRVCDRVPIDGFSQNENK---NSYLCN
:: .. . :: :. : . ::. .:.: : .. :.: :: .
CCDS11 NGLRQAPS--SYPPTWPPGPAHHSCHQ-SNSNGHRLC---PTHVYAAPEGKAPANSPRQG
360 370 380 390 400
380 390 400 410 420 430
pF1KB9 TGGRMHLVCPMSKSPYVDPHKSGHEIWEEFSMSFTPAVKEVVEFAKRIPGFRDLSQHDQV
.. . :.:::. :. .. .::::.:::::::::.:::::::.:::::::::::::
CCDS11 NSKNVLLACPMNMYPHGRSGRTVQEIWEDFSMSFTPAVREVVEFAKHIPGFRDLSQHDQV
410 420 430 440 450 460
440 450 460 470 480 490
pF1KB9 NLLKAGTFEVLMVRFASLFDAKERTVTFLSGKKYSVDDLHSMGAGDLLNSMFEFSEKLNA
.::::::::::::::::::..:..:: ::: ::...: .:: ::::..::.::::::.
CCDS11 TLLKAGTFEVLMVRFASLFNVKDQTVMFLSRTTYSLQELGAMGMGDLLSAMFDFSEKLNS
470 480 490 500 510 520
500 510 520 530 540 550
pF1KB9 LQLSDEEMSLFTAVVLVSADRSGIENVNSVEALQETLIRALRTLIMKNHPNEASIFTKLL
: :..::..::::::::::::::.:: ::: :::::.::::.:..::.: :.: :::::
CCDS11 LALTEEELGLFTAVVLVSADRSGMENSASVEQLQETLLRALRALVLKNRPLETSRFTKLL
530 540 550 560 570 580
560 570
pF1KB9 LKLPDLRSLNNMHSEELLAFKVHP
:::::::.:::::::.::.:.:
CCDS11 LKLPDLRTLNNMHSEKLLSFRVDAQ
590 600 610
>>CCDS4804.1 PPARD gene_id:5467|Hs108|chr6 (361 aa)
initn: 589 init1: 228 opt: 462 Z-score: 462.2 bits: 94.8 E(32554): 2e-19
Smith-Waterman score: 462; 45.8% identity (73.6% similar) in 144 aa overlap (79-212:46-187)
50 60 70 80 90 100
pF1KB9 SDTNGNPKNGDLANIEGILKNDRIDCSMKTSKSSAPG--MTKSHSGVTKFS--GMVLLCK
:.::.: . . . : : .. . :.
CCDS48 EKEEVAEAEGAPELNGGPQHALPSSSYTDLSRSSSPPSLLDQLQMGCDGASCGSLNMECR
20 30 40 50 60 70
110 120 130 140 150 160
pF1KB9 VCGDVASGFHYGVHACEGCKGFFRRSIQQNIQYKKCLKNENCSIMRMNRNRCQQCRFKKC
:::: ::::::::::::::::::::.:.....:.:: .. :.:.. :::.:: :::.::
CCDS48 VCGDKASGFHYGVHACEGCKGFFRRTIRMKLEYEKCERS--CKIQKKNRNKCQYCRFQKC
80 90 100 110 120 130
170 180 190 200 210
pF1KB9 LSVGMSRDAVRFGRIPKREKQRMLIEMQSAMKTMMNSQ------FSGHLQNDTLVEHHEQ
:..:::..:.::::.:. ::.... . . ...: : :: :. : :
CCDS48 LALGMSHNAIRFGRMPEAEKRKLVAGLTANEGSQYNPQVADLKAFSKHIYNAYLKNFNMT
140 150 160 170 180 190
220 230 240 250 260 270
pF1KB9 TALPAQEQLRPKPQLEQENIKSSSPPSSDFAKEEVIGMVTRAHKDTFMYNQEQQENSAES
CCDS48 KKKARSILTGKASHTAPFVIHDIETLWQAEKGLVWKQLVNGLPPYKEISVHVFYRCQCTT
200 210 220 230 240 250
>>CCDS10177.1 RORA gene_id:6095|Hs108|chr15 (523 aa)
initn: 544 init1: 248 opt: 448 Z-score: 445.9 bits: 92.3 E(32554): 1.6e-18
Smith-Waterman score: 843; 33.0% identity (62.4% similar) in 548 aa overlap (42-579:13-496)
20 30 40 50 60 70
pF1KB9 ISSSSSASSPASCHSEGSENSFQSSSSSVPSSPNSSNSDTNGNPKNGDLANIEGILKNDR
: :.::..:. .. .. : : :. :..
CCDS10 MESAPAAPDPAASEPGSSGADAAAGSRETPL-NQESARKSEP
10 20 30 40
80 90 100 110 120
pF1KB9 IDCSMKTSKSSAP-GMT---KSHSGVTKFSGMVLLCKVCGDVASGFHYGVHACEGCKGFF
. : ::. :.. :.:.. . .. ::.::: .::.:::: .::::::::
CCDS10 PAPVRRQSYSSTSRGISVTKKTHTSQIE----IIPCKICGDKSSGIHYGVITCEGCKGFF
50 60 70 80 90
130 140 150 160 170 180
pF1KB9 RRSIQQNIQYKKCLKNENCSIMRMNRNRCQQCRFKKCLSVGMSRDAVRFGRIPKREKQRM
::: :.: :. : ...:: : : .:::::.::..:::.::::::::.:::. :.... .
CCDS10 RRSQQSNATYS-CPRQKNCLIDRTSRNRCQHCRLQKCLAVGMSRDAVKFGRMSKKQRDSL
100 110 120 130 140 150
190 200 210 220 230 240
pF1KB9 LIEMQSAMKTMMNSQFSGHLQNDTLVEHHEQTALPAQEQLRPKPQLEQENIKSSSPPSSD
:.: : :..: : : :..: :.. . : ::....
CCDS10 YAEVQ---KHRMQQQ-----QRD----HQQQ---PGEAE----PLTPTYNISANG-----
160 170 180 190
250 260 270 280 290 300
pF1KB9 FAKEEVIGMVTRAHKDTFMYNQEQQENSAESMQPQRGERIPKNMEQYNLNHDHCGNGLSS
.:. : : : .. :. : . . . .. :. .
CCDS10 ---------LTELHDDL--------SNYIDGHTPE-GSKADSAVSSFYLDIQPS------
200 210 220
310 320 330 340 350 360
pF1KB9 HFPCSESQQHLNGQFKGRNIMHYPNGHAICIANGHCMNFSNAYTQRVCDRVPIDGFSQNE
: ..: .:: .: . : : . .. .: .:.:. :. . . . .. ..::
CCDS10 --P-DQSGLDING-IKPEPICDYTPASGFF---PYC-SFTNGETSPTVSMAELEHLAQNI
230 240 250 260 270 280
370 380 390 400 410 420
pF1KB9 NKN-----SYLCNTGGRMHLVCPMSKSPYVDPHKSGHEIWEEFSMSFTPAVKEVVEFAKR
.:. .:: . .. ... .:. . .:. ....: :.. :::::::
CCDS10 SKSHLETCQYLREELQQITWQTFLQEEIENYQNKQREVMWQLCAIKITEAIQYVVEFAKR
290 300 310 320 330 340
430 440 450 460 470 480
pF1KB9 IPGFRDLSQHDQVNLLKAGTFEVLMVRFASLFDAKERTVTFLSGKKYSVDDLHSMGAGDL
: :: .: :.::. :::::..::...:. ::... :: : .:: : : ..:.: :.
CCDS10 IDGFMELCQNDQIVLLKAGSLEVVFIRMCRAFDSQNNTVYF-DGKYASPDVFKSLGCEDF
350 360 370 380 390
490 500 510 520 530 540
pF1KB9 LNSMFEFSEKLNALQLSDEEMSLFTAVVLVSADRSGIENVNSVEALQETLIRALRTLIMK
.. .:::...: ...:...:..::.: ::.::::: ... ..: ::. . ::. ...:
CCDS10 ISFVFEFGKSLCSMHLTEDEIALFSAFVLMSADRSWLQEKVKIEKLQQKIQLALQHVLQK
400 410 420 430 440 450
550 560 570
pF1KB9 NHPNEASIFTKLLLKLPDLRSLNNMHSEELLAFK-VHP
:: : .:.:::. :. ::.: . :.:.:.::: ..:
CCDS10 NH-REDGILTKLICKVSTLRALCGRHTEKLMAFKAIYPDIVRLHFPPLYKELFTSEFEPA
460 470 480 490 500 510
CCDS10 MQIDG
520
>>CCDS33669.1 PPARA gene_id:5465|Hs108|chr22 (468 aa)
initn: 768 init1: 229 opt: 447 Z-score: 445.6 bits: 92.1 E(32554): 1.7e-18
Smith-Waterman score: 595; 28.6% identity (54.8% similar) in 496 aa overlap (84-576:87-448)
60 70 80 90 100 110
pF1KB9 NPKNGDLANIEGILKNDRIDCSMKTSKSSAPG-MTKSHSGVTKFSGMVLLCKVCGDVASG
:: . .: ::. . . :..::: :::
CCDS33 LGSCPGSDGSVITDTLSPASSPSSVTYPVVPGSVDESPSGA-----LNIECRICGDKASG
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB9 FHYGVHACEGCKGFFRRSIQQNIQYKKCLKNENCSIMRMNRNRCQQCRFKKCLSVGMSRD
.::::::::::::::::.:. .. : :: ...:.:.. :::.:: :::.::::::::..
CCDS33 YHYGVHACEGCKGFFRRTIRLKLVYDKC--DRSCKIQKKNRNKCQYCRFHKCLSVGMSHN
120 130 140 150 160
180 190 200 210 220 230
pF1KB9 AVRFGRIPKREKQRMLIEMQSAMKTMMNSQFSGHLQNDTLVEHHEQTALPAQEQLRPKPQ
:.::::.:. :: .. :. . . . .:
CCDS33 AIRFGRMPRSEKAKLKAEILTCEHDIEDS-------------------------------
170 180 190
240 250 260 270 280 290
pF1KB9 LEQENIKSSSPPSSDFAKEEVIGMVTRAHKDTFMYNQEQQENSAESMQPQRGERIPKNME
: ..:: .::. . .:. .: .:. . :. .
CCDS33 -ETADLKS-------LAKR-----IYEAYLKNFNMNKVKA-------------RVILS--
200 210 220 230
300 310 320 330 340 350
pF1KB9 QYNLNHDHCGNGLSSHFPCSESQQHLNGQFKGRNIMHYPNGHAICIANGHCMNFSNAYTQ
: .:. : : ..: . ...:.:. .
CCDS33 -----------GKASNNP----------PF----VIH--DMETLCMAE-----------K
240 250
360 370 380 390 400 410
pF1KB9 RVCDRVPIDGFSQNENKNSYLCNTGGRMHLVCPMSKSPYVDPHKSGHEIWEEFSMSFTPA
. .. .:. .::.. . :. : .. . .
CCDS33 TLVAKLVANGI---QNKEAEV-----RIFHCCQCTS---------------------VET
260 270 280
420 430 440 450 460 470
pF1KB9 VKEVVEFAKRIPGFRDLSQHDQVNLLKAGTFEVLMVRFASLFDAKERTVTFLSGKKYSVD
: :..:::: :::: .:. .:::.::: :..:.... ..:... :.. .: . .
CCDS33 VTELTEFAKAIPGFANLDLNDQVTLLKYGVYEAIFAMLSSVMNKDGMLVAYGNGF-ITRE
290 300 310 320 330 340
480 490 500 510 520 530
pF1KB9 DLHSMGAG--DLLNSMFEFSEKLNALQLSDEEMSLFTAVVLVSADRSGIENVNSVEALQE
:.:. :... :.:. :.:::.:.: ..:::.:... .:: :. ::. .: .::
CCDS33 FLKSLRKPFCDIMEPKFDFAMKFNALELDDSDISLFVAAIICCGDRPGLLNVGHIEKMQE
350 360 370 380 390 400
540 550 560 570
pF1KB9 TLIRALRTLIMKNHPNEASIFTKLLLKLPDLRSLNNMHSEELLAFKVHP
....:: ...:::.. .: ::: :. :::.: . :.. . .:
CCDS33 GIVHVLRLHLQSNHPDDIFLFPKLLQKMADLRQLVTEHAQLVQIIKKTESDAALHPLLQE
410 420 430 440 450 460
CCDS33 IYRDMY
>>CCDS44585.1 NR1H3 gene_id:10062|Hs108|chr11 (402 aa)
initn: 649 init1: 250 opt: 436 Z-score: 435.8 bits: 90.1 E(32554): 5.9e-18
Smith-Waterman score: 497; 26.7% identity (52.9% similar) in 480 aa overlap (102-578:52-386)
80 90 100 110 120 130
pF1KB9 IDCSMKTSKSSAPGMTKSHSGVTKFSGMVLLCKVCGDVASGFHYGVHACEGCKGFFRRSI
::.:::: ::::::.: .:::::::::::.
CCDS44 LTRAEPPSEPTEIRPQKRKKGPAPKMLGNELCSVCGDKASGFHYNVLSCEGCKGFFRRSV
30 40 50 60 70 80
140 150 160 170 180 190
pF1KB9 QQNIQYKKCLKNENCSIMRMNRNRCQQCRFKKCLSVGMSRDAVRFGRIPKREKQRMLIEM
.. .: : .. .: . . : .::.::..:: ..:: .. : : :
CCDS44 IKGAHYI-CHSGGHCPMDTYMRRKCQECRLRKCRQAGMREECV-------------LSEE
90 100 110 120
200 210 220 230 240 250
pF1KB9 QSAMKTMMNSQFSGHLQNDTLVEHHEQTALPAQEQLRPKPQLEQENIKSSSPPSSDFAKE
: .: . .. :. . :.:: :. .::::.
CCDS44 QIRLKKLKRQEE----------EQAHATSLP------PR---------ASSPPQ------
130 140 150
260 270 280 290 300 310
pF1KB9 EVIGMVTRAHKDTFMYNQEQQENSAESMQPQRGERIPKNMEQYNLNHDHCGNGLSSHFPC
. :: . :... :. ..
CCDS44 ---------------------------ILPQLS---PEQL------------GMIEKLVA
160 170
320 330 340 350 360 370
pF1KB9 SESQQHLNGQFKGRNIMHYPNGHAICIANGHCMNFSNAYTQRVCDRVPIDGFSQNENKNS
...: :.: .::.
CCDS44 AQQQ---------------------------------------CNR---RSFSD------
180
380 390 400 410 420
pF1KB9 YLCNTGGRMHLVCPMSKSPYVDPH--KSGHEIWEEFSMSFTPAVKEVVEFAKRIPGFRDL
:.. : : .: ::: .. .. . .:. .:.:.:.:::..::: .:
CCDS44 -------RLR-VTPWPMAP--DPHSREARQQRFAHFTELAIVSVQEIVDFAKQLPGFLQL
190 200 210 220 230
430 440 450 460 470 480
pF1KB9 SQHDQVNLLKAGTFEVLMVRFASLFDAKERTVTFLSGKKYSVDDLHSMGAG-DLLNSMFE
:..::. :::....::.... . .. ...:::. .:. .:. . : ...: .::
CCDS44 SREDQIALLKTSAIEVMLLETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFINPIFE
240 250 260 270 280 290
490 500 510 520 530 540
pF1KB9 FSEKLNALQLSDEEMSLFTAVVLVSADRSGIENVNSVEALQETLIRALRTLIMKNHPNEA
::. .: :::.: :..:. :. . :::: .... .:: ::.: ..::.. . .::..
CCDS44 FSRAMNELQLNDAEFALLIAISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIHHPHDR
300 310 320 330 340 350
550 560 570
pF1KB9 SIFTKLLLKLPDLRSLNNMHSEELLAFKVHP
.: ..:.:: .::.:...:::...:....
CCDS44 LMFPRMLMKLVSLRTLSSVHSEQVFALRLQDKKLPPLLSEIWDVHE
360 370 380 390 400
>>CCDS7929.1 NR1H3 gene_id:10062|Hs108|chr11 (447 aa)
initn: 649 init1: 250 opt: 436 Z-score: 435.1 bits: 90.1 E(32554): 6.5e-18
Smith-Waterman score: 497; 26.7% identity (52.9% similar) in 480 aa overlap (102-578:97-431)
80 90 100 110 120 130
pF1KB9 IDCSMKTSKSSAPGMTKSHSGVTKFSGMVLLCKVCGDVASGFHYGVHACEGCKGFFRRSI
::.:::: ::::::.: .:::::::::::.
CCDS79 LTRAEPPSEPTEIRPQKRKKGPAPKMLGNELCSVCGDKASGFHYNVLSCEGCKGFFRRSV
70 80 90 100 110 120
140 150 160 170 180 190
pF1KB9 QQNIQYKKCLKNENCSIMRMNRNRCQQCRFKKCLSVGMSRDAVRFGRIPKREKQRMLIEM
.. .: : .. .: . . : .::.::..:: ..:: .. : : :
CCDS79 IKGAHYI-CHSGGHCPMDTYMRRKCQECRLRKCRQAGMREECV-------------LSEE
130 140 150 160 170
200 210 220 230 240 250
pF1KB9 QSAMKTMMNSQFSGHLQNDTLVEHHEQTALPAQEQLRPKPQLEQENIKSSSPPSSDFAKE
: .: . .. :. . :.:: :. .::::.
CCDS79 QIRLKKLKRQEE----------EQAHATSLP------PR---------ASSPPQ------
180 190 200
260 270 280 290 300 310
pF1KB9 EVIGMVTRAHKDTFMYNQEQQENSAESMQPQRGERIPKNMEQYNLNHDHCGNGLSSHFPC
. :: . :... :. ..
CCDS79 ---------------------------ILPQLS---PEQL------------GMIEKLVA
210
320 330 340 350 360 370
pF1KB9 SESQQHLNGQFKGRNIMHYPNGHAICIANGHCMNFSNAYTQRVCDRVPIDGFSQNENKNS
...: :.: .::.
CCDS79 AQQQ---------------------------------------CNR---RSFSD------
220 230
380 390 400 410 420
pF1KB9 YLCNTGGRMHLVCPMSKSPYVDPH--KSGHEIWEEFSMSFTPAVKEVVEFAKRIPGFRDL
:.. : : .: ::: .. .. . .:. .:.:.:.:::..::: .:
CCDS79 -------RLR-VTPWPMAP--DPHSREARQQRFAHFTELAIVSVQEIVDFAKQLPGFLQL
240 250 260 270 280
430 440 450 460 470 480
pF1KB9 SQHDQVNLLKAGTFEVLMVRFASLFDAKERTVTFLSGKKYSVDDLHSMGAG-DLLNSMFE
:..::. :::....::.... . .. ...:::. .:. .:. . : ...: .::
CCDS79 SREDQIALLKTSAIEVMLLETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFINPIFE
290 300 310 320 330 340
490 500 510 520 530 540
pF1KB9 FSEKLNALQLSDEEMSLFTAVVLVSADRSGIENVNSVEALQETLIRALRTLIMKNHPNEA
::. .: :::.: :..:. :. . :::: .... .:: ::.: ..::.. . .::..
CCDS79 FSRAMNELQLNDAEFALLIAISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIHHPHDR
350 360 370 380 390 400
550 560 570
pF1KB9 SIFTKLLLKLPDLRSLNNMHSEELLAFKVHP
.: ..:.:: .::.:...:::...:....
CCDS79 LMFPRMLMKLVSLRTLSSVHSEQVFALRLQDKKLPPLLSEIWDVHE
410 420 430 440
>>CCDS73285.1 NR1H3 gene_id:10062|Hs108|chr11 (453 aa)
initn: 649 init1: 250 opt: 436 Z-score: 435.0 bits: 90.1 E(32554): 6.5e-18
Smith-Waterman score: 497; 26.7% identity (52.9% similar) in 480 aa overlap (102-578:103-437)
80 90 100 110 120 130
pF1KB9 IDCSMKTSKSSAPGMTKSHSGVTKFSGMVLLCKVCGDVASGFHYGVHACEGCKGFFRRSI
::.:::: ::::::.: .:::::::::::.
CCDS73 LTRAEPPSEPTEIRPQKRKKGPAPKMLGNELCSVCGDKASGFHYNVLSCEGCKGFFRRSV
80 90 100 110 120 130
140 150 160 170 180 190
pF1KB9 QQNIQYKKCLKNENCSIMRMNRNRCQQCRFKKCLSVGMSRDAVRFGRIPKREKQRMLIEM
.. .: : .. .: . . : .::.::..:: ..:: .. : : :
CCDS73 IKGAHYI-CHSGGHCPMDTYMRRKCQECRLRKCRQAGMREECV-------------LSEE
140 150 160 170
200 210 220 230 240 250
pF1KB9 QSAMKTMMNSQFSGHLQNDTLVEHHEQTALPAQEQLRPKPQLEQENIKSSSPPSSDFAKE
: .: . .. :. . :.:: :. .::::.
CCDS73 QIRLKKLKRQEE----------EQAHATSLP------PR---------ASSPPQ------
180 190 200
260 270 280 290 300 310
pF1KB9 EVIGMVTRAHKDTFMYNQEQQENSAESMQPQRGERIPKNMEQYNLNHDHCGNGLSSHFPC
. :: . :... :. ..
CCDS73 ---------------------------ILPQLS---PEQL------------GMIEKLVA
210 220
320 330 340 350 360 370
pF1KB9 SESQQHLNGQFKGRNIMHYPNGHAICIANGHCMNFSNAYTQRVCDRVPIDGFSQNENKNS
...: :.: .::.
CCDS73 AQQQ---------------------------------------CNR---RSFSD------
230
380 390 400 410 420
pF1KB9 YLCNTGGRMHLVCPMSKSPYVDPH--KSGHEIWEEFSMSFTPAVKEVVEFAKRIPGFRDL
:.. : : .: ::: .. .. . .:. .:.:.:.:::..::: .:
CCDS73 -------RLR-VTPWPMAP--DPHSREARQQRFAHFTELAIVSVQEIVDFAKQLPGFLQL
240 250 260 270 280
430 440 450 460 470 480
pF1KB9 SQHDQVNLLKAGTFEVLMVRFASLFDAKERTVTFLSGKKYSVDDLHSMGAG-DLLNSMFE
:..::. :::....::.... . .. ...:::. .:. .:. . : ...: .::
CCDS73 SREDQIALLKTSAIEVMLLETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFINPIFE
290 300 310 320 330 340
490 500 510 520 530 540
pF1KB9 FSEKLNALQLSDEEMSLFTAVVLVSADRSGIENVNSVEALQETLIRALRTLIMKNHPNEA
::. .: :::.: :..:. :. . :::: .... .:: ::.: ..::.. . .::..
CCDS73 FSRAMNELQLNDAEFALLIAISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIHHPHDR
350 360 370 380 390 400
550 560 570
pF1KB9 SIFTKLLLKLPDLRSLNNMHSEELLAFKVHP
.: ..:.:: .::.:...:::...:....
CCDS73 LMFPRMLMKLVSLRTLSSVHSEQVFALRLQDKKLPPLLSEIWDVHE
410 420 430 440 450
>>CCDS45271.1 RORA gene_id:6095|Hs108|chr15 (468 aa)
initn: 544 init1: 248 opt: 428 Z-score: 426.9 bits: 88.6 E(32554): 1.9e-17
Smith-Waterman score: 823; 34.0% identity (63.2% similar) in 486 aa overlap (100-579:15-441)
70 80 90 100 110 120
pF1KB9 DRIDCSMKTSKSSAPGMTKSHSGVTKFSGMVLLCKVCGDVASGFHYGVHACEGCKGFFRR
.. ::.::: .::.:::: .::::::::::
CCDS45 MMYFVIAAMKAQIEIIPCKICGDKSSGIHYGVITCEGCKGFFRR
10 20 30 40
130 140 150 160 170 180
pF1KB9 SIQQNIQYKKCLKNENCSIMRMNRNRCQQCRFKKCLSVGMSRDAVRFGRIPKREKQRMLI
: :.: :. : ...:: : : .:::::.::..:::.::::::::.:::. :.... .
CCDS45 SQQSNATYS-CPRQKNCLIDRTSRNRCQHCRLQKCLAVGMSRDAVKFGRMSKKQRDSLYA
50 60 70 80 90 100
190 200 210 220 230 240
pF1KB9 EMQSAMKTMMNSQFSGHLQNDTLVEHHEQTALPAQEQLRPKPQLEQENIKSSSPPSSDFA
:.: : :..: : : :..: :.. . : ::....
CCDS45 EVQ---KHRMQQQ-----QRD----HQQQ---PGEAE----PLTPTYNISANG-------
110 120 130
250 260 270 280 290 300
pF1KB9 KEEVIGMVTRAHKDTFMYNQEQQENSAESMQPQRGERIPKNMEQYNLNHDHCGNGLSSHF
.:. : : : .. :. : . . . .. :. . .
CCDS45 -------LTELHDDL--------SNYIDGHTPE-GSKADSAVSSFYLDIQPSPD------
140 150 160 170
310 320 330 340 350 360
pF1KB9 PCSESQQHLNGQFKGRNIMHYPNGHAICIANGHCMNFSNAYTQRVCDRVPIDGFSQNENK
.: .:: .: . : : . .. .: .:.:. :. . . . .. ..:: .:
CCDS45 ---QSGLDING-IKPEPICDYTPASGFF---PYC-SFTNGETSPTVSMAELEHLAQNISK
180 190 200 210 220
370 380 390 400 410 420
pF1KB9 N-----SYLCNTGGRMHLVCPMSKSPYVDPHKSGHEIWEEFSMSFTPAVKEVVEFAKRIP
. .:: . .. ... .:. . .:. ....: :.. ::::::::
CCDS45 SHLETCQYLREELQQITWQTFLQEEIENYQNKQREVMWQLCAIKITEAIQYVVEFAKRID
230 240 250 260 270 280
430 440 450 460 470 480
pF1KB9 GFRDLSQHDQVNLLKAGTFEVLMVRFASLFDAKERTVTFLSGKKYSVDDLHSMGAGDLLN
:: .: :.::. :::::..::...:. ::... :: : .:: : : ..:.: :...
CCDS45 GFMELCQNDQIVLLKAGSLEVVFIRMCRAFDSQNNTVYF-DGKYASPDVFKSLGCEDFIS
290 300 310 320 330 340
490 500 510 520 530 540
pF1KB9 SMFEFSEKLNALQLSDEEMSLFTAVVLVSADRSGIENVNSVEALQETLIRALRTLIMKNH
.:::...: ...:...:..::.: ::.::::: ... ..: ::. . ::. ...:::
CCDS45 FVFEFGKSLCSMHLTEDEIALFSAFVLMSADRSWLQEKVKIEKLQQKIQLALQHVLQKNH
350 360 370 380 390 400
550 560 570
pF1KB9 PNEASIFTKLLLKLPDLRSLNNMHSEELLAFK-VHP
: .:.:::. :. ::.: . :.:.:.::: ..:
CCDS45 -REDGILTKLICKVSTLRALCGRHTEKLMAFKAIYPDIVRLHFPPLYKELFTSEFEPAMQ
410 420 430 440 450 460
CCDS45 IDG
>>CCDS10178.1 RORA gene_id:6095|Hs108|chr15 (548 aa)
initn: 544 init1: 248 opt: 428 Z-score: 425.9 bits: 88.7 E(32554): 2.1e-17
Smith-Waterman score: 823; 34.0% identity (63.2% similar) in 486 aa overlap (100-579:95-521)
70 80 90 100 110 120
pF1KB9 DRIDCSMKTSKSSAPGMTKSHSGVTKFSGMVLLCKVCGDVASGFHYGVHACEGCKGFFRR
.. ::.::: .::.:::: .::::::::::
CCDS10 NWDGATAKNFINLREFFSFLLPALRKAQIEIIPCKICGDKSSGIHYGVITCEGCKGFFRR
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB9 SIQQNIQYKKCLKNENCSIMRMNRNRCQQCRFKKCLSVGMSRDAVRFGRIPKREKQRMLI
: :.: :. : ...:: : : .:::::.::..:::.::::::::.:::. :.... .
CCDS10 SQQSNATYS-CPRQKNCLIDRTSRNRCQHCRLQKCLAVGMSRDAVKFGRMSKKQRDSLYA
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB9 EMQSAMKTMMNSQFSGHLQNDTLVEHHEQTALPAQEQLRPKPQLEQENIKSSSPPSSDFA
:.: : :..: : : :..: :.. . : ::....
CCDS10 EVQ---KHRMQQQ-----QRD----HQQQ---PGEAE----PLTPTYNISANG-------
190 200 210
250 260 270 280 290 300
pF1KB9 KEEVIGMVTRAHKDTFMYNQEQQENSAESMQPQRGERIPKNMEQYNLNHDHCGNGLSSHF
.:. : : : .. :. : . . . .. :. . .
CCDS10 -------LTELHDDL--------SNYIDGHTPE-GSKADSAVSSFYLDIQPSPD------
220 230 240 250
310 320 330 340 350 360
pF1KB9 PCSESQQHLNGQFKGRNIMHYPNGHAICIANGHCMNFSNAYTQRVCDRVPIDGFSQNENK
.: .:: .: . : : . .. .: .:.:. :. . . . .. ..:: .:
CCDS10 ---QSGLDING-IKPEPICDYTPASGFF---PYC-SFTNGETSPTVSMAELEHLAQNISK
260 270 280 290 300
370 380 390 400 410 420
pF1KB9 N-----SYLCNTGGRMHLVCPMSKSPYVDPHKSGHEIWEEFSMSFTPAVKEVVEFAKRIP
. .:: . .. ... .:. . .:. ....: :.. ::::::::
CCDS10 SHLETCQYLREELQQITWQTFLQEEIENYQNKQREVMWQLCAIKITEAIQYVVEFAKRID
310 320 330 340 350 360
430 440 450 460 470 480
pF1KB9 GFRDLSQHDQVNLLKAGTFEVLMVRFASLFDAKERTVTFLSGKKYSVDDLHSMGAGDLLN
:: .: :.::. :::::..::...:. ::... :: : .:: : : ..:.: :...
CCDS10 GFMELCQNDQIVLLKAGSLEVVFIRMCRAFDSQNNTVYF-DGKYASPDVFKSLGCEDFIS
370 380 390 400 410 420
490 500 510 520 530 540
pF1KB9 SMFEFSEKLNALQLSDEEMSLFTAVVLVSADRSGIENVNSVEALQETLIRALRTLIMKNH
.:::...: ...:...:..::.: ::.::::: ... ..: ::. . ::. ...:::
CCDS10 FVFEFGKSLCSMHLTEDEIALFSAFVLMSADRSWLQEKVKIEKLQQKIQLALQHVLQKNH
430 440 450 460 470 480
550 560 570
pF1KB9 PNEASIFTKLLLKLPDLRSLNNMHSEELLAFK-VHP
: .:.:::. :. ::.: . :.:.:.::: ..:
CCDS10 -REDGILTKLICKVSTLRALCGRHTEKLMAFKAIYPDIVRLHFPPLYKELFTSEFEPAMQ
490 500 510 520 530 540
CCDS10 IDG
579 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 23:03:44 2016 done: Thu Nov 3 23:03:44 2016
Total Scan time: 3.550 Total Display time: 0.120
Function used was FASTA [36.3.4 Apr, 2011]