FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5968, 556 aa 1>>>pF1KB5968 556 - 556 aa - 556 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.4171+/-0.000884; mu= 13.9412+/- 0.053 mean_var=96.0457+/-18.958, 0's: 0 Z-trim(108.0): 126 B-trim: 2 in 1/52 Lambda= 0.130869 statistics sampled from 9778 (9906) to 9778 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.672), E-opt: 0.2 (0.304), width: 16 Scan time: 2.890 The best scores are: opt bits E(32554) CCDS10179.1 RORA gene_id:6095|Hs108|chr15 ( 556) 3807 729.3 3e-210 CCDS10178.1 RORA gene_id:6095|Hs108|chr15 ( 548) 3384 649.4 3.2e-186 CCDS45271.1 RORA gene_id:6095|Hs108|chr15 ( 468) 3124 600.3 1.7e-171 CCDS10177.1 RORA gene_id:6095|Hs108|chr15 ( 523) 3113 598.2 7.8e-171 CCDS6646.1 RORB gene_id:6096|Hs108|chr9 ( 459) 1967 381.8 9.5e-106 CCDS30856.1 RORC gene_id:6097|Hs108|chr1 ( 497) 950 189.8 6.4e-48 CCDS1004.1 RORC gene_id:6097|Hs108|chr1 ( 518) 950 189.8 6.7e-48 CCDS11361.1 NR1D1 gene_id:9572|Hs108|chr17 ( 614) 438 93.2 9.7e-19 CCDS33718.1 NR1D2 gene_id:9975|Hs108|chr3 ( 579) 428 91.3 3.4e-18 CCDS6856.1 NR5A1 gene_id:2516|Hs108|chr9 ( 461) 419 89.6 9.1e-18 CCDS2642.1 RARB gene_id:5915|Hs108|chr3 ( 448) 417 89.2 1.2e-17 CCDS58236.1 RARG gene_id:5916|Hs108|chr12 ( 382) 415 88.8 1.3e-17 CCDS41790.1 RARG gene_id:5916|Hs108|chr12 ( 443) 415 88.8 1.5e-17 CCDS8850.1 RARG gene_id:5916|Hs108|chr12 ( 454) 415 88.8 1.5e-17 CCDS42317.1 RARA gene_id:5914|Hs108|chr17 ( 457) 407 87.3 4.4e-17 CCDS11366.1 RARA gene_id:5914|Hs108|chr17 ( 462) 407 87.3 4.4e-17 CCDS35172.1 RXRA gene_id:6256|Hs108|chr9 ( 462) 399 85.8 1.3e-16 CCDS41821.1 NR2C1 gene_id:7181|Hs108|chr12 ( 467) 399 85.8 1.3e-16 CCDS44953.1 NR2C1 gene_id:7181|Hs108|chr12 ( 483) 399 85.8 1.3e-16 CCDS9051.1 NR2C1 gene_id:7181|Hs108|chr12 ( 603) 399 85.8 1.6e-16 CCDS2610.2 PPARG gene_id:5468|Hs108|chr3 ( 477) 396 85.2 1.9e-16 CCDS2609.1 PPARG gene_id:5468|Hs108|chr3 ( 505) 396 85.2 2e-16 CCDS33669.1 PPARA gene_id:5465|Hs108|chr22 ( 468) 389 83.9 4.7e-16 CCDS72970.1 RXRG gene_id:6258|Hs108|chr1 ( 340) 385 83.1 6.1e-16 CCDS1401.1 NR5A2 gene_id:2494|Hs108|chr1 ( 541) 387 83.6 6.9e-16 CCDS1248.1 RXRG gene_id:6258|Hs108|chr1 ( 463) 385 83.1 7.8e-16 CCDS4068.1 NR2F1 gene_id:7025|Hs108|chr5 ( 423) 384 82.9 8.3e-16 CCDS4768.1 RXRB gene_id:6257|Hs108|chr6 ( 533) 385 83.2 8.8e-16 CCDS59007.1 RXRB gene_id:6257|Hs108|chr6 ( 537) 385 83.2 8.9e-16 CCDS60383.1 NR5A2 gene_id:2494|Hs108|chr1 ( 469) 380 82.2 1.5e-15 CCDS1400.1 NR5A2 gene_id:2494|Hs108|chr1 ( 495) 380 82.2 1.6e-15 CCDS55340.1 NR6A1 gene_id:2649|Hs108|chr9 ( 475) 379 82.0 1.8e-15 CCDS65127.1 NR6A1 gene_id:2649|Hs108|chr9 ( 476) 379 82.0 1.8e-15 CCDS10375.1 NR2F2 gene_id:7026|Hs108|chr15 ( 414) 377 81.6 2e-15 CCDS6743.1 NR4A3 gene_id:8013|Hs108|chr9 ( 626) 374 81.1 4.3e-15 CCDS6742.1 NR4A3 gene_id:8013|Hs108|chr9 ( 637) 374 81.1 4.3e-15 CCDS35137.1 NR6A1 gene_id:2649|Hs108|chr9 ( 480) 372 80.7 4.4e-15 CCDS4804.1 PPARD gene_id:5467|Hs108|chr6 ( 361) 369 80.1 5.2e-15 CCDS54994.1 PPARD gene_id:5467|Hs108|chr6 ( 402) 369 80.1 5.7e-15 CCDS42316.1 THRA gene_id:7067|Hs108|chr17 ( 410) 369 80.1 5.7e-15 CCDS4803.1 PPARD gene_id:5467|Hs108|chr6 ( 441) 369 80.1 6.1e-15 CCDS58546.1 THRA gene_id:7067|Hs108|chr17 ( 451) 369 80.1 6.2e-15 CCDS11360.1 THRA gene_id:7067|Hs108|chr17 ( 490) 369 80.1 6.7e-15 CCDS2641.1 THRB gene_id:7068|Hs108|chr3 ( 461) 364 79.2 1.2e-14 CCDS6744.1 NR4A3 gene_id:8013|Hs108|chr9 ( 443) 363 79.0 1.3e-14 CCDS12352.1 NR2F6 gene_id:2063|Hs108|chr19 ( 404) 362 78.8 1.4e-14 CCDS5063.1 NR2E1 gene_id:7101|Hs108|chr6 ( 385) 353 77.1 4.4e-14 CCDS69165.1 NR2E1 gene_id:7101|Hs108|chr6 ( 422) 353 77.1 4.8e-14 CCDS2201.1 NR4A2 gene_id:4929|Hs108|chr2 ( 598) 351 76.8 8.3e-14 CCDS9850.2 ESRRB gene_id:2103|Hs108|chr14 ( 508) 349 76.4 9.4e-14 >>CCDS10179.1 RORA gene_id:6095|Hs108|chr15 (556 aa) initn: 3807 init1: 3807 opt: 3807 Z-score: 3888.2 bits: 729.3 E(32554): 3e-210 Smith-Waterman score: 3807; 100.0% identity (100.0% similar) in 556 aa overlap (1-556:1-556) 10 20 30 40 50 60 pF1KB5 MNEGAPGDSDLETEARVPWSIMGHCLRTGQARMSATPTPAGEGARRDELFGILQILHQCI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MNEGAPGDSDLETEARVPWSIMGHCLRTGQARMSATPTPAGEGARRDELFGILQILHQCI 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 LSSGDAFVLTGVCCSWRQNGKPPYSQKEDKEVQTGYMNAQIEIIPCKICGDKSSGIHYGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LSSGDAFVLTGVCCSWRQNGKPPYSQKEDKEVQTGYMNAQIEIIPCKICGDKSSGIHYGV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 ITCEGCKGFFRRSQQSNATYSCPRQKNCLIDRTSRNRCQHCRLQKCLAVGMSRDAVKFGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 ITCEGCKGFFRRSQQSNATYSCPRQKNCLIDRTSRNRCQHCRLQKCLAVGMSRDAVKFGR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 MSKKQRDSLYAEVQKHRMQQQQRDHQQQPGEAEPLTPTYNISANGLTELHDDLSNYIDGH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MSKKQRDSLYAEVQKHRMQQQQRDHQQQPGEAEPLTPTYNISANGLTELHDDLSNYIDGH 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 TPEGSKADSAVSSFYLDIQPSPDQSGLDINGIKPEPICDYTPASGFFPYCSFTNGETSPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 TPEGSKADSAVSSFYLDIQPSPDQSGLDINGIKPEPICDYTPASGFFPYCSFTNGETSPT 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 VSMAELEHLAQNISKSHLETCQYLREELQQITWQTFLQEEIENYQNKQREVMWQLCAIKI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 VSMAELEHLAQNISKSHLETCQYLREELQQITWQTFLQEEIENYQNKQREVMWQLCAIKI 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 TEAIQYVVEFAKRIDGFMELCQNDQIVLLKAGSLEVVFIRMCRAFDSQNNTVYFDGKYAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 TEAIQYVVEFAKRIDGFMELCQNDQIVLLKAGSLEVVFIRMCRAFDSQNNTVYFDGKYAS 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB5 PDVFKSLGCEDFISFVFEFGKSLCSMHLTEDEIALFSAFVLMSADRSWLQEKVKIEKLQQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 PDVFKSLGCEDFISFVFEFGKSLCSMHLTEDEIALFSAFVLMSADRSWLQEKVKIEKLQQ 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB5 KIQLALQHVLQKNHREDGILTKLICKVSTLRALCGRHTEKLMAFKAIYPDIVRLHFPPLY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 KIQLALQHVLQKNHREDGILTKLICKVSTLRALCGRHTEKLMAFKAIYPDIVRLHFPPLY 490 500 510 520 530 540 550 pF1KB5 KELFTSEFEPAMQIDG :::::::::::::::: CCDS10 KELFTSEFEPAMQIDG 550 >>CCDS10178.1 RORA gene_id:6095|Hs108|chr15 (548 aa) initn: 3417 init1: 3117 opt: 3384 Z-score: 3456.7 bits: 649.4 E(32554): 3.2e-186 Smith-Waterman score: 3384; 91.5% identity (94.1% similar) in 556 aa overlap (1-556:1-548) 10 20 30 40 50 60 pF1KB5 MNEGAPGDSDLETEARVPWSIMGHCLRTGQARMSATPTPAGEGARRDELFGILQILHQCI ::::::::::::::::::::::::::::::::::::::::::::: . . :. : . CCDS10 MNEGAPGDSDLETEARVPWSIMGHCLRTGQARMSATPTPAGEGARSSSTCSSLSRL---F 10 20 30 40 50 70 80 90 100 110 120 pF1KB5 LSSGDAFVLTGVCCSWRQNGKPPYSQKEDKEVQTGYMNAQIEIIPCKICGDKSSGIHYGV :. . . :. . : . .: . . .:::::::::::::::::::::: CCDS10 WSQLEHINWDGATAKNFINLREFFS-----FLLPALRKAQIEIIPCKICGDKSSGIHYGV 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB5 ITCEGCKGFFRRSQQSNATYSCPRQKNCLIDRTSRNRCQHCRLQKCLAVGMSRDAVKFGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 ITCEGCKGFFRRSQQSNATYSCPRQKNCLIDRTSRNRCQHCRLQKCLAVGMSRDAVKFGR 120 130 140 150 160 170 190 200 210 220 230 240 pF1KB5 MSKKQRDSLYAEVQKHRMQQQQRDHQQQPGEAEPLTPTYNISANGLTELHDDLSNYIDGH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MSKKQRDSLYAEVQKHRMQQQQRDHQQQPGEAEPLTPTYNISANGLTELHDDLSNYIDGH 180 190 200 210 220 230 250 260 270 280 290 300 pF1KB5 TPEGSKADSAVSSFYLDIQPSPDQSGLDINGIKPEPICDYTPASGFFPYCSFTNGETSPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 TPEGSKADSAVSSFYLDIQPSPDQSGLDINGIKPEPICDYTPASGFFPYCSFTNGETSPT 240 250 260 270 280 290 310 320 330 340 350 360 pF1KB5 VSMAELEHLAQNISKSHLETCQYLREELQQITWQTFLQEEIENYQNKQREVMWQLCAIKI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 VSMAELEHLAQNISKSHLETCQYLREELQQITWQTFLQEEIENYQNKQREVMWQLCAIKI 300 310 320 330 340 350 370 380 390 400 410 420 pF1KB5 TEAIQYVVEFAKRIDGFMELCQNDQIVLLKAGSLEVVFIRMCRAFDSQNNTVYFDGKYAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 TEAIQYVVEFAKRIDGFMELCQNDQIVLLKAGSLEVVFIRMCRAFDSQNNTVYFDGKYAS 360 370 380 390 400 410 430 440 450 460 470 480 pF1KB5 PDVFKSLGCEDFISFVFEFGKSLCSMHLTEDEIALFSAFVLMSADRSWLQEKVKIEKLQQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 PDVFKSLGCEDFISFVFEFGKSLCSMHLTEDEIALFSAFVLMSADRSWLQEKVKIEKLQQ 420 430 440 450 460 470 490 500 510 520 530 540 pF1KB5 KIQLALQHVLQKNHREDGILTKLICKVSTLRALCGRHTEKLMAFKAIYPDIVRLHFPPLY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 KIQLALQHVLQKNHREDGILTKLICKVSTLRALCGRHTEKLMAFKAIYPDIVRLHFPPLY 480 490 500 510 520 530 550 pF1KB5 KELFTSEFEPAMQIDG :::::::::::::::: CCDS10 KELFTSEFEPAMQIDG 540 >>CCDS45271.1 RORA gene_id:6095|Hs108|chr15 (468 aa) initn: 3124 init1: 3124 opt: 3124 Z-score: 3192.5 bits: 600.3 E(32554): 1.7e-171 Smith-Waterman score: 3124; 99.8% identity (100.0% similar) in 460 aa overlap (97-556:9-468) 70 80 90 100 110 120 pF1KB5 FVLTGVCCSWRQNGKPPYSQKEDKEVQTGYMNAQIEIIPCKICGDKSSGIHYGVITCEGC :.:::::::::::::::::::::::::::: CCDS45 MMYFVIAAMKAQIEIIPCKICGDKSSGIHYGVITCEGC 10 20 30 130 140 150 160 170 180 pF1KB5 KGFFRRSQQSNATYSCPRQKNCLIDRTSRNRCQHCRLQKCLAVGMSRDAVKFGRMSKKQR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 KGFFRRSQQSNATYSCPRQKNCLIDRTSRNRCQHCRLQKCLAVGMSRDAVKFGRMSKKQR 40 50 60 70 80 90 190 200 210 220 230 240 pF1KB5 DSLYAEVQKHRMQQQQRDHQQQPGEAEPLTPTYNISANGLTELHDDLSNYIDGHTPEGSK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 DSLYAEVQKHRMQQQQRDHQQQPGEAEPLTPTYNISANGLTELHDDLSNYIDGHTPEGSK 100 110 120 130 140 150 250 260 270 280 290 300 pF1KB5 ADSAVSSFYLDIQPSPDQSGLDINGIKPEPICDYTPASGFFPYCSFTNGETSPTVSMAEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 ADSAVSSFYLDIQPSPDQSGLDINGIKPEPICDYTPASGFFPYCSFTNGETSPTVSMAEL 160 170 180 190 200 210 310 320 330 340 350 360 pF1KB5 EHLAQNISKSHLETCQYLREELQQITWQTFLQEEIENYQNKQREVMWQLCAIKITEAIQY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 EHLAQNISKSHLETCQYLREELQQITWQTFLQEEIENYQNKQREVMWQLCAIKITEAIQY 220 230 240 250 260 270 370 380 390 400 410 420 pF1KB5 VVEFAKRIDGFMELCQNDQIVLLKAGSLEVVFIRMCRAFDSQNNTVYFDGKYASPDVFKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 VVEFAKRIDGFMELCQNDQIVLLKAGSLEVVFIRMCRAFDSQNNTVYFDGKYASPDVFKS 280 290 300 310 320 330 430 440 450 460 470 480 pF1KB5 LGCEDFISFVFEFGKSLCSMHLTEDEIALFSAFVLMSADRSWLQEKVKIEKLQQKIQLAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 LGCEDFISFVFEFGKSLCSMHLTEDEIALFSAFVLMSADRSWLQEKVKIEKLQQKIQLAL 340 350 360 370 380 390 490 500 510 520 530 540 pF1KB5 QHVLQKNHREDGILTKLICKVSTLRALCGRHTEKLMAFKAIYPDIVRLHFPPLYKELFTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 QHVLQKNHREDGILTKLICKVSTLRALCGRHTEKLMAFKAIYPDIVRLHFPPLYKELFTS 400 410 420 430 440 450 550 pF1KB5 EFEPAMQIDG :::::::::: CCDS45 EFEPAMQIDG 460 >>CCDS10177.1 RORA gene_id:6095|Hs108|chr15 (523 aa) initn: 3113 init1: 3113 opt: 3113 Z-score: 3180.5 bits: 598.2 E(32554): 7.8e-171 Smith-Waterman score: 3113; 99.8% identity (100.0% similar) in 458 aa overlap (99-556:66-523) 70 80 90 100 110 120 pF1KB5 LTGVCCSWRQNGKPPYSQKEDKEVQTGYMNAQIEIIPCKICGDKSSGIHYGVITCEGCKG .::::::::::::::::::::::::::::: CCDS10 ARKSEPPAPVRRQSYSSTSRGISVTKKTHTSQIEIIPCKICGDKSSGIHYGVITCEGCKG 40 50 60 70 80 90 130 140 150 160 170 180 pF1KB5 FFRRSQQSNATYSCPRQKNCLIDRTSRNRCQHCRLQKCLAVGMSRDAVKFGRMSKKQRDS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 FFRRSQQSNATYSCPRQKNCLIDRTSRNRCQHCRLQKCLAVGMSRDAVKFGRMSKKQRDS 100 110 120 130 140 150 190 200 210 220 230 240 pF1KB5 LYAEVQKHRMQQQQRDHQQQPGEAEPLTPTYNISANGLTELHDDLSNYIDGHTPEGSKAD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LYAEVQKHRMQQQQRDHQQQPGEAEPLTPTYNISANGLTELHDDLSNYIDGHTPEGSKAD 160 170 180 190 200 210 250 260 270 280 290 300 pF1KB5 SAVSSFYLDIQPSPDQSGLDINGIKPEPICDYTPASGFFPYCSFTNGETSPTVSMAELEH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 SAVSSFYLDIQPSPDQSGLDINGIKPEPICDYTPASGFFPYCSFTNGETSPTVSMAELEH 220 230 240 250 260 270 310 320 330 340 350 360 pF1KB5 LAQNISKSHLETCQYLREELQQITWQTFLQEEIENYQNKQREVMWQLCAIKITEAIQYVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LAQNISKSHLETCQYLREELQQITWQTFLQEEIENYQNKQREVMWQLCAIKITEAIQYVV 280 290 300 310 320 330 370 380 390 400 410 420 pF1KB5 EFAKRIDGFMELCQNDQIVLLKAGSLEVVFIRMCRAFDSQNNTVYFDGKYASPDVFKSLG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 EFAKRIDGFMELCQNDQIVLLKAGSLEVVFIRMCRAFDSQNNTVYFDGKYASPDVFKSLG 340 350 360 370 380 390 430 440 450 460 470 480 pF1KB5 CEDFISFVFEFGKSLCSMHLTEDEIALFSAFVLMSADRSWLQEKVKIEKLQQKIQLALQH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 CEDFISFVFEFGKSLCSMHLTEDEIALFSAFVLMSADRSWLQEKVKIEKLQQKIQLALQH 400 410 420 430 440 450 490 500 510 520 530 540 pF1KB5 VLQKNHREDGILTKLICKVSTLRALCGRHTEKLMAFKAIYPDIVRLHFPPLYKELFTSEF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 VLQKNHREDGILTKLICKVSTLRALCGRHTEKLMAFKAIYPDIVRLHFPPLYKELFTSEF 460 470 480 490 500 510 550 pF1KB5 EPAMQIDG :::::::: CCDS10 EPAMQIDG 520 >>CCDS6646.1 RORB gene_id:6096|Hs108|chr9 (459 aa) initn: 1829 init1: 1137 opt: 1967 Z-score: 2012.0 bits: 381.8 E(32554): 9.5e-106 Smith-Waterman score: 1967; 63.9% identity (84.9% similar) in 457 aa overlap (97-547:1-453) 70 80 90 100 110 120 pF1KB5 FVLTGVCCSWRQNGKPPYSQKEDKEVQTGYMNAQIEIIPCKICGDKSSGIHYGVITCEGC : ::::.::::::::::::::::::::::: CCDS66 MRAQIEVIPCKICGDKSSGIHYGVITCEGC 10 20 30 130 140 150 160 170 180 pF1KB5 KGFFRRSQQSNATYSCPRQKNCLIDRTSRNRCQHCRLQKCLAVGMSRDAVKFGRMSKKQR :::::::::.::.::::::.:::::::.::::::::::::::.::::::::::::::::: CCDS66 KGFFRRSQQNNASYSCPRQRNCLIDRTNRNRCQHCRLQKCLALGMSRDAVKFGRMSKKQR 40 50 60 70 80 90 190 200 210 220 230 240 pF1KB5 DSLYAEVQKHRMQQQQRDHQQQPGEAEPLTPTYNIS-ANGLTELHDDLSN-YIDGHTPEG ::::::::::. :. :...::: :::: :. .:. : .:::..:... :. : .::. . CCDS66 DSLYAEVQKHQ-QRLQEQRQQQSGEAEALARVYSSSISNGLSNLNNETSGTYANGHVIDL 100 110 120 130 140 250 260 270 280 290 300 pF1KB5 SKADSAVSSFYLDI-QPSPDQSGLDINGIKP---EPICDYTPASGFFPYCSFTNGETSPT :... . .: ::::::::::..::: ::: : : . ..: : ::.::. .: CCDS66 PKSEGY---YNVDSGQPSPDQSGLDMTGIKQIKQEPIYDLTSVPNLFTYSSFNNGQLAPG 150 160 170 180 190 200 310 320 330 340 350 360 pF1KB5 VSMAELEHLAQNISKSHLETCQYLREELQQITWQTFLQEEIENYQNKQREVMWQLCAIKI ..:.:....:::: ::::::::: :::.:..::: :::. ::.:.::..:: :::.: CCDS66 ITMTEIDRIAQNIIKSHLETCQYTMEELHQLAWQTHTYEEIKAYQSKSREALWQQCAIQI 210 220 230 240 250 260 370 380 390 400 410 420 pF1KB5 TEAIQYVVEFAKRIDGFMELCQNDQIVLLKAGSLEVVFIRMCRAFDSQNNTVYFDGKYAS :.:::::::::::: :::::::::::.:::.: ::::..::::::. :::: :.:::.. CCDS66 THAIQYVVEFAKRITGFMELCQNDQILLLKSGCLEVVLVRMCRAFNPLNNTVLFEGKYGG 270 280 290 300 310 320 430 440 450 460 470 480 pF1KB5 PDVFKSLGCEDFISFVFEFGKSLCSMHLTEDEIALFSAFVLMSADRSWLQEKVKIEKLQQ ..::.:: .:... .:.:.:.:::..:::.::::::. ::.: ::.:: : :..:::. CCDS66 MQMFKALGSDDLVNEAFDFAKNLCSLQLTEEEIALFSSAVLISPDRAWLIEPRKVQKLQE 330 340 350 360 370 380 490 500 510 520 530 540 pF1KB5 KIQLALQHVLQKNHREDGILTKLICKVSTLRALCGRHTEKLMAFKAIYPDIVRLHFPPLY :: .:::::.:::: .: :.::: :. :. :.:. : :::..:: .:.:: ::::: CCDS66 KIYFALQHVIQKNHLDDETLAKLIAKIPTITAVCNLHGEKLQVFKQSHPEIVNTLFPPLY 390 400 410 420 430 440 550 pF1KB5 KELFTSEFEPAMQIDG ::::. . CCDS66 KELFNPDCATGCK 450 >>CCDS30856.1 RORC gene_id:6097|Hs108|chr1 (497 aa) initn: 1630 init1: 785 opt: 950 Z-score: 973.8 bits: 189.8 E(32554): 6.4e-48 Smith-Waterman score: 1535; 49.6% identity (72.8% similar) in 492 aa overlap (97-549:1-490) 70 80 90 100 110 120 pF1KB5 FVLTGVCCSWRQNGKPPYSQKEDKEVQTGYMNAQIEIIPCKICGDKSSGIHYGVITCEGC : .:::.::::::::::::::::::::::: CCDS30 MRTQIEVIPCKICGDKSSGIHYGVITCEGC 10 20 30 130 140 150 160 170 180 pF1KB5 KGFFRRSQQSNATYSCPRQKNCLIDRTSRNRCQHCRLQKCLAVGMSRDAVKFGRMSKKQR ::::::::. ::.::: ::.:: :::::::::::::::::::.::::::::::::::::: CCDS30 KGFFRRSQRCNAAYSCTRQQNCPIDRTSRNRCQHCRLQKCLALGMSRDAVKFGRMSKKQR 40 50 60 70 80 90 190 200 210 220 pF1KB5 DSLYAEVQKHRMQQQQRDHQ-------------------------QQPGEAEPLTPTYNI :::.:::::. .:.::.... : : . : : . CCDS30 DSLHAEVQKQLQQRQQQQQEPVVKTPPAGAQGADTLTYTLGLPDGQLPLGSSPDLPEASA 100 110 120 130 140 150 230 240 250 260 pF1KB5 SANGLTELHDDLSNY--------IDG------HTPEGSKADSAVSSFYLDIQPSPDQSGL :: . . .: ..: ..:: .::.. : . : .::. :: CCDS30 CPPGLLKASGSGPSYSNNLAKAGLNGASCHLEYSPERGKAEGRESFYSTGSQLTPDRCGL 160 170 180 190 200 210 270 280 290 300 310 320 pF1KB5 DINGIKPEPICDYTPASGFFPYCSFTNGETSPTVSMAELEHLAQNISKSHLETCQYLREE .. . . . . . :: . .: .:..:.:::.:.. ::. :::: :. CCDS30 RFEEHRHPGLGELGQGPDSYGSPSFRSTPEAPYASLTEIEHLVQSVCKSYRETCQLRLED 220 230 240 250 260 270 330 340 350 360 370 380 pF1KB5 LQQITWQTFLQEEIENYQNKQREVMWQLCAIKITEAIQYVVEFAKRIDGFMELCQNDQIV : . . : .::. .:: :. ::. :: ..:::::::::::::..:::::::::::: CCDS30 LLRQRSNIFSREEVTGYQRKSMWEMWERCAHHLTEAIQYVVEFAKRLSGFMELCQNDQIV 280 290 300 310 320 330 390 400 410 420 430 440 pF1KB5 LLKAGSLEVVFIRMCRAFDSQNNTVYFDGKYASPDVFKSLGCEDFISFVFEFGKSLCSMH :::::..:::..:::::....: ::.:.:::.. ..:..::: ..:: .:.:..:: ..: CCDS30 LLKAGAMEVVLVRMCRAYNADNRTVFFEGKYGGMELFRALGCSELISSIFDFSHSLSALH 340 350 360 370 380 390 450 460 470 480 490 500 pF1KB5 LTEDEIALFSAFVLMSADRSWLQEKVKIEKLQQKIQLALQHVLQKNHREDGILTKLICKV ..::::::..:.::..: : :::: :.:.:: ...::..: : :.::.. ::.:: : CCDS30 FSEDEIALYTALVLINAHRPGLQEKRKVEQLQYNLELAFHHHLCKTHRQS-ILAKLPPK- 400 410 420 430 440 510 520 530 540 550 pF1KB5 STLRALCGRHTEKLMAFKAIYPDIVRLHFPPLYKELFTSEFEPAMQIDG . ::.::..:.:.:. :. ..: .:. :::::::::..: : CCDS30 GKLRSLCSQHVERLQIFQHLHPIVVQAAFPPLYKELFSTETESPVGLSK 450 460 470 480 490 >>CCDS1004.1 RORC gene_id:6097|Hs108|chr1 (518 aa) initn: 1625 init1: 785 opt: 950 Z-score: 973.5 bits: 189.8 E(32554): 6.7e-48 Smith-Waterman score: 1532; 48.1% identity (72.3% similar) in 509 aa overlap (82-549:5-511) 60 70 80 90 100 pF1KB5 ILQILHQCILSSGDAFVLTGVCCSWRQNGKPPYSQKEDKEVQTGY--MNAQIEIIPCKIC : ... ..:. .. ..:::.:::::: CCDS10 MDRAPQRQHRASRELLAAKKTHTSQIEVIPCKIC 10 20 30 110 120 130 140 150 160 pF1KB5 GDKSSGIHYGVITCEGCKGFFRRSQQSNATYSCPRQKNCLIDRTSRNRCQHCRLQKCLAV :::::::::::::::::::::::::. ::.::: ::.:: :::::::::::::::::::. CCDS10 GDKSSGIHYGVITCEGCKGFFRRSQRCNAAYSCTRQQNCPIDRTSRNRCQHCRLQKCLAL 40 50 60 70 80 90 170 180 190 200 pF1KB5 GMSRDAVKFGRMSKKQRDSLYAEVQKHRMQQQQRDHQ----------------------- ::::::::::::::::::::.:::::. .:.::.... CCDS10 GMSRDAVKFGRMSKKQRDSLHAEVQKQLQQRQQQQQEPVVKTPPAGAQGADTLTYTLGLP 100 110 120 130 140 150 210 220 230 240 250 pF1KB5 --QQPGEAEPLTPTYNISANGLTELHDDLSNY--------IDG------HTPEGSKADSA : : . : : . :: . . .: ..: ..:: .::.. CCDS10 DGQLPLGSSPDLPEASACPPGLLKASGSGPSYSNNLAKAGLNGASCHLEYSPERGKAEGR 160 170 180 190 200 210 260 270 280 290 300 310 pF1KB5 VSSFYLDIQPSPDQSGLDINGIKPEPICDYTPASGFFPYCSFTNGETSPTVSMAELEHLA : . : .::. :: .. . . . . . :: . .: .:..:.:::. CCDS10 ESFYSTGSQLTPDRCGLRFEEHRHPGLGELGQGPDSYGSPSFRSTPEAPYASLTEIEHLV 220 230 240 250 260 270 320 330 340 350 360 370 pF1KB5 QNISKSHLETCQYLREELQQITWQTFLQEEIENYQNKQREVMWQLCAIKITEAIQYVVEF :.. ::. :::: :.: . . : .::. .:: :. ::. :: ..:::::::::: CCDS10 QSVCKSYRETCQLRLEDLLRQRSNIFSREEVTGYQRKSMWEMWERCAHHLTEAIQYVVEF 280 290 300 310 320 330 380 390 400 410 420 430 pF1KB5 AKRIDGFMELCQNDQIVLLKAGSLEVVFIRMCRAFDSQNNTVYFDGKYASPDVFKSLGCE :::..:::::::::::::::::..:::..:::::....: ::.:.:::.. ..:..::: CCDS10 AKRLSGFMELCQNDQIVLLKAGAMEVVLVRMCRAYNADNRTVFFEGKYGGMELFRALGCS 340 350 360 370 380 390 440 450 460 470 480 490 pF1KB5 DFISFVFEFGKSLCSMHLTEDEIALFSAFVLMSADRSWLQEKVKIEKLQQKIQLALQHVL ..:: .:.:..:: ..:..::::::..:.::..: : :::: :.:.:: ...::..: : CCDS10 ELISSIFDFSHSLSALHFSEDEIALYTALVLINAHRPGLQEKRKVEQLQYNLELAFHHHL 400 410 420 430 440 450 500 510 520 530 540 550 pF1KB5 QKNHREDGILTKLICKVSTLRALCGRHTEKLMAFKAIYPDIVRLHFPPLYKELFTSEFEP :.::.. ::.:: : . ::.::..:.:.:. :. ..: .:. :::::::::..: : CCDS10 CKTHRQS-ILAKLPPK-GKLRSLCSQHVERLQIFQHLHPIVVQAAFPPLYKELFSTETES 460 470 480 490 500 510 pF1KB5 AMQIDG CCDS10 PVGLSK >>CCDS11361.1 NR1D1 gene_id:9572|Hs108|chr17 (614 aa) initn: 650 init1: 265 opt: 438 Z-score: 449.9 bits: 93.2 E(32554): 9.7e-19 Smith-Waterman score: 770; 32.6% identity (60.7% similar) in 524 aa overlap (79-525:96-610) 50 60 70 80 90 100 pF1KB5 LFGILQILHQCILSSGDAFVLTGVCCSWRQNGKPPYSQK---EDK-EVQTGYMNAQIE-- ::.:: : . ::. .:. . ...: CCDS11 RSFGSIPPSLSDDGSPSSSSSSSSSSSSFYNGSPPGSLQVAMEDSSRVSPSKSTSNITKL 70 80 90 100 110 120 110 120 130 140 150 pF1KB5 ---IIPCKICGDKSSGIHYGVITCEGCKGFFRRSQQSNATYS-CPRQKNCLIDRTSRNRC .. ::.::: .::.:::: .::::::::::: :.: :. : ...:: : : .:::: CCDS11 NGMVLLCKVCGDVASGFHYGVHACEGCKGFFRRSIQQNIQYKRCLKNENCSIVRINRNRC 130 140 150 160 170 180 160 170 180 190 200 pF1KB5 QHCRLQKCLAVGMSRDAVKFGRMSKKQRDSLYAEVQK-HRMQQQQRDHQ--------QQP :.::..:::.::::::::.:::. :.... . ::.:. . ..: . : :.: CCDS11 QQCRFKKCLSVGMSRDAVRFGRIPKREKQRMLAEMQSAMNLANNQLSSQCPLETSPTQHP 190 200 210 220 230 240 210 220 230 pF1KB5 -----GEAEP-----------------LTPTYNISANGLTE--------LHDDLSNYID- : . : ::: . : . .: : .. .: CCDS11 TPGPMGPSPPPAPVPSPLVGFSQFPQQLTPPRSPSPEPTVEDVISQVARAHREIFTYAHD 250 260 270 280 290 300 240 250 260 270 pF1KB5 --GHTPEGSKADSAVSS------FYLDIQ---PSPDQSGL--------DINGIKPEPICD : .: . .:. : .: . : :.:.... .::.. : . CCDS11 KLGSSPGNFNANHASGSPPATTPHRWENQGCPPAPNDNNTLAAQRHNEALNGLRQAP-SS 310 320 330 340 350 360 280 290 300 310 320 330 pF1KB5 YTPASGFFPY---C--SFTNGET-SPTVSMAELEHLAQNISKSHLETCQYLREELQQITW : :. : : : .::. :: .: : : : . .. ... CCDS11 YPPTWPPGPAHHSCHQSNSNGHRLCPTHVYAAPEGKAPANSPRQGNS--------KNVLL 370 380 390 400 410 340 350 360 370 380 390 pF1KB5 QTFLQEEIENYQNKQREVMWQLCAIKITEAIQYVVEFAKRIDGFMELCQNDQIVLLKAGS .. .. ... . .:. ....: :.. ::::::.: :: .: :.::..:::::. CCDS11 ACPMNMYPHGRSGRTVQEIWEDFSMSFTPAVREVVEFAKHIPGFRDLSQHDQVTLLKAGT 420 430 440 450 460 470 400 410 420 430 440 450 pF1KB5 LEVVFIRMCRAFDSQNNTVYFDGKYA-SPDVFKSLGCEDFISFVFEFGKSLCSMHLTEDE .::...:. :. ...::.: .. . : . . ..: :..: .:.:...: :. :::.: CCDS11 FEVLMVRFASLFNVKDQTVMFLSRTTYSLQELGAMGMGDLLSAMFDFSEKLNSLALTEEE 480 490 500 510 520 530 460 470 480 490 500 510 pF1KB5 IALFSAFVLMSADRSWLQEKVKIEKLQQKIQLALQHVLQKNHR-EDGILTKLICKVSTLR ..::.: ::.::::: .......:.::. . ::. .. ::. : . .:::. :. :: CCDS11 LGLFTAVVLVSADRSGMENSASVEQLQETLLRALRALVLKNRPLETSRFTKLLLKLPDLR 540 550 560 570 580 590 520 530 540 550 pF1KB5 ALCGRHTEKLMAFKAIYPDIVRLHFPPLYKELFTSEFEPAMQIDG .: . :.:::..:. CCDS11 TLNNMHSEKLLSFRVDAQ 600 610 >>CCDS33718.1 NR1D2 gene_id:9975|Hs108|chr3 (579 aa) initn: 544 init1: 248 opt: 428 Z-score: 440.1 bits: 91.3 E(32554): 3.4e-18 Smith-Waterman score: 823; 34.0% identity (63.2% similar) in 486 aa overlap (103-529:100-579) 80 90 100 110 120 130 pF1KB5 CCSWRQNGKPPYSQKEDKEVQTGYMNAQIEIIPCKICGDKSSGIHYGVITCEGCKGFFRR .. ::.::: .::.:::: .:::::::::: CCDS33 DRIDCSMKTSKSSAPGMTKSHSGVTKFSGMVLLCKVCGDVASGFHYGVHACEGCKGFFRR 70 80 90 100 110 120 140 150 160 170 180 190 pF1KB5 SQQSNATYS-CPRQKNCLIDRTSRNRCQHCRLQKCLAVGMSRDAVKFGRMSKKQRDSLYA : :.: :. : ...:: : : .:::::.::..:::.::::::::.:::. :.... . CCDS33 SIQQNIQYKKCLKNENCSIMRMNRNRCQQCRFKKCLSVGMSRDAVRFGRIPKREKQRMLI 130 140 150 160 170 180 200 210 220 pF1KB5 EVQ---KHRMQQQ-----QRD----HQQQ---PGEAE----PLTPTYNISANG------- :.: : :..: : : :..: :.. . : ::.... CCDS33 EMQSAMKTMMNSQFSGHLQNDTLVEHHEQTALPAQEQLRPKPQLEQENIKSSSPPSSDFA 190 200 210 220 230 240 230 240 250 260 pF1KB5 -------LTELHDDL--------SNYIDGHTPE-GSKADSAVSSFYLDIQPSPD------ .:. : : : .. :. : . . . .. :. . . CCDS33 KEEVIGMVTRAHKDTFMYNQEQQENSAESMQPQRGERIPKNMEQYNLNHDHCGNGLSSHF 250 260 270 280 290 300 270 280 290 300 310 pF1KB5 ---QSGLDING-IKPEPICDYTPASGFF---PYC-SFTNGETSPTVSMAELEHLAQNISK .: .:: .: . : : . .. .: .:.:. :. . . . .. ..:: .: CCDS33 PCSESQQHLNGQFKGRNIMHYPNGHAICIANGHCMNFSNAYTQRVCDRVPIDGFSQNENK 310 320 330 340 350 360 320 330 340 350 360 370 pF1KB5 SHLETCQYLREELQQITWQTFLQEEIENYQNKQREVMWQLCAIKITEAIQYVVEFAKRID . .:: . .. ... .:. . .:. ....: :.. :::::::: CCDS33 N-----SYLCNTGGRMHLVCPMSKSPYVDPHKSGHEIWEEFSMSFTPAVKEVVEFAKRIP 370 380 390 400 410 420 380 390 400 410 420 430 pF1KB5 GFMELCQNDQIVLLKAGSLEVVFIRMCRAFDSQNNTVYF-DGKYASPDVFKSLGCEDFIS :: .: :.::. :::::..::...:. ::... :: : .:: : : ..:.: :... CCDS33 GFRDLSQHDQVNLLKAGTFEVLMVRFASLFDAKERTVTFLSGKKYSVDDLHSMGAGDLLN 430 440 450 460 470 480 440 450 460 470 480 490 pF1KB5 FVFEFGKSLCSMHLTEDEIALFSAFVLMSADRSWLQEKVKIEKLQQKIQLALQHVLQKNH .:::...: ...:...:..::.: ::.::::: ... ..: ::. . ::. ...::: CCDS33 SMFEFSEKLNALQLSDEEMSLFTAVVLVSADRSGIENVNSVEALQETLIRALRTLIMKNH 490 500 510 520 530 540 500 510 520 530 540 550 pF1KB5 -REDGILTKLICKVSTLRALCGRHTEKLMAFKAIYPDIVRLHFPPLYKELFTSEFEPAMQ : .:.:::. :. ::.: . :.:.:.::: ..: CCDS33 PNEASIFTKLLLKLPDLRSLNNMHSEELLAFK-VHP 550 560 570 pF1KB5 IDG >>CCDS6856.1 NR5A1 gene_id:2516|Hs108|chr9 (461 aa) initn: 352 init1: 352 opt: 419 Z-score: 432.4 bits: 89.6 E(32554): 9.1e-18 Smith-Waterman score: 440; 26.8% identity (53.8% similar) in 444 aa overlap (106-521:13-437) 80 90 100 110 120 130 pF1KB5 WRQNGKPPYSQKEDKEVQTGYMNAQIEIIPCKICGDKSSGIHYGVITCEGCKGFFRRSQQ : .:::: :: :::..:::.:::::.:. : CCDS68 MDYSYDEDLDELCPVCGDKVSGYHYGLLTCESCKGFFKRTVQ 10 20 30 40 140 150 160 170 180 190 pF1KB5 SNATYSCPRQKNCLIDRTSRNRCQHCRLQKCLAVGMSRDAVKFGRMSKKQRDSLYAEVQK .: :.: ....: ::.:.:.:: ::.::::.::: .::. :: . :... .. CCDS68 NNKHYTCTESQSCKIDKTQRKRCPFCRFQKCLTVGMRLEAVRADRM-RGGRNKFGPMYKR 50 60 70 80 90 100 200 210 220 230 240 pF1KB5 HRMQQQQRDHQQQ---------PGEAEPLTPTYNISANGLTELHDDLSNYIDGHTPEGSK : .::. : . : . : : . :: . . . : : CCDS68 DRALKQQKKAQIRANGFKLETGPPMGVPPPPPPAPDYVLPPSLHGPEPKGLAAGPPAGPL 110 120 130 140 150 160 250 260 270 280 290 pF1KB5 ADSAVSSFYLDIQPS---------PDQSGLDINGIKPEPICDYTPASGFFPYCSFTNGET .: .. .. . . . : : :.. ::: .: . .:: : CCDS68 GDFGAPALPMAVPGAHGPLAGYLYPAFPGRAIKSEYPEPYA--SPPQPGLPY-----GYP 170 180 190 200 210 300 310 320 330 340 350 pF1KB5 SPTVSMAELEHLAQNISKSHLETCQYLREELQQITWQTF--LQEEIENYQNKQREVMWQL : . . :. . :. : :. . .:. . . ::: .. . : .. : CCDS68 EPFSG-------GPNVPELILQLLQ-LEPDEDQVRARILGCLQEPTKSRPD-QPAAFGLL 220 230 240 250 260 360 370 380 390 400 410 pF1KB5 CAIKITEAIQYVVEFAKRIDGFMELCQNDQIVLLKAGSLEV-VFIRMCRAFD--SQNNTV : . :. .:..:.: : :: ::..::. :. :: .. : . .... . CCDS68 CRMADQTFIS-IVDWARRCMVFKELEVADQMTLLQNCWSELLVFDHIYRQVQHGKEGSIL 270 280 290 300 310 320 420 430 440 450 460 pF1KB5 YFDGKYASPDVFKSLGCEDFISFVF---EFGKSLCSMHLTEDEIALFSAFVLMSADRSWL :. . . . . . :.:. :. .: ...: ..:.. .. ..:.: : ..: CCDS68 LVTGQEVELTTVATQAGSLLHSLVLRAQELVLQLLALQLDRQEFVCLKFIILFSLDLKFL 330 340 350 360 370 380 470 480 490 500 510 520 pF1KB5 QEKVKIEKLQQKIQLAL-QHVL-QKNHREDGILTKLICKVSTLRALCGRHTEKLMAFKAI .... .. :.: . :: ...: . : : . :.: : .::: . : : CCDS68 NNHILVKDAQEKANAALLDYTLCHYPHCGDKFQQLLLCLVE-VRALSMQAKEYLYHKHLG 390 400 410 420 430 440 530 540 550 pF1KB5 YPDIVRLHFPPLYKELFTSEFEPAMQIDG CCDS68 NEMPRNNLLIEMLQAKQT 450 460 556 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 17:38:42 2016 done: Tue Nov 8 17:38:42 2016 Total Scan time: 2.890 Total Display time: 0.100 Function used was FASTA [36.3.4 Apr, 2011]