FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7740, 482 aa 1>>>pF1KB7740 482 - 482 aa - 482 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.8031+/-0.00102; mu= 16.6974+/- 0.061 mean_var=94.7120+/-18.641, 0's: 0 Z-trim(106.5): 125 B-trim: 38 in 1/52 Lambda= 0.131787 statistics sampled from 8903 (9029) to 8903 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.646), E-opt: 0.2 (0.277), width: 16 Scan time: 2.880 The best scores are: opt bits E(32554) CCDS55875.1 NR1H4 gene_id:9971|Hs108|chr12 ( 482) 3269 632.0 4.1e-181 CCDS55876.1 NR1H4 gene_id:9971|Hs108|chr12 ( 486) 3251 628.6 4.4e-180 CCDS9078.1 NR1H4 gene_id:9971|Hs108|chr12 ( 472) 3009 582.6 3.1e-166 CCDS55873.1 NR1H4 gene_id:9971|Hs108|chr12 ( 476) 2991 579.2 3.3e-165 CCDS55874.1 NR1H4 gene_id:9971|Hs108|chr12 ( 425) 1810 354.6 1.2e-97 CCDS73285.1 NR1H3 gene_id:10062|Hs108|chr11 ( 453) 924 186.2 6.4e-47 CCDS44585.1 NR1H3 gene_id:10062|Hs108|chr11 ( 402) 915 184.4 1.9e-46 CCDS7929.1 NR1H3 gene_id:10062|Hs108|chr11 ( 447) 915 184.5 2.1e-46 CCDS54627.1 NR1I2 gene_id:8856|Hs108|chr3 ( 397) 571 119.0 9.3e-27 CCDS42316.1 THRA gene_id:7067|Hs108|chr17 ( 410) 560 116.9 4.1e-26 CCDS2641.1 THRB gene_id:7068|Hs108|chr3 ( 461) 557 116.4 6.6e-26 CCDS58546.1 THRA gene_id:7067|Hs108|chr17 ( 451) 534 112.0 1.3e-24 CCDS11360.1 THRA gene_id:7067|Hs108|chr17 ( 490) 530 111.3 2.4e-24 CCDS44584.1 NR1H3 gene_id:10062|Hs108|chr11 ( 387) 496 104.7 1.8e-22 CCDS1228.1 NR1I3 gene_id:9970|Hs108|chr1 ( 348) 476 100.9 2.3e-21 CCDS41430.1 NR1I3 gene_id:9970|Hs108|chr1 ( 352) 476 100.9 2.3e-21 CCDS42593.1 NR1H2 gene_id:7376|Hs108|chr19 ( 460) 468 99.5 8.2e-21 CCDS41429.1 NR1I3 gene_id:9970|Hs108|chr1 ( 357) 456 97.1 3.3e-20 CCDS58673.1 NR1H2 gene_id:7376|Hs108|chr19 ( 363) 439 93.9 3.1e-19 CCDS44260.1 NR1I3 gene_id:9970|Hs108|chr1 ( 339) 429 92.0 1.1e-18 CCDS44261.1 NR1I3 gene_id:9970|Hs108|chr1 ( 340) 409 88.2 1.5e-17 CCDS5234.1 ESR1 gene_id:2099|Hs108|chr6 ( 595) 384 83.6 6.4e-16 CCDS2621.1 NR2C2 gene_id:7182|Hs108|chr3 ( 615) 373 81.5 2.8e-15 CCDS74905.1 NR2C2 gene_id:7182|Hs108|chr3 ( 596) 370 80.9 4e-15 CCDS8757.1 VDR gene_id:7421|Hs108|chr12 ( 427) 353 77.6 2.9e-14 CCDS41821.1 NR2C1 gene_id:7181|Hs108|chr12 ( 467) 353 77.6 3.2e-14 CCDS55820.1 VDR gene_id:7421|Hs108|chr12 ( 477) 353 77.6 3.2e-14 CCDS44953.1 NR2C1 gene_id:7181|Hs108|chr12 ( 483) 353 77.6 3.2e-14 CCDS9051.1 NR2C1 gene_id:7181|Hs108|chr12 ( 603) 353 77.7 3.8e-14 CCDS43136.1 NR1I2 gene_id:8856|Hs108|chr3 ( 434) 350 77.0 4.4e-14 CCDS2995.1 NR1I2 gene_id:8856|Hs108|chr3 ( 473) 350 77.1 4.7e-14 CCDS11361.1 NR1D1 gene_id:9572|Hs108|chr17 ( 614) 348 76.8 7.5e-14 CCDS2642.1 RARB gene_id:5915|Hs108|chr3 ( 448) 344 75.9 1e-13 CCDS8850.1 RARG gene_id:5916|Hs108|chr12 ( 454) 343 75.7 1.2e-13 CCDS58236.1 RARG gene_id:5916|Hs108|chr12 ( 382) 339 74.9 1.7e-13 CCDS41790.1 RARG gene_id:5916|Hs108|chr12 ( 443) 339 74.9 1.9e-13 CCDS8818.1 NR4A1 gene_id:3164|Hs108|chr12 ( 598) 338 74.9 2.7e-13 CCDS55828.1 NR4A1 gene_id:3164|Hs108|chr12 ( 611) 338 74.9 2.8e-13 CCDS73471.1 NR4A1 gene_id:3164|Hs108|chr12 ( 652) 338 74.9 2.9e-13 CCDS35172.1 RXRA gene_id:6256|Hs108|chr9 ( 462) 336 74.4 2.9e-13 CCDS3772.1 NR3C2 gene_id:4306|Hs108|chr4 ( 984) 339 75.2 3.5e-13 CCDS13331.1 HNF4A gene_id:3172|Hs108|chr20 ( 417) 333 73.8 4e-13 CCDS53405.1 NR1I3 gene_id:9970|Hs108|chr1 ( 296) 331 73.3 4e-13 CCDS44262.1 NR1I3 gene_id:9970|Hs108|chr1 ( 309) 331 73.3 4.2e-13 CCDS41428.1 NR1I3 gene_id:9970|Hs108|chr1 ( 314) 331 73.3 4.2e-13 CCDS46605.1 HNF4A gene_id:3172|Hs108|chr20 ( 464) 333 73.8 4.4e-13 CCDS68131.1 HNF4A gene_id:3172|Hs108|chr20 ( 395) 332 73.6 4.4e-13 CCDS13330.1 HNF4A gene_id:3172|Hs108|chr20 ( 474) 333 73.8 4.4e-13 CCDS46604.1 HNF4A gene_id:3172|Hs108|chr20 ( 442) 332 73.6 4.8e-13 CCDS42876.1 HNF4A gene_id:3172|Hs108|chr20 ( 452) 332 73.6 4.9e-13 >>CCDS55875.1 NR1H4 gene_id:9971|Hs108|chr12 (482 aa) initn: 3269 init1: 3269 opt: 3269 Z-score: 3365.0 bits: 632.0 E(32554): 4.1e-181 Smith-Waterman score: 3269; 100.0% identity (100.0% similar) in 482 aa overlap (1-482:1-482) 10 20 30 40 50 60 pF1KB7 MVMQFQGLENPIQISPHCSCTPSGFFMEMMSMKPAKGVLTEQVAGPLGQNLEVEPYSQYS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 MVMQFQGLENPIQISPHCSCTPSGFFMEMMSMKPAKGVLTEQVAGPLGQNLEVEPYSQYS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 NVQFPQVQPQISSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 NVQFPQVQPQISSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTK 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 KPRMGASAGRIKGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 KPRMGASAGRIKGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 MDMYMRRKCQECRLRKCKEMGMLAECLLTEIQCKSKRLRKNVKQHADQTVNEDSEGRDLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 MDMYMRRKCQECRLRKCKEMGMLAECLLTEIQCKSKRLRKNVKQHADQTVNEDSEGRDLR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 QVTSTTKSCREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLILTEM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 QVTSTTKSCREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLILTEM 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 ATNHVQVLVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHSDLLEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 ATNHVQVLVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHSDLLEE 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB7 RIRNSGISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 RIRNSGISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEP 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB7 LLDVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCEIWD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 LLDVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCEIWD 430 440 450 460 470 480 pF1KB7 VQ :: CCDS55 VQ >>CCDS55876.1 NR1H4 gene_id:9971|Hs108|chr12 (486 aa) initn: 3320 init1: 1810 opt: 3251 Z-score: 3346.5 bits: 628.6 E(32554): 4.4e-180 Smith-Waterman score: 3251; 99.2% identity (99.2% similar) in 486 aa overlap (1-482:1-486) 10 20 30 40 50 60 pF1KB7 MVMQFQGLENPIQISPHCSCTPSGFFMEMMSMKPAKGVLTEQVAGPLGQNLEVEPYSQYS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 MVMQFQGLENPIQISPHCSCTPSGFFMEMMSMKPAKGVLTEQVAGPLGQNLEVEPYSQYS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 NVQFPQVQPQISSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 NVQFPQVQPQISSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTK 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 KPRMGASAGRIKGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 KPRMGASAGRIKGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCV 130 140 150 160 170 180 190 200 210 220 230 pF1KB7 MDMYMRRKCQECRLRKCKEMGMLAEC----LLTEIQCKSKRLRKNVKQHADQTVNEDSEG :::::::::::::::::::::::::: :::::::::::::::::::::::::::::: CCDS55 MDMYMRRKCQECRLRKCKEMGMLAECMYTGLLTEIQCKSKRLRKNVKQHADQTVNEDSEG 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB7 RDLRQVTSTTKSCREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 RDLRQVTSTTKSCREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLI 250 260 270 280 290 300 300 310 320 330 340 350 pF1KB7 LTEMATNHVQVLVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHSD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 LTEMATNHVQVLVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHSD 310 320 330 340 350 360 360 370 380 390 400 410 pF1KB7 LLEERIRNSGISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 LLEERIRNSGISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEK 370 380 390 400 410 420 420 430 440 450 460 470 pF1KB7 LQEPLLDVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 LQEPLLDVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLC 430 440 450 460 470 480 480 pF1KB7 EIWDVQ :::::: CCDS55 EIWDVQ >>CCDS9078.1 NR1H4 gene_id:9971|Hs108|chr12 (472 aa) initn: 3009 init1: 3009 opt: 3009 Z-score: 3098.0 bits: 582.6 E(32554): 3.1e-166 Smith-Waterman score: 3009; 100.0% identity (100.0% similar) in 446 aa overlap (37-482:27-472) 10 20 30 40 50 60 pF1KB7 GLENPIQISPHCSCTPSGFFMEMMSMKPAKGVLTEQVAGPLGQNLEVEPYSQYSNVQFPQ :::::::::::::::::::::::::::::: CCDS90 MGSKMNLIEHSHLPTTDEFSFSENLFGVLTEQVAGPLGQNLEVEPYSQYSNVQFPQ 10 20 30 40 50 70 80 90 100 110 120 pF1KB7 VQPQISSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 VQPQISSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGA 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB7 SAGRIKGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCVMDMYMR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 SAGRIKGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCVMDMYMR 120 130 140 150 160 170 190 200 210 220 230 240 pF1KB7 RKCQECRLRKCKEMGMLAECLLTEIQCKSKRLRKNVKQHADQTVNEDSEGRDLRQVTSTT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 RKCQECRLRKCKEMGMLAECLLTEIQCKSKRLRKNVKQHADQTVNEDSEGRDLRQVTSTT 180 190 200 210 220 230 250 260 270 280 290 300 pF1KB7 KSCREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLILTEMATNHVQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 KSCREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLILTEMATNHVQ 240 250 260 270 280 290 310 320 330 340 350 360 pF1KB7 VLVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHSDLLEERIRNSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 VLVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHSDLLEERIRNSG 300 310 320 330 340 350 370 380 390 400 410 420 pF1KB7 ISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEPLLDVLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 ISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEPLLDVLQ 360 370 380 390 400 410 430 440 450 460 470 480 pF1KB7 KLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCEIWDVQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 KLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCEIWDVQ 420 430 440 450 460 470 >>CCDS55873.1 NR1H4 gene_id:9971|Hs108|chr12 (476 aa) initn: 3060 init1: 1810 opt: 2991 Z-score: 3079.4 bits: 579.2 E(32554): 3.3e-165 Smith-Waterman score: 2991; 99.1% identity (99.1% similar) in 450 aa overlap (37-482:27-476) 10 20 30 40 50 60 pF1KB7 GLENPIQISPHCSCTPSGFFMEMMSMKPAKGVLTEQVAGPLGQNLEVEPYSQYSNVQFPQ :::::::::::::::::::::::::::::: CCDS55 MGSKMNLIEHSHLPTTDEFSFSENLFGVLTEQVAGPLGQNLEVEPYSQYSNVQFPQ 10 20 30 40 50 70 80 90 100 110 120 pF1KB7 VQPQISSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VQPQISSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGA 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB7 SAGRIKGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCVMDMYMR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 SAGRIKGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCVMDMYMR 120 130 140 150 160 170 190 200 210 220 230 240 pF1KB7 RKCQECRLRKCKEMGMLAEC----LLTEIQCKSKRLRKNVKQHADQTVNEDSEGRDLRQV :::::::::::::::::::: :::::::::::::::::::::::::::::::::::: CCDS55 RKCQECRLRKCKEMGMLAECMYTGLLTEIQCKSKRLRKNVKQHADQTVNEDSEGRDLRQV 180 190 200 210 220 230 250 260 270 280 290 300 pF1KB7 TSTTKSCREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLILTEMAT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 TSTTKSCREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLILTEMAT 240 250 260 270 280 290 310 320 330 340 350 360 pF1KB7 NHVQVLVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHSDLLEERI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 NHVQVLVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHSDLLEERI 300 310 320 330 340 350 370 380 390 400 410 420 pF1KB7 RNSGISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEPLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 RNSGISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEPLL 360 370 380 390 400 410 430 440 450 460 470 480 pF1KB7 DVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCEIWDVQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 DVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCEIWDVQ 420 430 440 450 460 470 >>CCDS55874.1 NR1H4 gene_id:9971|Hs108|chr12 (425 aa) initn: 1810 init1: 1810 opt: 1810 Z-score: 1866.6 bits: 354.6 E(32554): 1.2e-97 Smith-Waterman score: 2559; 89.5% identity (89.5% similar) in 446 aa overlap (37-482:27-425) 10 20 30 40 50 60 pF1KB7 GLENPIQISPHCSCTPSGFFMEMMSMKPAKGVLTEQVAGPLGQNLEVEPYSQYSNVQFPQ :::::::::::::::::::::::::::::: CCDS55 MGSKMNLIEHSHLPTTDEFSFSENLFGVLTEQVAGPLGQNLEVEPYSQYSNVQFPQ 10 20 30 40 50 70 80 90 100 110 120 pF1KB7 VQPQISSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VQPQISSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGA 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB7 SAGRIKGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCVMDMYMR ::::::::::::::::::::::::::::::::: CCDS55 SAGRIKGDELCVVCGDRASGYHYNALTCEGCKG--------------------------- 120 130 140 190 200 210 220 230 240 pF1KB7 RKCQECRLRKCKEMGMLAECLLTEIQCKSKRLRKNVKQHADQTVNEDSEGRDLRQVTSTT :::::::::::::::::::::::::::::::::::::::: CCDS55 --------------------LLTEIQCKSKRLRKNVKQHADQTVNEDSEGRDLRQVTSTT 150 160 170 180 250 260 270 280 290 300 pF1KB7 KSCREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLILTEMATNHVQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 KSCREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLILTEMATNHVQ 190 200 210 220 230 240 310 320 330 340 350 360 pF1KB7 VLVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHSDLLEERIRNSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VLVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHSDLLEERIRNSG 250 260 270 280 290 300 370 380 390 400 410 420 pF1KB7 ISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEPLLDVLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 ISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEPLLDVLQ 310 320 330 340 350 360 430 440 450 460 470 480 pF1KB7 KLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCEIWDVQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 KLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCEIWDVQ 370 380 390 400 410 420 >>CCDS73285.1 NR1H3 gene_id:10062|Hs108|chr11 (453 aa) initn: 891 init1: 462 opt: 924 Z-score: 955.8 bits: 186.2 E(32554): 6.4e-47 Smith-Waterman score: 924; 36.7% identity (65.5% similar) in 452 aa overlap (46-482:8-452) 20 30 40 50 60 70 pF1KB7 PHCSCTPSGFFMEMMSMKPAKGVLTEQVAGPLGQNLEVEPYSQYSNVQF--PQVQPQISS ::: . . : .: :.. : .: :. CCDS73 MQQTSWNPLGGTCKQPPGRTHSAVELWKPGAQDASSQ 10 20 30 80 90 100 110 120 130 pF1KB7 SSYYSN--LGFYPQQPEEWY-SPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGASAGR .. :. : ..:. . :. :. : ..: . . : . : . CCDS73 AQGGSSCILREEARMPHSAGGTAGVGLEAAEPTALLTRAEPPSEPTEIRPQKRKKGPAPK 40 50 60 70 80 90 140 150 160 170 180 190 pF1KB7 IKGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCVMDMYMRRKCQ . :.::: ::::.:::.:::.:.:::::::::::. :.: : :..::.: :: ::::::: CCDS73 MLGNELCSVCGDKASGFHYNVLSCEGCKGFFRRSVIKGAHYICHSGGHCPMDTYMRRKCQ 100 110 120 130 140 150 200 210 220 230 240 pF1KB7 ECRLRKCKEMGMLAECLLTEIQCKSKRLRKNVKQHADQTV---NEDSEGRDLRQVTSTTK :::::::.. :: ::.:.: : . :.:... ...: : .: . : :.. CCDS73 ECRLRKCRQAGMREECVLSEEQIRLKKLKRQEEEQAHATSLPPRASSPPQILPQLSPEQL 160 170 180 190 200 210 250 260 270 280 290 300 pF1KB7 SCREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLILTEMATNHVQV . :: .. .:: . . : . : .. ..: . .. : .::.: :: CCDS73 GMIEKL-VAAQQQCNRRSFSDRL--RVTPWPMAPDPHSRE-ARQQRFAHFTELAIVSVQE 220 230 240 250 260 270 310 320 330 340 350 360 pF1KB7 LVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHS-----DLLEER- .:.:.:.:::: :..:::::::: ::.:.:.:.... .: :...: :. .: CCDS73 IVDFAKQLPGFLQLSREDQIALLKTSAIEVMLLETSRRYN---PGSESITFLKDFSYNRE 280 290 300 310 320 330 370 380 390 400 410 420 pF1KB7 -IRNSGISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEP . ..:.. :.:.:.: : ....::.... :.::: :: :.: :: ..:. ::.::. CCDS73 DFAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLIAISIFSADRPNVQDQLQVERLQHT 340 350 360 370 380 390 430 440 450 460 470 480 pF1KB7 LLDVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCEIWD ...:. .::.:.. : .: .:. :::.. :.:.... :..:.:. ::: :::: CCDS73 YVEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSVHSEQVFALRLQDKKLPPLLSEIWD 400 410 420 430 440 450 pF1KB7 VQ :. CCDS73 VHE >>CCDS44585.1 NR1H3 gene_id:10062|Hs108|chr11 (402 aa) initn: 937 init1: 462 opt: 915 Z-score: 947.3 bits: 184.4 E(32554): 1.9e-46 Smith-Waterman score: 915; 39.3% identity (68.9% similar) in 392 aa overlap (102-482:18-401) 80 90 100 110 120 130 pF1KB7 SSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGASAGRI :. : ..: . . : . : .. CCDS44 MPHSAGGTAGVGLEAAEPTALLTRAEPPSEPTEIRPQKRKKGPAPKM 10 20 30 40 140 150 160 170 180 190 pF1KB7 KGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCVMDMYMRRKCQE :.::: ::::.:::.:::.:.:::::::::::. :.: : :..::.: :: :::::::: CCDS44 LGNELCSVCGDKASGFHYNVLSCEGCKGFFRRSVIKGAHYICHSGGHCPMDTYMRRKCQE 50 60 70 80 90 100 200 210 220 230 240 pF1KB7 CRLRKCKEMGMLAECLLTEIQCKSKRLRKNVKQHADQTV---NEDSEGRDLRQVTSTTKS ::::::.. :: ::.:.: : . :.:... ...: : .: . : :.. . CCDS44 CRLRKCRQAGMREECVLSEEQIRLKKLKRQEEEQAHATSLPPRASSPPQILPQLSPEQLG 110 120 130 140 150 160 250 260 270 280 290 300 pF1KB7 CREKTELTPDQQTLLHFIMDSYNKQRM-PQEITNKILKEEFSAEENFLILTEMATNHVQV :: .. .:: . . : . :. : .. ..: . .. : .::.: :: CCDS44 MIEKL-VAAQQQCNRRSFSD---RLRVTPWPMAPDPHSRE-ARQQRFAHFTELAIVSVQE 170 180 190 200 210 220 310 320 330 340 350 360 pF1KB7 LVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHS-----DLLEER- .:.:.:.:::: :..:::::::: ::.:.:.:.... .: :...: :. .: CCDS44 IVDFAKQLPGFLQLSREDQIALLKTSAIEVMLLETSRRYN---PGSESITFLKDFSYNRE 230 240 250 260 270 370 380 390 400 410 420 pF1KB7 -IRNSGISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEP . ..:.. :.:.:.: : ....::.... :.::: :: :.: :: ..:. ::.::. CCDS44 DFAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLIAISIFSADRPNVQDQLQVERLQHT 280 290 300 310 320 330 430 440 450 460 470 480 pF1KB7 LLDVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCEIWD ...:. .::.:.. : .: .:. :::.. :.:.... :..:.:. ::: :::: CCDS44 YVEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSVHSEQVFALRLQDKKLPPLLSEIWD 340 350 360 370 380 390 pF1KB7 VQ :. CCDS44 VHE 400 >>CCDS7929.1 NR1H3 gene_id:10062|Hs108|chr11 (447 aa) initn: 891 init1: 462 opt: 915 Z-score: 946.6 bits: 184.5 E(32554): 2.1e-46 Smith-Waterman score: 915; 39.3% identity (68.9% similar) in 392 aa overlap (102-482:63-446) 80 90 100 110 120 130 pF1KB7 SSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGASAGRI :. : ..: . . : . : .. CCDS79 QGGSSCILREEARMPHSAGGTAGVGLEAAEPTALLTRAEPPSEPTEIRPQKRKKGPAPKM 40 50 60 70 80 90 140 150 160 170 180 190 pF1KB7 KGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCVMDMYMRRKCQE :.::: ::::.:::.:::.:.:::::::::::. :.: : :..::.: :: :::::::: CCDS79 LGNELCSVCGDKASGFHYNVLSCEGCKGFFRRSVIKGAHYICHSGGHCPMDTYMRRKCQE 100 110 120 130 140 150 200 210 220 230 240 pF1KB7 CRLRKCKEMGMLAECLLTEIQCKSKRLRKNVKQHADQTV---NEDSEGRDLRQVTSTTKS ::::::.. :: ::.:.: : . :.:... ...: : .: . : :.. . CCDS79 CRLRKCRQAGMREECVLSEEQIRLKKLKRQEEEQAHATSLPPRASSPPQILPQLSPEQLG 160 170 180 190 200 210 250 260 270 280 290 300 pF1KB7 CREKTELTPDQQTLLHFIMDSYNKQRM-PQEITNKILKEEFSAEENFLILTEMATNHVQV :: .. .:: . . : . :. : .. ..: . .. : .::.: :: CCDS79 MIEKL-VAAQQQCNRRSFSD---RLRVTPWPMAPDPHSRE-ARQQRFAHFTELAIVSVQE 220 230 240 250 260 310 320 330 340 350 360 pF1KB7 LVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHS-----DLLEER- .:.:.:.:::: :..:::::::: ::.:.:.:.... .: :...: :. .: CCDS79 IVDFAKQLPGFLQLSREDQIALLKTSAIEVMLLETSRRYN---PGSESITFLKDFSYNRE 270 280 290 300 310 320 370 380 390 400 410 420 pF1KB7 -IRNSGISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEP . ..:.. :.:.:.: : ....::.... :.::: :: :.: :: ..:. ::.::. CCDS79 DFAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLIAISIFSADRPNVQDQLQVERLQHT 330 340 350 360 370 380 430 440 450 460 470 480 pF1KB7 LLDVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCEIWD ...:. .::.:.. : .: .:. :::.. :.:.... :..:.:. ::: :::: CCDS79 YVEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSVHSEQVFALRLQDKKLPPLLSEIWD 390 400 410 420 430 440 pF1KB7 VQ :. CCDS79 VHE >>CCDS54627.1 NR1I2 gene_id:8856|Hs108|chr3 (397 aa) initn: 563 init1: 225 opt: 571 Z-score: 593.9 bits: 119.0 E(32554): 9.3e-27 Smith-Waterman score: 639; 32.4% identity (61.6% similar) in 380 aa overlap (118-481:23-394) 90 100 110 120 130 140 pF1KB7 EEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGASAGRIKGDELCVVCGDRASGY : :: ..:. .. : ..: ::::.:.:: CCDS54 MEVRPKESWNHADFVHCEDTESVPGKPSVNADE-EVGGPQICRVCGDKATGY 10 20 30 40 50 150 160 170 180 190 200 pF1KB7 HYNALTCEGCKGFFRRSITKNAVYKCK-NGGNCVMDMYMRRKCQECRLRKCKEMGMLAEC :.:..:::::::::::.. .:: .: : : . ::.:: :::::: : :: : CCDS54 HFNVMTCEGCKGFFRRAMKRNARLRCPFRKGACEITRKTRRQCQACRLRKCLESGMKKEM 60 70 80 90 100 110 210 220 230 240 250 260 pF1KB7 LLTEIQCKSKRL---RKNVKQHADQTVNEDSEGRDLRQVTSTTKSCREKTELTPDQQTLL .... . .: ::. .. . : .. .. .. :.. . . :: : :. CCDS54 IMSDEAVEERRALIKRKKSERTGTQPLGVQGLTEEQRMMIRELMDAQMKTFDT----TFS 120 130 140 150 160 270 280 290 300 310 pF1KB7 HFIMDSYNKQRMPQE--ITNKILKEEFSAEENFLILTEMA---TNHVQVLVEFTKKLPGF :: . : .. . : . ...: : .: .:: : . .. :.: . : CCDS54 HFKNFRVSLQLRGEDGSVWNYKPPADSGGKEIFSLLPHMADMSTYMFKGIISFAKVISYF 170 180 190 200 210 220 320 330 340 350 360 370 pF1KB7 QTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHSDLLEERIRNS--GISDEYITPMF . : ::::.::::.: : :: .:: . . . : .... :... . ::. CCDS54 RDLPIEDQISLLKGAAFELCQLRFNTVFNAETGTWECGRLSYCLEDTAGGFQQLLLEPML 230 240 250 260 270 280 380 390 400 410 420 430 pF1KB7 SFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEPLLDVLQKLCKIHQPEN .:. . .:.. .:::.:. :: ..:::: . ....:..::: . .:.. . ..:. CCDS54 KFHYMLKKLQLHEEEYVLMQAISLFSPDRPGVLQHRVVDQLQEQFAITLKSYIECNRPQ- 290 300 310 320 330 340 440 450 460 470 480 pF1KB7 PQH---FACLLGRLTELRTFNHHHAEMLMSWRVND-HKF-TPLLCEIWDVQ : : : ... :::::..: .:.. :. :..: : : :::. :.. . CCDS54 PAHRFLFLKIMAMLTELRSINAQHTQRLL--RIQDIHPFATPLMQELFGITGS 350 360 370 380 390 >>CCDS42316.1 THRA gene_id:7067|Hs108|chr17 (410 aa) initn: 546 init1: 216 opt: 560 Z-score: 582.4 bits: 116.9 E(32554): 4.1e-26 Smith-Waterman score: 621; 33.7% identity (59.9% similar) in 377 aa overlap (134-482:50-408) 110 120 130 140 150 160 pF1KB7 ETLYQGETEVAEMPVTKKPRMGASAGRIKGDELCVVCGDRASGYHYNALTCEGCKGFFRR :: ::::::.:.:::: .::::::::::: CCDS42 RSPDGKRKRKNGQCSLKTSMSGYIPSYLDKDEQCVVCGDKATGYHYRCITCEGCKGFFRR 20 30 40 50 60 70 170 180 190 200 210 220 pF1KB7 SITKN--AVYKCKNGGNCVMDMYMRRKCQECRLRKCKEMGMLAECLLTEIQCKSKRLRKN .: :: .:.:: . ::.: : .:: ::..:: .:: . .: . :::. : CCDS42 TIQKNLHPTYSCKYDSCCVIDKITRNQCQLCRFKKCIAVGMAMDLVLDD----SKRVAK- 80 90 100 110 120 130 230 240 250 260 270 pF1KB7 VKQHADQTVNEDSEGRDLRQVTSTTKSCREKTELTPDQQTLLHFIMD---------SYNK .. .:. :. :. .: ... : ::.. :.:. . :. : CCDS42 -RKLIEQN-------RERRRKEEMIRSLQQRPEPTPEEWDLIHIATEAHRSTNAQGSHWK 140 150 160 170 180 280 290 300 310 320 pF1KB7 QR---MPQEITNKILKEEFSAE----ENFLILTEMATNHVQVLVEFTKKLPGFQTLDHED :: .:..: .. . ... : : .:.. : . .:.:.:::: :. : :: CCDS42 QRRKFLPDDIGQSPIVSMPDGDKVDLEAFSEFTKIITPAITRVVDFAKKLPMFSELPCED 190 200 210 220 230 240 330 340 350 360 370 pF1KB7 QIALLKGSAVEAMFLRSAEIFNKKLP----SGHSDLLEERIRNSG---ISDEYITPMFSF :: :::: .: : ::.: .. . ::. . .:...:.: .:: .: . CCDS42 QIILLKGCCMEIMSLRAAVRYDPESDTLTLSGEMAVKREQLKNGGLGVVSDA----IFEL 250 260 270 280 290 300 380 390 400 410 420 430 pF1KB7 YKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEPLLDVLQKLCKIHQPENPQ ::.. ... . : ::: :....: ::. . . .:: :: : .... . :. .: CCDS42 GKSLSAFNLDDTEVALLQAVLLMSTDRSGLLCVDKIEKSQEAYLLAFEHYVN-HRKHNIP 310 320 330 340 350 360 440 450 460 470 480 pF1KB7 HF-ACLLGRLTELRTFNHHHAEMLMSWRVN--DHKFTPLLCEIWDVQ :: :: ..:.:: .. :: .. .:. . : ::. :... : CCDS42 HFWPKLLMKVTDLRMIGACHASRFLHMKVECPTELFPPLFLEVFEDQEV 370 380 390 400 410 482 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 09:19:07 2016 done: Fri Nov 4 09:19:08 2016 Total Scan time: 2.880 Total Display time: 0.060 Function used was FASTA [36.3.4 Apr, 2011]