FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7752, 490 aa 1>>>pF1KB7752 490 - 490 aa - 490 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.8510+/-0.000806; mu= 16.8495+/- 0.049 mean_var=94.3966+/-18.980, 0's: 0 Z-trim(110.5): 123 B-trim: 371 in 1/50 Lambda= 0.132007 statistics sampled from 11537 (11662) to 11537 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.721), E-opt: 0.2 (0.358), width: 16 Scan time: 3.010 The best scores are: opt bits E(32554) CCDS11360.1 THRA gene_id:7067|Hs108|chr17 ( 490) 3328 643.9 1.2e-184 CCDS58546.1 THRA gene_id:7067|Hs108|chr17 ( 451) 2532 492.3 4.7e-139 CCDS42316.1 THRA gene_id:7067|Hs108|chr17 ( 410) 2527 491.3 8.5e-139 CCDS2641.1 THRB gene_id:7068|Hs108|chr3 ( 461) 1918 375.3 7.6e-104 CCDS44585.1 NR1H3 gene_id:10062|Hs108|chr11 ( 402) 656 134.9 1.5e-31 CCDS7929.1 NR1H3 gene_id:10062|Hs108|chr11 ( 447) 656 135.0 1.7e-31 CCDS73285.1 NR1H3 gene_id:10062|Hs108|chr11 ( 453) 656 135.0 1.7e-31 CCDS55873.1 NR1H4 gene_id:9971|Hs108|chr12 ( 476) 542 113.3 6e-25 CCDS55876.1 NR1H4 gene_id:9971|Hs108|chr12 ( 486) 542 113.3 6.1e-25 CCDS9078.1 NR1H4 gene_id:9971|Hs108|chr12 ( 472) 530 111.0 2.9e-24 CCDS55875.1 NR1H4 gene_id:9971|Hs108|chr12 ( 482) 530 111.0 2.9e-24 CCDS54627.1 NR1I2 gene_id:8856|Hs108|chr3 ( 397) 521 109.2 8.3e-24 CCDS46775.1 RARB gene_id:5915|Hs108|chr3 ( 336) 450 95.7 8.6e-20 CCDS2642.1 RARB gene_id:5915|Hs108|chr3 ( 448) 450 95.7 1.1e-19 CCDS58236.1 RARG gene_id:5916|Hs108|chr12 ( 382) 446 94.9 1.6e-19 CCDS58237.1 RARG gene_id:5916|Hs108|chr12 ( 432) 446 95.0 1.8e-19 CCDS41790.1 RARG gene_id:5916|Hs108|chr12 ( 443) 446 95.0 1.8e-19 CCDS8850.1 RARG gene_id:5916|Hs108|chr12 ( 454) 446 95.0 1.8e-19 CCDS42317.1 RARA gene_id:5914|Hs108|chr17 ( 457) 442 94.2 3.1e-19 CCDS11366.1 RARA gene_id:5914|Hs108|chr17 ( 462) 442 94.2 3.2e-19 CCDS45671.1 RARA gene_id:5914|Hs108|chr17 ( 365) 437 93.2 5.1e-19 CCDS3772.1 NR3C2 gene_id:4306|Hs108|chr4 ( 984) 394 85.3 3.2e-16 CCDS5234.1 ESR1 gene_id:2099|Hs108|chr6 ( 595) 384 83.3 8.1e-16 CCDS55820.1 VDR gene_id:7421|Hs108|chr12 ( 477) 375 81.5 2.3e-15 CCDS41429.1 NR1I3 gene_id:9970|Hs108|chr1 ( 357) 371 80.6 3.1e-15 CCDS8757.1 VDR gene_id:7421|Hs108|chr12 ( 427) 368 80.1 5.2e-15 CCDS10179.1 RORA gene_id:6095|Hs108|chr15 ( 556) 369 80.4 5.6e-15 CCDS73751.1 NR2E3 gene_id:10002|Hs108|chr15 ( 367) 364 79.3 7.9e-15 CCDS10177.1 RORA gene_id:6095|Hs108|chr15 ( 523) 366 79.8 7.9e-15 CCDS73750.1 NR2E3 gene_id:10002|Hs108|chr15 ( 410) 364 79.3 8.6e-15 CCDS45271.1 RORA gene_id:6095|Hs108|chr15 ( 468) 361 78.8 1.4e-14 CCDS10178.1 RORA gene_id:6095|Hs108|chr15 ( 548) 361 78.9 1.6e-14 CCDS6856.1 NR5A1 gene_id:2516|Hs108|chr9 ( 461) 358 78.2 2.1e-14 CCDS1400.1 NR5A2 gene_id:2494|Hs108|chr1 ( 495) 356 77.9 2.8e-14 CCDS74905.1 NR2C2 gene_id:7182|Hs108|chr3 ( 596) 356 77.9 3.3e-14 CCDS2621.1 NR2C2 gene_id:7182|Hs108|chr3 ( 615) 356 77.9 3.4e-14 CCDS1401.1 NR5A2 gene_id:2494|Hs108|chr1 ( 541) 353 77.3 4.5e-14 CCDS60383.1 NR5A2 gene_id:2494|Hs108|chr1 ( 469) 352 77.1 4.6e-14 CCDS53405.1 NR1I3 gene_id:9970|Hs108|chr1 ( 296) 349 76.4 4.8e-14 CCDS44262.1 NR1I3 gene_id:9970|Hs108|chr1 ( 309) 349 76.4 5e-14 CCDS41428.1 NR1I3 gene_id:9970|Hs108|chr1 ( 314) 349 76.4 5e-14 CCDS44260.1 NR1I3 gene_id:9970|Hs108|chr1 ( 339) 349 76.4 5.3e-14 CCDS44261.1 NR1I3 gene_id:9970|Hs108|chr1 ( 340) 349 76.4 5.4e-14 CCDS1228.1 NR1I3 gene_id:9970|Hs108|chr1 ( 348) 349 76.4 5.5e-14 CCDS41430.1 NR1I3 gene_id:9970|Hs108|chr1 ( 352) 349 76.4 5.5e-14 CCDS41821.1 NR2C1 gene_id:7181|Hs108|chr12 ( 467) 349 76.5 6.8e-14 CCDS68131.1 HNF4A gene_id:3172|Hs108|chr20 ( 395) 348 76.3 6.9e-14 CCDS44953.1 NR2C1 gene_id:7181|Hs108|chr12 ( 483) 349 76.5 7e-14 CCDS46604.1 HNF4A gene_id:3172|Hs108|chr20 ( 442) 348 76.3 7.5e-14 CCDS42876.1 HNF4A gene_id:3172|Hs108|chr20 ( 452) 348 76.3 7.6e-14 >>CCDS11360.1 THRA gene_id:7067|Hs108|chr17 (490 aa) initn: 3328 init1: 3328 opt: 3328 Z-score: 3428.7 bits: 643.9 E(32554): 1.2e-184 Smith-Waterman score: 3328; 100.0% identity (100.0% similar) in 490 aa overlap (1-490:1-490) 10 20 30 40 50 60 pF1KB7 MEQKPSKVECGSDPEENSARSPDGKRKRKNGQCSLKTSMSGYIPSYLDKDEQCVVCGDKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MEQKPSKVECGSDPEENSARSPDGKRKRKNGQCSLKTSMSGYIPSYLDKDEQCVVCGDKA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 TGYHYRCITCEGCKGFFRRTIQKNLHPTYSCKYDSCCVIDKITRNQCQLCRFKKCIAVGM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 TGYHYRCITCEGCKGFFRRTIQKNLHPTYSCKYDSCCVIDKITRNQCQLCRFKKCIAVGM 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 AMDLVLDDSKRVAKRKLIEQNRERRRKEEMIRSLQQRPEPTPEEWDLIHIATEAHRSTNA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 AMDLVLDDSKRVAKRKLIEQNRERRRKEEMIRSLQQRPEPTPEEWDLIHIATEAHRSTNA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 QGSHWKQRRKFLPDDIGQSPIVSMPDGDKVDLEAFSEFTKIITPAITRVVDFAKKLPMFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 QGSHWKQRRKFLPDDIGQSPIVSMPDGDKVDLEAFSEFTKIITPAITRVVDFAKKLPMFS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 ELPCEDQIILLKGCCMEIMSLRAAVRYDPESDTLTLSGEMAVKREQLKNGGLGVVSDAIF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 ELPCEDQIILLKGCCMEIMSLRAAVRYDPESDTLTLSGEMAVKREQLKNGGLGVVSDAIF 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 ELGKSLSAFNLDDTEVALLQAVLLMSTDRSGLLCVDKIEKSQEAYLLAFEHYVNHRKHNI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 ELGKSLSAFNLDDTEVALLQAVLLMSTDRSGLLCVDKIEKSQEAYLLAFEHYVNHRKHNI 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB7 PHFWPKLLMKEREVQSSILYKGAAAEGRPGGSLGVHPEGQQLLGMHVVQGPQVRQLEQQL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 PHFWPKLLMKEREVQSSILYKGAAAEGRPGGSLGVHPEGQQLLGMHVVQGPQVRQLEQQL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB7 GEAGSLQGPVLQHQSPKSPQQRLLELLHRSGILHARAVCGEDDSSEADSPSSSEEEPEVC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 GEAGSLQGPVLQHQSPKSPQQRLLELLHRSGILHARAVCGEDDSSEADSPSSSEEEPEVC 430 440 450 460 470 480 490 pF1KB7 EDLAGNAASP :::::::::: CCDS11 EDLAGNAASP 490 >>CCDS58546.1 THRA gene_id:7067|Hs108|chr17 (451 aa) initn: 2529 init1: 2529 opt: 2532 Z-score: 2609.9 bits: 492.3 E(32554): 4.7e-139 Smith-Waterman score: 2982; 92.0% identity (92.0% similar) in 490 aa overlap (1-490:1-451) 10 20 30 40 50 60 pF1KB7 MEQKPSKVECGSDPEENSARSPDGKRKRKNGQCSLKTSMSGYIPSYLDKDEQCVVCGDKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 MEQKPSKVECGSDPEENSARSPDGKRKRKNGQCSLKTSMSGYIPSYLDKDEQCVVCGDKA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 TGYHYRCITCEGCKGFFRRTIQKNLHPTYSCKYDSCCVIDKITRNQCQLCRFKKCIAVGM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 TGYHYRCITCEGCKGFFRRTIQKNLHPTYSCKYDSCCVIDKITRNQCQLCRFKKCIAVGM 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 AMDLVLDDSKRVAKRKLIEQNRERRRKEEMIRSLQQRPEPTPEEWDLIHIATEAHRSTNA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 AMDLVLDDSKRVAKRKLIEQNRERRRKEEMIRSLQQRPEPTPEEWDLIHIATEAHRSTNA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 QGSHWKQRRKFLPDDIGQSPIVSMPDGDKVDLEAFSEFTKIITPAITRVVDFAKKLPMFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 QGSHWKQRRKFLPDDIGQSPIVSMPDGDKVDLEAFSEFTKIITPAITRVVDFAKKLPMFS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 ELPCEDQIILLKGCCMEIMSLRAAVRYDPESDTLTLSGEMAVKREQLKNGGLGVVSDAIF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 ELPCEDQIILLKGCCMEIMSLRAAVRYDPESDTLTLSGEMAVKREQLKNGGLGVVSDAIF 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 ELGKSLSAFNLDDTEVALLQAVLLMSTDRSGLLCVDKIEKSQEAYLLAFEHYVNHRKHNI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 ELGKSLSAFNLDDTEVALLQAVLLMSTDRSGLLCVDKIEKSQEAYLLAFEHYVNHRKHNI 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB7 PHFWPKLLMKEREVQSSILYKGAAAEGRPGGSLGVHPEGQQLLGMHVVQGPQVRQLEQQL :::::::::: ::::::::::: CCDS58 PHFWPKLLMK---------------------------------------GPQVRQLEQQL 370 380 430 440 450 460 470 480 pF1KB7 GEAGSLQGPVLQHQSPKSPQQRLLELLHRSGILHARAVCGEDDSSEADSPSSSEEEPEVC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 GEAGSLQGPVLQHQSPKSPQQRLLELLHRSGILHARAVCGEDDSSEADSPSSSEEEPEVC 390 400 410 420 430 440 490 pF1KB7 EDLAGNAASP :::::::::: CCDS58 EDLAGNAASP 450 >>CCDS42316.1 THRA gene_id:7067|Hs108|chr17 (410 aa) initn: 2527 init1: 2527 opt: 2527 Z-score: 2605.4 bits: 491.3 E(32554): 8.5e-139 Smith-Waterman score: 2527; 100.0% identity (100.0% similar) in 370 aa overlap (1-370:1-370) 10 20 30 40 50 60 pF1KB7 MEQKPSKVECGSDPEENSARSPDGKRKRKNGQCSLKTSMSGYIPSYLDKDEQCVVCGDKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 MEQKPSKVECGSDPEENSARSPDGKRKRKNGQCSLKTSMSGYIPSYLDKDEQCVVCGDKA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 TGYHYRCITCEGCKGFFRRTIQKNLHPTYSCKYDSCCVIDKITRNQCQLCRFKKCIAVGM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 TGYHYRCITCEGCKGFFRRTIQKNLHPTYSCKYDSCCVIDKITRNQCQLCRFKKCIAVGM 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 AMDLVLDDSKRVAKRKLIEQNRERRRKEEMIRSLQQRPEPTPEEWDLIHIATEAHRSTNA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 AMDLVLDDSKRVAKRKLIEQNRERRRKEEMIRSLQQRPEPTPEEWDLIHIATEAHRSTNA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 QGSHWKQRRKFLPDDIGQSPIVSMPDGDKVDLEAFSEFTKIITPAITRVVDFAKKLPMFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 QGSHWKQRRKFLPDDIGQSPIVSMPDGDKVDLEAFSEFTKIITPAITRVVDFAKKLPMFS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 ELPCEDQIILLKGCCMEIMSLRAAVRYDPESDTLTLSGEMAVKREQLKNGGLGVVSDAIF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 ELPCEDQIILLKGCCMEIMSLRAAVRYDPESDTLTLSGEMAVKREQLKNGGLGVVSDAIF 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 ELGKSLSAFNLDDTEVALLQAVLLMSTDRSGLLCVDKIEKSQEAYLLAFEHYVNHRKHNI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 ELGKSLSAFNLDDTEVALLQAVLLMSTDRSGLLCVDKIEKSQEAYLLAFEHYVNHRKHNI 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB7 PHFWPKLLMKEREVQSSILYKGAAAEGRPGGSLGVHPEGQQLLGMHVVQGPQVRQLEQQL :::::::::: CCDS42 PHFWPKLLMKVTDLRMIGACHASRFLHMKVECPTELFPPLFLEVFEDQEV 370 380 390 400 410 >>CCDS2641.1 THRB gene_id:7068|Hs108|chr3 (461 aa) initn: 1918 init1: 1918 opt: 1918 Z-score: 1977.8 bits: 375.3 E(32554): 7.6e-104 Smith-Waterman score: 1918; 82.7% identity (93.9% similar) in 330 aa overlap (41-370:95-424) 20 30 40 50 60 70 pF1KB7 GSDPEENSARSPDGKRKRKNGQCSLKTSMSGYIPSYLDKDEQCVVCGDKATGYHYRCITC ::::::::::: :::::::::::::::::: CCDS26 SSIFHLDHDDVNDQSVSSAQTFQTEEKKCKGYIPSYLDKDELCVVCGDKATGYHYRCITC 70 80 90 100 110 120 80 90 100 110 120 130 pF1KB7 EGCKGFFRRTIQKNLHPTYSCKYDSCCVIDKITRNQCQLCRFKKCIAVGMAMDLVLDDSK :::::::::::::::::.:::::.. :::::.:::::: ::::::: :::: :::::::: CCDS26 EGCKGFFRRTIQKNLHPSYSCKYEGKCVIDKVTRNQCQECRFKKCIYVGMATDLVLDDSK 130 140 150 160 170 180 140 150 160 170 180 190 pF1KB7 RVAKRKLIEQNRERRRKEEMIRSLQQRPEPTPEEWDLIHIATEAHRSTNAQGSHWKQRRK :.:::::::.:::.::.::. .:. ..:::: :::.::. .:::: .::::::::::.:: CCDS26 RLAKRKLIEENREKRRREELQKSIGHKPEPTDEEWELIKTVTEAHVATNAQGSHWKQKRK 190 200 210 220 230 240 200 210 220 230 240 250 pF1KB7 FLPDDIGQSPIVSMPDGDKVDLEAFSEFTKIITPAITRVVDFAKKLPMFSELPCEDQIIL :::.::::.:::. :.: ::::::::.:::::::::::::::::::::: :::::::::: CCDS26 FLPEDIGQAPIVNAPEGGKVDLEAFSHFTKIITPAITRVVDFAKKLPMFCELPCEDQIIL 250 260 270 280 290 300 260 270 280 290 300 310 pF1KB7 LKGCCMEIMSLRAAVRYDPESDTLTLSGEMAVKREQLKNGGLGVVSDAIFELGKSLSAFN :::::::::::::::::::::.::::.::::: : :::::::::::::::.:: :::.:: CCDS26 LKGCCMEIMSLRAAVRYDPESETLTLNGEMAVTRGQLKNGGLGVVSDAIFDLGMSLSSFN 310 320 330 340 350 360 320 330 340 350 360 370 pF1KB7 LDDTEVALLQAVLLMSTDRSGLLCVDKIEKSQEAYLLAFEHYVNHRKHNIPHFWPKLLMK ::::::::::::::::.:: :: ::..::: :...:::::::.:.:::.. ::::::::: CCDS26 LDDTEVALLQAVLLMSSDRPGLACVERIEKYQDSFLLAFEHYINYRKHHVTHFWPKLLMK 370 380 390 400 410 420 380 390 400 410 420 430 pF1KB7 EREVQSSILYKGAAAEGRPGGSLGVHPEGQQLLGMHVVQGPQVRQLEQQLGEAGSLQGPV CCDS26 VTDLRMIGACHASRFLHMKVECPTELFPPLFLEVFED 430 440 450 460 >>CCDS44585.1 NR1H3 gene_id:10062|Hs108|chr11 (402 aa) initn: 573 init1: 195 opt: 656 Z-score: 679.7 bits: 134.9 E(32554): 1.5e-31 Smith-Waterman score: 656; 34.2% identity (67.0% similar) in 336 aa overlap (41-370:42-365) 20 30 40 50 60 70 pF1KB7 GSDPEENSARSPDGKRKRKNGQCSLKTSMSGYIPSYLDKDEQCVVCGDKATGYHYRCITC : :..: .: : ::::::.:.:: ..: CCDS44 GLEAAEPTALLTRAEPPSEPTEIRPQKRKKGPAPKMLG-NELCSVCGDKASGFHYNVLSC 20 30 40 50 60 70 80 90 100 110 120 130 pF1KB7 EGCKGFFRRTIQKNLHPTYSCKYDSCCVIDKITRNQCQLCRFKKCIAVGMAMDLVLDDSK :::::::::.. :. : : :. . : .: : .:: ::..:: .:: . ::.. . CCDS44 EGCKGFFRRSVIKGAH--YICHSGGHCPMDTYMRRKCQECRLRKCRQAGMREECVLSE-E 80 90 100 110 120 140 150 160 170 180 pF1KB7 RVAKRKLIEQNRERRRKEEMI-RSL---QQRPEPTPEEWDLIHIATEAHRSTNAQGSHWK .. .:: .:..:. . . :. : :. .::. .:. . :... : .. .. CCDS44 QIRLKKLKRQEEEQAHATSLPPRASSPPQILPQLSPEQLGMIEKLVAAQQQCNRRS--FS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 QRRKFLPDDIGQSPIVSMPDGDKVDLEAFSEFTKIITPAITRVVDFAKKLPMFSELPCED .: . : :.. : . .. . :..::.. .. ..:::::.:: : .: :: CCDS44 DRLRVTP-----WPMAPDPHSREARQQRFAHFTELAIVSVQEIVDFAKQLPGFLQLSRED 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 QIILLKGCCMEIMSLRAAVRYDPESDTLTLSGEMAVKREQLKNGGLGV-VSDAIFELGKS :: ::: .:.: :... ::.: :...:. ... .::.. ..:: : . :::.... CCDS44 QIALLKTSAIEVMLLETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFINPIFEFSRA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 LSAFNLDDTEVALLQAVLLMSTDRSGLLCVDKIEKSQEAYLLAFEHYVN-HRKHNIPHFW .. ..:.:.: ::: :. ..:.:: .. ..:. :..:. :.. ::. :. :. : CCDS44 MNELQLNDAEFALLIAISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIHHPHDRLMF- 310 320 330 340 350 370 380 390 400 410 420 pF1KB7 PKLLMKEREVQSSILYKGAAAEGRPGGSLGVHPEGQQLLGMHVVQGPQVRQLEQQLGEAG :..::: CCDS44 PRMLMKLVSLRTLSSVHSEQVFALRLQDKKLPPLLSEIWDVHE 360 370 380 390 400 >>CCDS7929.1 NR1H3 gene_id:10062|Hs108|chr11 (447 aa) initn: 551 init1: 195 opt: 656 Z-score: 679.1 bits: 135.0 E(32554): 1.7e-31 Smith-Waterman score: 656; 34.2% identity (67.0% similar) in 336 aa overlap (41-370:87-410) 20 30 40 50 60 70 pF1KB7 GSDPEENSARSPDGKRKRKNGQCSLKTSMSGYIPSYLDKDEQCVVCGDKATGYHYRCITC : :..: .: : ::::::.:.:: ..: CCDS79 GLEAAEPTALLTRAEPPSEPTEIRPQKRKKGPAPKMLG-NELCSVCGDKASGFHYNVLSC 60 70 80 90 100 110 80 90 100 110 120 130 pF1KB7 EGCKGFFRRTIQKNLHPTYSCKYDSCCVIDKITRNQCQLCRFKKCIAVGMAMDLVLDDSK :::::::::.. :. : : :. . : .: : .:: ::..:: .:: . ::.. . CCDS79 EGCKGFFRRSVIKGAH--YICHSGGHCPMDTYMRRKCQECRLRKCRQAGMREECVLSE-E 120 130 140 150 160 170 140 150 160 170 180 pF1KB7 RVAKRKLIEQNRERRRKEEMI-RSL---QQRPEPTPEEWDLIHIATEAHRSTNAQGSHWK .. .:: .:..:. . . :. : :. .::. .:. . :... : .. .. CCDS79 QIRLKKLKRQEEEQAHATSLPPRASSPPQILPQLSPEQLGMIEKLVAAQQQCNRRS--FS 180 190 200 210 220 230 190 200 210 220 230 240 pF1KB7 QRRKFLPDDIGQSPIVSMPDGDKVDLEAFSEFTKIITPAITRVVDFAKKLPMFSELPCED .: . : :.. : . .. . :..::.. .. ..:::::.:: : .: :: CCDS79 DRLRVTP-----WPMAPDPHSREARQQRFAHFTELAIVSVQEIVDFAKQLPGFLQLSRED 240 250 260 270 280 250 260 270 280 290 300 pF1KB7 QIILLKGCCMEIMSLRAAVRYDPESDTLTLSGEMAVKREQLKNGGLGV-VSDAIFELGKS :: ::: .:.: :... ::.: :...:. ... .::.. ..:: : . :::.... CCDS79 QIALLKTSAIEVMLLETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFINPIFEFSRA 290 300 310 320 330 340 310 320 330 340 350 360 pF1KB7 LSAFNLDDTEVALLQAVLLMSTDRSGLLCVDKIEKSQEAYLLAFEHYVN-HRKHNIPHFW .. ..:.:.: ::: :. ..:.:: .. ..:. :..:. :.. ::. :. :. : CCDS79 MNELQLNDAEFALLIAISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIHHPHDRLMF- 350 360 370 380 390 400 370 380 390 400 410 420 pF1KB7 PKLLMKEREVQSSILYKGAAAEGRPGGSLGVHPEGQQLLGMHVVQGPQVRQLEQQLGEAG :..::: CCDS79 PRMLMKLVSLRTLSSVHSEQVFALRLQDKKLPPLLSEIWDVHE 410 420 430 440 >>CCDS73285.1 NR1H3 gene_id:10062|Hs108|chr11 (453 aa) initn: 551 init1: 195 opt: 656 Z-score: 679.0 bits: 135.0 E(32554): 1.7e-31 Smith-Waterman score: 656; 34.2% identity (67.0% similar) in 336 aa overlap (41-370:93-416) 20 30 40 50 60 70 pF1KB7 GSDPEENSARSPDGKRKRKNGQCSLKTSMSGYIPSYLDKDEQCVVCGDKATGYHYRCITC : :..: .: : ::::::.:.:: ..: CCDS73 GLEAAEPTALLTRAEPPSEPTEIRPQKRKKGPAPKMLG-NELCSVCGDKASGFHYNVLSC 70 80 90 100 110 120 80 90 100 110 120 130 pF1KB7 EGCKGFFRRTIQKNLHPTYSCKYDSCCVIDKITRNQCQLCRFKKCIAVGMAMDLVLDDSK :::::::::.. :. : : :. . : .: : .:: ::..:: .:: . ::.. . CCDS73 EGCKGFFRRSVIKGAH--YICHSGGHCPMDTYMRRKCQECRLRKCRQAGMREECVLSE-E 130 140 150 160 170 140 150 160 170 180 pF1KB7 RVAKRKLIEQNRERRRKEEMI-RSL---QQRPEPTPEEWDLIHIATEAHRSTNAQGSHWK .. .:: .:..:. . . :. : :. .::. .:. . :... : .. .. CCDS73 QIRLKKLKRQEEEQAHATSLPPRASSPPQILPQLSPEQLGMIEKLVAAQQQCNRRS--FS 180 190 200 210 220 230 190 200 210 220 230 240 pF1KB7 QRRKFLPDDIGQSPIVSMPDGDKVDLEAFSEFTKIITPAITRVVDFAKKLPMFSELPCED .: . : :.. : . .. . :..::.. .. ..:::::.:: : .: :: CCDS73 DRLRVTP-----WPMAPDPHSREARQQRFAHFTELAIVSVQEIVDFAKQLPGFLQLSRED 240 250 260 270 280 290 250 260 270 280 290 300 pF1KB7 QIILLKGCCMEIMSLRAAVRYDPESDTLTLSGEMAVKREQLKNGGLGV-VSDAIFELGKS :: ::: .:.: :... ::.: :...:. ... .::.. ..:: : . :::.... CCDS73 QIALLKTSAIEVMLLETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFINPIFEFSRA 300 310 320 330 340 350 310 320 330 340 350 360 pF1KB7 LSAFNLDDTEVALLQAVLLMSTDRSGLLCVDKIEKSQEAYLLAFEHYVN-HRKHNIPHFW .. ..:.:.: ::: :. ..:.:: .. ..:. :..:. :.. ::. :. :. : CCDS73 MNELQLNDAEFALLIAISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIHHPHDRLMF- 360 370 380 390 400 410 370 380 390 400 410 420 pF1KB7 PKLLMKEREVQSSILYKGAAAEGRPGGSLGVHPEGQQLLGMHVVQGPQVRQLEQQLGEAG :..::: CCDS73 PRMLMKLVSLRTLSSVHSEQVFALRLQDKKLPPLLSEIWDVHE 420 430 440 450 >>CCDS55873.1 NR1H4 gene_id:9971|Hs108|chr12 (476 aa) initn: 506 init1: 216 opt: 542 Z-score: 561.4 bits: 113.3 E(32554): 6e-25 Smith-Waterman score: 555; 33.7% identity (58.3% similar) in 338 aa overlap (50-363:124-434) 20 30 40 50 60 70 pF1KB7 RSPDGKRKRKNGQCSLKTSMSGYIPSYLDKDEQCVVCGDKATGYHYRCITCEGCKGFFRR :: ::::::.:.:::: .::::::::::: CCDS55 ETLYQGETEVAEMPVTKKPRMGASAGRIKGDELCVVCGDRASGYHYNALTCEGCKGFFRR 100 110 120 130 140 150 80 90 100 110 120 130 pF1KB7 TIQKNLHPTYSCKYDSCCVIDKITRNQCQLCRFKKCIAVGMAMDLVLDD--------SKR .: :: .:.:: . ::.: : .:: ::..:: .:: . . ::: CCDS55 SITKN--AVYKCKNGGNCVMDMYMRRKCQECRLRKCKEMGMLAECMYTGLLTEIQCKSKR 160 170 180 190 200 210 140 150 160 170 180 pF1KB7 VAKRKLIEQN-----------RERRRKEEMIRSLQQRPEPTPEEWDLIHIATEAHRSTNA . :: ..:. :. :. .: ... : ::.. :.:. . CCDS55 L--RKNVKQHADQTVNEDSEGRDLRQVTSTTKSCREKTELTPDQQTLLHFIMD------- 220 230 240 250 260 190 200 210 220 230 240 pF1KB7 QGSHWKQRRKFLPDDIGQSPIVSMPDGDKVDLEAFSEFTKIITPAITRVVDFAKKLPMFS :. ::: .:..: .. . ... : : .:.. : . .:.:.:::: :. CCDS55 --SYNKQR---MPQEITNKILKEEFSAE----ENFLILTEMATNHVQVLVEFTKKLPGFQ 270 280 290 300 310 250 260 270 280 290 pF1KB7 ELPCEDQIILLKGCCMEIMSLRAAVRYDPESDTLTLSGEMAVKREQLKNGGLGVVSDA-- : :::: :::: .: : ::.: .. . ::. . .:...:.: .:: CCDS55 TLDHEDQIALLKGSAVEAMFLRSAEIFNKKLP----SGHSDLLEERIRNSG---ISDEYI 320 330 340 350 360 300 310 320 330 340 350 pF1KB7 --IFELGKSLSAFNLDDTEVALLQAVLLMSTDRSGLLCVDKIEKSQEAYLLAFEHYVN-H .: . ::.. ... . : ::: :....: ::. . . .:: :: : .... . : CCDS55 TPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEPLLDVLQKLCKIH 370 380 390 400 410 420 360 370 380 390 400 410 pF1KB7 RKHNIPHFWPKLLMKEREVQSSILYKGAAAEGRPGGSLGVHPEGQQLLGMHVVQGPQVRQ . .: :: CCDS55 QPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCEIWDVQ 430 440 450 460 470 >>CCDS55876.1 NR1H4 gene_id:9971|Hs108|chr12 (486 aa) initn: 506 init1: 216 opt: 542 Z-score: 561.3 bits: 113.3 E(32554): 6.1e-25 Smith-Waterman score: 555; 33.7% identity (58.3% similar) in 338 aa overlap (50-363:134-444) 20 30 40 50 60 70 pF1KB7 RSPDGKRKRKNGQCSLKTSMSGYIPSYLDKDEQCVVCGDKATGYHYRCITCEGCKGFFRR :: ::::::.:.:::: .::::::::::: CCDS55 ETLYQGETEVAEMPVTKKPRMGASAGRIKGDELCVVCGDRASGYHYNALTCEGCKGFFRR 110 120 130 140 150 160 80 90 100 110 120 130 pF1KB7 TIQKNLHPTYSCKYDSCCVIDKITRNQCQLCRFKKCIAVGMAMDLVLDD--------SKR .: :: .:.:: . ::.: : .:: ::..:: .:: . . ::: CCDS55 SITKN--AVYKCKNGGNCVMDMYMRRKCQECRLRKCKEMGMLAECMYTGLLTEIQCKSKR 170 180 190 200 210 220 140 150 160 170 180 pF1KB7 VAKRKLIEQN-----------RERRRKEEMIRSLQQRPEPTPEEWDLIHIATEAHRSTNA . :: ..:. :. :. .: ... : ::.. :.:. . CCDS55 L--RKNVKQHADQTVNEDSEGRDLRQVTSTTKSCREKTELTPDQQTLLHFIMD------- 230 240 250 260 270 190 200 210 220 230 240 pF1KB7 QGSHWKQRRKFLPDDIGQSPIVSMPDGDKVDLEAFSEFTKIITPAITRVVDFAKKLPMFS :. ::: .:..: .. . ... : : .:.. : . .:.:.:::: :. CCDS55 --SYNKQR---MPQEITNKILKEEFSAE----ENFLILTEMATNHVQVLVEFTKKLPGFQ 280 290 300 310 320 250 260 270 280 290 pF1KB7 ELPCEDQIILLKGCCMEIMSLRAAVRYDPESDTLTLSGEMAVKREQLKNGGLGVVSDA-- : :::: :::: .: : ::.: .. . ::. . .:...:.: .:: CCDS55 TLDHEDQIALLKGSAVEAMFLRSAEIFNKKLP----SGHSDLLEERIRNSG---ISDEYI 330 340 350 360 370 300 310 320 330 340 350 pF1KB7 --IFELGKSLSAFNLDDTEVALLQAVLLMSTDRSGLLCVDKIEKSQEAYLLAFEHYVN-H .: . ::.. ... . : ::: :....: ::. . . .:: :: : .... . : CCDS55 TPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEPLLDVLQKLCKIH 380 390 400 410 420 430 360 370 380 390 400 410 pF1KB7 RKHNIPHFWPKLLMKEREVQSSILYKGAAAEGRPGGSLGVHPEGQQLLGMHVVQGPQVRQ . .: :: CCDS55 QPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCEIWDVQ 440 450 460 470 480 >>CCDS9078.1 NR1H4 gene_id:9971|Hs108|chr12 (472 aa) initn: 516 init1: 216 opt: 530 Z-score: 549.1 bits: 111.0 E(32554): 2.9e-24 Smith-Waterman score: 572; 34.4% identity (59.6% similar) in 334 aa overlap (50-363:124-430) 20 30 40 50 60 70 pF1KB7 RSPDGKRKRKNGQCSLKTSMSGYIPSYLDKDEQCVVCGDKATGYHYRCITCEGCKGFFRR :: ::::::.:.:::: .::::::::::: CCDS90 ETLYQGETEVAEMPVTKKPRMGASAGRIKGDELCVVCGDRASGYHYNALTCEGCKGFFRR 100 110 120 130 140 150 80 90 100 110 120 130 pF1KB7 TIQKNLHPTYSCKYDSCCVIDKITRNQCQLCRFKKCIAVGMAMDLVLDD----SKRVAKR .: :: .:.:: . ::.: : .:: ::..:: .:: . .: . :::. : CCDS90 SITKN--AVYKCKNGGNCVMDMYMRRKCQECRLRKCKEMGMLAECLLTEIQCKSKRL--R 160 170 180 190 200 140 150 160 170 180 pF1KB7 KLIEQN-----------RERRRKEEMIRSLQQRPEPTPEEWDLIHIATEAHRSTNAQGSH : ..:. :. :. .: ... : ::.. :.:. . :. CCDS90 KNVKQHADQTVNEDSEGRDLRQVTSTTKSCREKTELTPDQQTLLHFIMD---------SY 210 220 230 240 250 260 190 200 210 220 230 240 pF1KB7 WKQRRKFLPDDIGQSPIVSMPDGDKVDLEAFSEFTKIITPAITRVVDFAKKLPMFSELPC ::: .:..: .. . ... : : .:.. : . .:.:.:::: :. : CCDS90 NKQR---MPQEITNKILKEEFSAE----ENFLILTEMATNHVQVLVEFTKKLPGFQTLDH 270 280 290 300 310 250 260 270 280 290 300 pF1KB7 EDQIILLKGCCMEIMSLRAAVRYDPESDTLTLSGEMAVKREQLKNGGLGVVSDA----IF :::: :::: .: : ::.: .. . ::. . .:...:.: .:: .: CCDS90 EDQIALLKGSAVEAMFLRSAEIFNKKLP----SGHSDLLEERIRNSG---ISDEYITPMF 320 330 340 350 360 310 320 330 340 350 pF1KB7 ELGKSLSAFNLDDTEVALLQAVLLMSTDRSGLLCVDKIEKSQEAYLLAFEHYVN-HRKHN . ::.. ... . : ::: :....: ::. . . .:: :: : .... . :. .: CCDS90 SFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEPLLDVLQKLCKIHQPEN 370 380 390 400 410 420 360 370 380 390 400 410 pF1KB7 IPHFWPKLLMKEREVQSSILYKGAAAEGRPGGSLGVHPEGQQLLGMHVVQGPQVRQLEQQ :: CCDS90 PQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCEIWDVQ 430 440 450 460 470 490 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 01:52:24 2016 done: Sat Nov 5 01:52:25 2016 Total Scan time: 3.010 Total Display time: 0.060 Function used was FASTA [36.3.4 Apr, 2011]