FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB3732, 461 aa 1>>>pF1KB3732 461 - 461 aa - 461 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.1162+/-0.000943; mu= 14.5354+/- 0.057 mean_var=95.3133+/-18.988, 0's: 0 Z-trim(107.5): 124 B-trim: 0 in 0/52 Lambda= 0.131370 statistics sampled from 9505 (9629) to 9505 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.67), E-opt: 0.2 (0.296), width: 16 Scan time: 3.040 The best scores are: opt bits E(32554) CCDS2641.1 THRB gene_id:7068|Hs108|chr3 ( 461) 3173 611.8 4.7e-175 CCDS42316.1 THRA gene_id:7067|Hs108|chr17 ( 410) 2178 423.2 2.5e-118 CCDS58546.1 THRA gene_id:7067|Hs108|chr17 ( 451) 1923 374.9 9.6e-104 CCDS11360.1 THRA gene_id:7067|Hs108|chr17 ( 490) 1918 374.0 2e-103 CCDS73285.1 NR1H3 gene_id:10062|Hs108|chr11 ( 453) 755 153.5 4.2e-37 CCDS44585.1 NR1H3 gene_id:10062|Hs108|chr11 ( 402) 747 152.0 1.1e-36 CCDS7929.1 NR1H3 gene_id:10062|Hs108|chr11 ( 447) 747 152.0 1.2e-36 CCDS54627.1 NR1I2 gene_id:8856|Hs108|chr3 ( 397) 616 127.1 3.2e-29 CCDS55873.1 NR1H4 gene_id:9971|Hs108|chr12 ( 476) 578 120.0 5.5e-27 CCDS55876.1 NR1H4 gene_id:9971|Hs108|chr12 ( 486) 578 120.0 5.5e-27 CCDS9078.1 NR1H4 gene_id:9971|Hs108|chr12 ( 472) 557 116.0 8.5e-26 CCDS55875.1 NR1H4 gene_id:9971|Hs108|chr12 ( 482) 557 116.0 8.7e-26 CCDS42317.1 RARA gene_id:5914|Hs108|chr17 ( 457) 504 105.9 8.8e-23 CCDS11366.1 RARA gene_id:5914|Hs108|chr17 ( 462) 504 105.9 8.9e-23 CCDS2642.1 RARB gene_id:5915|Hs108|chr3 ( 448) 502 105.6 1.1e-22 CCDS46775.1 RARB gene_id:5915|Hs108|chr3 ( 336) 500 105.1 1.2e-22 CCDS58236.1 RARG gene_id:5916|Hs108|chr12 ( 382) 497 104.6 1.9e-22 CCDS58237.1 RARG gene_id:5916|Hs108|chr12 ( 432) 497 104.6 2.1e-22 CCDS41790.1 RARG gene_id:5916|Hs108|chr12 ( 443) 497 104.6 2.2e-22 CCDS8850.1 RARG gene_id:5916|Hs108|chr12 ( 454) 497 104.6 2.2e-22 CCDS45671.1 RARA gene_id:5914|Hs108|chr17 ( 365) 490 103.2 4.6e-22 CCDS58673.1 NR1H2 gene_id:7376|Hs108|chr19 ( 363) 394 85.0 1.4e-16 CCDS3772.1 NR3C2 gene_id:4306|Hs108|chr4 ( 984) 397 85.9 2.1e-16 CCDS8757.1 VDR gene_id:7421|Hs108|chr12 ( 427) 375 81.5 1.9e-15 CCDS55820.1 VDR gene_id:7421|Hs108|chr12 ( 477) 375 81.5 2.1e-15 CCDS41429.1 NR1I3 gene_id:9970|Hs108|chr1 ( 357) 367 79.9 4.7e-15 CCDS10179.1 RORA gene_id:6095|Hs108|chr15 ( 556) 364 79.5 1e-14 CCDS44584.1 NR1H3 gene_id:10062|Hs108|chr11 ( 387) 361 78.8 1.1e-14 CCDS5234.1 ESR1 gene_id:2099|Hs108|chr6 ( 595) 362 79.1 1.4e-14 CCDS43136.1 NR1I2 gene_id:8856|Hs108|chr3 ( 434) 357 78.1 2.1e-14 CCDS60383.1 NR5A2 gene_id:2494|Hs108|chr1 ( 469) 357 78.1 2.2e-14 CCDS2995.1 NR1I2 gene_id:8856|Hs108|chr3 ( 473) 357 78.1 2.2e-14 CCDS1400.1 NR5A2 gene_id:2494|Hs108|chr1 ( 495) 357 78.1 2.3e-14 CCDS1401.1 NR5A2 gene_id:2494|Hs108|chr1 ( 541) 357 78.1 2.5e-14 CCDS42593.1 NR1H2 gene_id:7376|Hs108|chr19 ( 460) 355 77.7 2.8e-14 CCDS68131.1 HNF4A gene_id:3172|Hs108|chr20 ( 395) 353 77.3 3.2e-14 CCDS10178.1 RORA gene_id:6095|Hs108|chr15 ( 548) 355 77.8 3.2e-14 CCDS45271.1 RORA gene_id:6095|Hs108|chr15 ( 468) 354 77.5 3.2e-14 CCDS13331.1 HNF4A gene_id:3172|Hs108|chr20 ( 417) 353 77.3 3.4e-14 CCDS46604.1 HNF4A gene_id:3172|Hs108|chr20 ( 442) 353 77.3 3.5e-14 CCDS10177.1 RORA gene_id:6095|Hs108|chr15 ( 523) 354 77.6 3.5e-14 CCDS74728.1 HNF4A gene_id:3172|Hs108|chr20 ( 449) 353 77.3 3.6e-14 CCDS42876.1 HNF4A gene_id:3172|Hs108|chr20 ( 452) 353 77.3 3.6e-14 CCDS46605.1 HNF4A gene_id:3172|Hs108|chr20 ( 464) 353 77.3 3.7e-14 CCDS13330.1 HNF4A gene_id:3172|Hs108|chr20 ( 474) 353 77.3 3.7e-14 CCDS6856.1 NR5A1 gene_id:2516|Hs108|chr9 ( 461) 352 77.1 4.2e-14 CCDS41821.1 NR2C1 gene_id:7181|Hs108|chr12 ( 467) 348 76.4 7.1e-14 CCDS44953.1 NR2C1 gene_id:7181|Hs108|chr12 ( 483) 348 76.4 7.3e-14 CCDS53405.1 NR1I3 gene_id:9970|Hs108|chr1 ( 296) 345 75.7 7.3e-14 CCDS44262.1 NR1I3 gene_id:9970|Hs108|chr1 ( 309) 345 75.7 7.6e-14 >>CCDS2641.1 THRB gene_id:7068|Hs108|chr3 (461 aa) initn: 3173 init1: 3173 opt: 3173 Z-score: 3256.3 bits: 611.8 E(32554): 4.7e-175 Smith-Waterman score: 3173; 100.0% identity (100.0% similar) in 461 aa overlap (1-461:1-461) 10 20 30 40 50 60 pF1KB3 MTPNSMTENGLTAWDKPKHCPDREHDWKLVGMSEACLHRKSHSERRSTLKNEQSSPHLIQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS26 MTPNSMTENGLTAWDKPKHCPDREHDWKLVGMSEACLHRKSHSERRSTLKNEQSSPHLIQ 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB3 TTWTSSIFHLDHDDVNDQSVSSAQTFQTEEKKCKGYIPSYLDKDELCVVCGDKATGYHYR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS26 TTWTSSIFHLDHDDVNDQSVSSAQTFQTEEKKCKGYIPSYLDKDELCVVCGDKATGYHYR 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB3 CITCEGCKGFFRRTIQKNLHPSYSCKYEGKCVIDKVTRNQCQECRFKKCIYVGMATDLVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS26 CITCEGCKGFFRRTIQKNLHPSYSCKYEGKCVIDKVTRNQCQECRFKKCIYVGMATDLVL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB3 DDSKRLAKRKLIEENREKRRREELQKSIGHKPEPTDEEWELIKTVTEAHVATNAQGSHWK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS26 DDSKRLAKRKLIEENREKRRREELQKSIGHKPEPTDEEWELIKTVTEAHVATNAQGSHWK 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB3 QKRKFLPEDIGQAPIVNAPEGGKVDLEAFSHFTKIITPAITRVVDFAKKLPMFCELPCED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS26 QKRKFLPEDIGQAPIVNAPEGGKVDLEAFSHFTKIITPAITRVVDFAKKLPMFCELPCED 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB3 QIILLKGCCMEIMSLRAAVRYDPESETLTLNGEMAVTRGQLKNGGLGVVSDAIFDLGMSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS26 QIILLKGCCMEIMSLRAAVRYDPESETLTLNGEMAVTRGQLKNGGLGVVSDAIFDLGMSL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB3 SSFNLDDTEVALLQAVLLMSSDRPGLACVERIEKYQDSFLLAFEHYINYRKHHVTHFWPK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS26 SSFNLDDTEVALLQAVLLMSSDRPGLACVERIEKYQDSFLLAFEHYINYRKHHVTHFWPK 370 380 390 400 410 420 430 440 450 460 pF1KB3 LLMKVTDLRMIGACHASRFLHMKVECPTELFPPLFLEVFED ::::::::::::::::::::::::::::::::::::::::: CCDS26 LLMKVTDLRMIGACHASRFLHMKVECPTELFPPLFLEVFED 430 440 450 460 >>CCDS42316.1 THRA gene_id:7067|Hs108|chr17 (410 aa) initn: 2178 init1: 2178 opt: 2178 Z-score: 2237.8 bits: 423.2 E(32554): 2.5e-118 Smith-Waterman score: 2178; 84.5% identity (94.6% similar) in 367 aa overlap (95-461:41-407) 70 80 90 100 110 120 pF1KB3 SSIFHLDHDDVNDQSVSSAQTFQTEEKKCKGYIPSYLDKDELCVVCGDKATGYHYRCITC ::::::::::: :::::::::::::::::: CCDS42 GSDPEENSARSPDGKRKRKNGQCSLKTSMSGYIPSYLDKDEQCVVCGDKATGYHYRCITC 20 30 40 50 60 70 130 140 150 160 170 180 pF1KB3 EGCKGFFRRTIQKNLHPSYSCKYEGKCVIDKVTRNQCQECRFKKCIYVGMATDLVLDDSK :::::::::::::::::.:::::.. :::::.:::::: ::::::: :::: :::::::: CCDS42 EGCKGFFRRTIQKNLHPTYSCKYDSCCVIDKITRNQCQLCRFKKCIAVGMAMDLVLDDSK 80 90 100 110 120 130 190 200 210 220 230 240 pF1KB3 RLAKRKLIEENREKRRREELQKSIGHKPEPTDEEWELIKTVTEAHVATNAQGSHWKQKRK :.:::::::.:::.::.::. .:. ..:::: :::.::. .:::: .::::::::::.:: CCDS42 RVAKRKLIEQNRERRRKEEMIRSLQQRPEPTPEEWDLIHIATEAHRSTNAQGSHWKQRRK 140 150 160 170 180 190 250 260 270 280 290 300 pF1KB3 FLPEDIGQAPIVNAPEGGKVDLEAFSHFTKIITPAITRVVDFAKKLPMFCELPCEDQIIL :::.::::.:::. :.: ::::::::.:::::::::::::::::::::: :::::::::: CCDS42 FLPDDIGQSPIVSMPDGDKVDLEAFSEFTKIITPAITRVVDFAKKLPMFSELPCEDQIIL 200 210 220 230 240 250 310 320 330 340 350 360 pF1KB3 LKGCCMEIMSLRAAVRYDPESETLTLNGEMAVTRGQLKNGGLGVVSDAIFDLGMSLSSFN :::::::::::::::::::::.::::.::::: : :::::::::::::::.:: :::.:: CCDS42 LKGCCMEIMSLRAAVRYDPESDTLTLSGEMAVKREQLKNGGLGVVSDAIFELGKSLSAFN 260 270 280 290 300 310 370 380 390 400 410 420 pF1KB3 LDDTEVALLQAVLLMSSDRPGLACVERIEKYQDSFLLAFEHYINYRKHHVTHFWPKLLMK ::::::::::::::::.:: :: ::..::: :...:::::::.:.:::.. ::::::::: CCDS42 LDDTEVALLQAVLLMSTDRSGLLCVDKIEKSQEAYLLAFEHYVNHRKHNIPHFWPKLLMK 320 330 340 350 360 370 430 440 450 460 pF1KB3 VTDLRMIGACHASRFLHMKVECPTELFPPLFLEVFED ::::::::::::::::::::::::::::::::::::: CCDS42 VTDLRMIGACHASRFLHMKVECPTELFPPLFLEVFEDQEV 380 390 400 410 >>CCDS58546.1 THRA gene_id:7067|Hs108|chr17 (451 aa) initn: 1918 init1: 1918 opt: 1923 Z-score: 1976.0 bits: 374.9 E(32554): 9.6e-104 Smith-Waterman score: 1923; 81.3% identity (93.5% similar) in 337 aa overlap (95-431:41-377) 70 80 90 100 110 120 pF1KB3 SSIFHLDHDDVNDQSVSSAQTFQTEEKKCKGYIPSYLDKDELCVVCGDKATGYHYRCITC ::::::::::: :::::::::::::::::: CCDS58 GSDPEENSARSPDGKRKRKNGQCSLKTSMSGYIPSYLDKDEQCVVCGDKATGYHYRCITC 20 30 40 50 60 70 130 140 150 160 170 180 pF1KB3 EGCKGFFRRTIQKNLHPSYSCKYEGKCVIDKVTRNQCQECRFKKCIYVGMATDLVLDDSK :::::::::::::::::.:::::.. :::::.:::::: ::::::: :::: :::::::: CCDS58 EGCKGFFRRTIQKNLHPTYSCKYDSCCVIDKITRNQCQLCRFKKCIAVGMAMDLVLDDSK 80 90 100 110 120 130 190 200 210 220 230 240 pF1KB3 RLAKRKLIEENREKRRREELQKSIGHKPEPTDEEWELIKTVTEAHVATNAQGSHWKQKRK :.:::::::.:::.::.::. .:. ..:::: :::.::. .:::: .::::::::::.:: CCDS58 RVAKRKLIEQNRERRRKEEMIRSLQQRPEPTPEEWDLIHIATEAHRSTNAQGSHWKQRRK 140 150 160 170 180 190 250 260 270 280 290 300 pF1KB3 FLPEDIGQAPIVNAPEGGKVDLEAFSHFTKIITPAITRVVDFAKKLPMFCELPCEDQIIL :::.::::.:::. :.: ::::::::.:::::::::::::::::::::: :::::::::: CCDS58 FLPDDIGQSPIVSMPDGDKVDLEAFSEFTKIITPAITRVVDFAKKLPMFSELPCEDQIIL 200 210 220 230 240 250 310 320 330 340 350 360 pF1KB3 LKGCCMEIMSLRAAVRYDPESETLTLNGEMAVTRGQLKNGGLGVVSDAIFDLGMSLSSFN :::::::::::::::::::::.::::.::::: : :::::::::::::::.:: :::.:: CCDS58 LKGCCMEIMSLRAAVRYDPESDTLTLSGEMAVKREQLKNGGLGVVSDAIFELGKSLSAFN 260 270 280 290 300 310 370 380 390 400 410 420 pF1KB3 LDDTEVALLQAVLLMSSDRPGLACVERIEKYQDSFLLAFEHYINYRKHHVTHFWPKLLMK ::::::::::::::::.:: :: ::..::: :...:::::::.:.:::.. ::::::::: CCDS58 LDDTEVALLQAVLLMSTDRSGLLCVDKIEKSQEAYLLAFEHYVNHRKHNIPHFWPKLLMK 320 330 340 350 360 370 430 440 450 460 pF1KB3 VTDLRMIGACHASRFLHMKVECPTELFPPLFLEVFED ..:.. CCDS58 GPQVRQLEQQLGEAGSLQGPVLQHQSPKSPQQRLLELLHRSGILHARAVCGEDDSSEADS 380 390 400 410 420 430 >>CCDS11360.1 THRA gene_id:7067|Hs108|chr17 (490 aa) initn: 1918 init1: 1918 opt: 1918 Z-score: 1970.4 bits: 374.0 E(32554): 2e-103 Smith-Waterman score: 1918; 82.7% identity (93.9% similar) in 330 aa overlap (95-424:41-370) 70 80 90 100 110 120 pF1KB3 SSIFHLDHDDVNDQSVSSAQTFQTEEKKCKGYIPSYLDKDELCVVCGDKATGYHYRCITC ::::::::::: :::::::::::::::::: CCDS11 GSDPEENSARSPDGKRKRKNGQCSLKTSMSGYIPSYLDKDEQCVVCGDKATGYHYRCITC 20 30 40 50 60 70 130 140 150 160 170 180 pF1KB3 EGCKGFFRRTIQKNLHPSYSCKYEGKCVIDKVTRNQCQECRFKKCIYVGMATDLVLDDSK :::::::::::::::::.:::::.. :::::.:::::: ::::::: :::: :::::::: CCDS11 EGCKGFFRRTIQKNLHPTYSCKYDSCCVIDKITRNQCQLCRFKKCIAVGMAMDLVLDDSK 80 90 100 110 120 130 190 200 210 220 230 240 pF1KB3 RLAKRKLIEENREKRRREELQKSIGHKPEPTDEEWELIKTVTEAHVATNAQGSHWKQKRK :.:::::::.:::.::.::. .:. ..:::: :::.::. .:::: .::::::::::.:: CCDS11 RVAKRKLIEQNRERRRKEEMIRSLQQRPEPTPEEWDLIHIATEAHRSTNAQGSHWKQRRK 140 150 160 170 180 190 250 260 270 280 290 300 pF1KB3 FLPEDIGQAPIVNAPEGGKVDLEAFSHFTKIITPAITRVVDFAKKLPMFCELPCEDQIIL :::.::::.:::. :.: ::::::::.:::::::::::::::::::::: :::::::::: CCDS11 FLPDDIGQSPIVSMPDGDKVDLEAFSEFTKIITPAITRVVDFAKKLPMFSELPCEDQIIL 200 210 220 230 240 250 310 320 330 340 350 360 pF1KB3 LKGCCMEIMSLRAAVRYDPESETLTLNGEMAVTRGQLKNGGLGVVSDAIFDLGMSLSSFN :::::::::::::::::::::.::::.::::: : :::::::::::::::.:: :::.:: CCDS11 LKGCCMEIMSLRAAVRYDPESDTLTLSGEMAVKREQLKNGGLGVVSDAIFELGKSLSAFN 260 270 280 290 300 310 370 380 390 400 410 420 pF1KB3 LDDTEVALLQAVLLMSSDRPGLACVERIEKYQDSFLLAFEHYINYRKHHVTHFWPKLLMK ::::::::::::::::.:: :: ::..::: :...:::::::.:.:::.. ::::::::: CCDS11 LDDTEVALLQAVLLMSTDRSGLLCVDKIEKSQEAYLLAFEHYVNHRKHNIPHFWPKLLMK 320 330 340 350 360 370 430 440 450 460 pF1KB3 VTDLRMIGACHASRFLHMKVECPTELFPPLFLEVFED CCDS11 EREVQSSILYKGAAAEGRPGGSLGVHPEGQQLLGMHVVQGPQVRQLEQQLGEAGSLQGPV 380 390 400 410 420 430 >>CCDS73285.1 NR1H3 gene_id:10062|Hs108|chr11 (453 aa) initn: 637 init1: 204 opt: 755 Z-score: 779.6 bits: 153.5 E(32554): 4.2e-37 Smith-Waterman score: 755; 30.2% identity (62.4% similar) in 463 aa overlap (12-460:4-450) 10 20 30 40 50 pF1KB3 MTPNSMTENGLTAWDKP-----KHCPDREHD----WKLVGMSEACLHRKSHSERRSTLKN :.:. : :. : : :. :: : ..: . .. : :.. CCDS73 MQQTSWN-PLGGTCKQPPGRTHSAVELWK-PGAQDASSQAQGGSS--CILRE 10 20 30 40 60 70 80 90 100 110 pF1KB3 EQSSPHLIQTTWTSSIFHLDHDDVNDQSVSSAQTFQTE-EKKCKGYIPSYLDKDELCVVC : :: : .. . . .. .. . . .:. :: :..: .::: :: CCDS73 EARMPHSAGGTAGVGLEAAEPTALLTRAEPPSEPTEIRPQKRKKGPAPKMLG-NELCSVC 50 60 70 80 90 100 120 130 140 150 160 170 pF1KB3 GDKATGYHYRCITCEGCKGFFRRTIQKNLHPSYSCKYEGKCVIDKVTRNQCQECRFKKCI ::::.:.:: ..::::::::::.. :. : : :. :.: .: : .:::::..:: CCDS73 GDKASGFHYNVLSCEGCKGFFRRSVIKGAH--YICHSGGHCPMDTYMRRKCQECRLRKCR 110 120 130 140 150 160 180 190 200 210 220 pF1KB3 YVGMATDLVLDDSK-RLAKRKLIEENREKRRREELQKSIGHK--PEPTDEEWELIKTVTE .:: . ::.. . :: : : ::.. . . : . :. . :. .:. .. CCDS73 QAGMREECVLSEEQIRLKKLKRQEEEQAHATSLPPRASSPPQILPQLSPEQLGMIEKLVA 170 180 190 200 210 220 230 240 250 260 270 280 pF1KB3 AHVATNAQGSHWKQKRKFLPEDIGQAPIVNAPEGGKVDLEAFSHFTKIITPAITRVVDFA :. : .. .... . : :.. :.. .. . :.:::.. .. ..:::: CCDS73 AQQQCNRRS--FSDRLRVTPW-----PMAPDPHSREARQQRFAHFTELAIVSVQEIVDFA 230 240 250 260 270 290 300 310 320 330 340 pF1KB3 KKLPMFCELPCEDQIILLKGCCMEIMSLRAAVRYDPESETLTLNGEMAVTRGQLKNGGLG :.:: : .: :::: ::: .:.: :... ::.: ::..:. ... .: .. ..:: CCDS73 KQLPGFLQLSREDQIALLKTSAIEVMLLETSRRYNPGSESITFLKDFSYNREDFAKAGLQ 280 290 300 310 320 330 350 360 370 380 390 400 pF1KB3 V-VSDAIFDLGMSLSSFNLDDTEVALLQAVLLMSSDRPGLACVERIEKYQDSFLLAFEHY : . ::... ... ..:.:.: ::: :. ..:.:::.. ..:. : ... :.. : CCDS73 VEFINPIFEFSRAMNELQLNDAEFALLIAISIFSADRPNVQDQLQVERLQHTYVEALHAY 340 350 360 370 380 390 410 420 430 440 450 460 pF1KB3 INYRKHHVTHFWPKLLMKVTDLRMIGACHASRFLHMKVECPTELFPPLFLEVFED .. .. : ..:..:::...:: ... :. . . .... . .:::. :... CCDS73 VSIHHPHDRLMFPRMLMKLVSLRTLSSVHSEQVFALRLQ--DKKLPPLLSEIWDVHE 400 410 420 430 440 450 >>CCDS44585.1 NR1H3 gene_id:10062|Hs108|chr11 (402 aa) initn: 637 init1: 204 opt: 747 Z-score: 772.2 bits: 152.0 E(32554): 1.1e-36 Smith-Waterman score: 747; 32.8% identity (66.9% similar) in 375 aa overlap (90-460:37-399) 60 70 80 90 100 110 pF1KB3 QTTWTSSIFHLDHDDVNDQSVSSAQTFQTEEKKCKGYIPSYLDKDELCVVCGDKATGYHY .:. :: :..: .::: ::::::.:.:: CCDS44 GTAGVGLEAAEPTALLTRAEPPSEPTEIRPQKRKKGPAPKMLG-NELCSVCGDKASGFHY 10 20 30 40 50 60 120 130 140 150 160 170 pF1KB3 RCITCEGCKGFFRRTIQKNLHPSYSCKYEGKCVIDKVTRNQCQECRFKKCIYVGMATDLV ..::::::::::.. :. : : :. :.: .: : .:::::..:: .:: . : CCDS44 NVLSCEGCKGFFRRSVIKGAH--YICHSGGHCPMDTYMRRKCQECRLRKCRQAGMREECV 70 80 90 100 110 120 180 190 200 210 220 230 pF1KB3 LDDSK-RLAKRKLIEENREKRRREELQKSIGHK--PEPTDEEWELIKTVTEAHVATNAQG :.. . :: : : ::.. . . : . :. . :. .:. .. :. : .. CCDS44 LSEEQIRLKKLKRQEEEQAHATSLPPRASSPPQILPQLSPEQLGMIEKLVAAQQQCNRRS 130 140 150 160 170 180 240 250 260 270 280 290 pF1KB3 SHWKQKRKFLPEDIGQAPIVNAPEGGKVDLEAFSHFTKIITPAITRVVDFAKKLPMFCEL .... . : :.. :.. .. . :.:::.. .. ..:::::.:: : .: CCDS44 --FSDRLRVTPW-----PMAPDPHSREARQQRFAHFTELAIVSVQEIVDFAKQLPGFLQL 190 200 210 220 230 300 310 320 330 340 350 pF1KB3 PCEDQIILLKGCCMEIMSLRAAVRYDPESETLTLNGEMAVTRGQLKNGGLGV-VSDAIFD :::: ::: .:.: :... ::.: ::..:. ... .: .. ..:: : . ::. CCDS44 SREDQIALLKTSAIEVMLLETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFINPIFE 240 250 260 270 280 290 360 370 380 390 400 410 pF1KB3 LGMSLSSFNLDDTEVALLQAVLLMSSDRPGLACVERIEKYQDSFLLAFEHYINYRKHHVT .. ... ..:.:.: ::: :. ..:.:::.. ..:. : ... :.. :.. .. : CCDS44 FSRAMNELQLNDAEFALLIAISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIHHPHDR 300 310 320 330 340 350 420 430 440 450 460 pF1KB3 HFWPKLLMKVTDLRMIGACHASRFLHMKVECPTELFPPLFLEVFED ..:..:::...:: ... :. . . .... . .:::. :... CCDS44 LMFPRMLMKLVSLRTLSSVHSEQVFALRLQ--DKKLPPLLSEIWDVHE 360 370 380 390 400 >>CCDS7929.1 NR1H3 gene_id:10062|Hs108|chr11 (447 aa) initn: 637 init1: 204 opt: 747 Z-score: 771.5 bits: 152.0 E(32554): 1.2e-36 Smith-Waterman score: 747; 32.8% identity (66.9% similar) in 375 aa overlap (90-460:82-444) 60 70 80 90 100 110 pF1KB3 QTTWTSSIFHLDHDDVNDQSVSSAQTFQTEEKKCKGYIPSYLDKDELCVVCGDKATGYHY .:. :: :..: .::: ::::::.:.:: CCDS79 GTAGVGLEAAEPTALLTRAEPPSEPTEIRPQKRKKGPAPKMLG-NELCSVCGDKASGFHY 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB3 RCITCEGCKGFFRRTIQKNLHPSYSCKYEGKCVIDKVTRNQCQECRFKKCIYVGMATDLV ..::::::::::.. :. : : :. :.: .: : .:::::..:: .:: . : CCDS79 NVLSCEGCKGFFRRSVIKGAH--YICHSGGHCPMDTYMRRKCQECRLRKCRQAGMREECV 120 130 140 150 160 180 190 200 210 220 230 pF1KB3 LDDSK-RLAKRKLIEENREKRRREELQKSIGHK--PEPTDEEWELIKTVTEAHVATNAQG :.. . :: : : ::.. . . : . :. . :. .:. .. :. : .. CCDS79 LSEEQIRLKKLKRQEEEQAHATSLPPRASSPPQILPQLSPEQLGMIEKLVAAQQQCNRRS 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB3 SHWKQKRKFLPEDIGQAPIVNAPEGGKVDLEAFSHFTKIITPAITRVVDFAKKLPMFCEL .... . : :.. :.. .. . :.:::.. .. ..:::::.:: : .: CCDS79 --FSDRLRVTPW-----PMAPDPHSREARQQRFAHFTELAIVSVQEIVDFAKQLPGFLQL 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB3 PCEDQIILLKGCCMEIMSLRAAVRYDPESETLTLNGEMAVTRGQLKNGGLGV-VSDAIFD :::: ::: .:.: :... ::.: ::..:. ... .: .. ..:: : . ::. CCDS79 SREDQIALLKTSAIEVMLLETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFINPIFE 290 300 310 320 330 340 360 370 380 390 400 410 pF1KB3 LGMSLSSFNLDDTEVALLQAVLLMSSDRPGLACVERIEKYQDSFLLAFEHYINYRKHHVT .. ... ..:.:.: ::: :. ..:.:::.. ..:. : ... :.. :.. .. : CCDS79 FSRAMNELQLNDAEFALLIAISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIHHPHDR 350 360 370 380 390 400 420 430 440 450 460 pF1KB3 HFWPKLLMKVTDLRMIGACHASRFLHMKVECPTELFPPLFLEVFED ..:..:::...:: ... :. . . .... . .:::. :... CCDS79 LMFPRMLMKLVSLRTLSSVHSEQVFALRLQ--DKKLPPLLSEIWDVHE 410 420 430 440 >>CCDS54627.1 NR1I2 gene_id:8856|Hs108|chr3 (397 aa) initn: 201 init1: 201 opt: 616 Z-score: 638.1 bits: 127.1 E(32554): 3.2e-29 Smith-Waterman score: 616; 32.4% identity (63.2% similar) in 364 aa overlap (105-459:39-392) 80 90 100 110 120 130 pF1KB3 VNDQSVSSAQTFQTEEKKCKGYIPSYLDKDELCVVCGDKATGYHYRCITCEGCKGFFRRT ..: ::::::::::. .:::::::::::. CCDS54 WNHADFVHCEDTESVPGKPSVNADEEVGGPQICRVCGDKATGYHFNVMTCEGCKGFFRRA 10 20 30 40 50 60 140 150 160 170 180 190 pF1KB3 IQKNLHPSYSCKY-EGKCVIDKVTRNQCQECRFKKCIYVGMATDLVLDDSKRLAKRKLIE ...: . : . .: : : . :: ::: ::..::. :: .....: .: ::. CCDS54 MKRNAR--LRCPFRKGACEITRKTRRQCQACRLRKCLESGMKKEMIMSDEAVEERRALIK 70 80 90 100 110 120 200 210 220 230 240 pF1KB3 ENREKRRREELQKSIGHKPEPTDEEWELIKTVTEAHVAT-NAQGSHWKQKRKFLP---ED :.: .: : .: . :.:. .:. . .:.. : .. ::.:. : : :: CCDS54 --RKKSERTGTQP-LGVQGL-TEEQRMMIRELMDAQMKTFDTTFSHFKNFRVSLQLRGED 130 140 150 160 170 180 250 260 270 280 290 300 pF1KB3 IGQAPIVNAPE--GGKVDLEAFSHFTKIITPAITRVVDFAKKLPMFCELPCEDQIILLKG :.. . : ::: . . :.. . : . ...::: . .: .:: :::: :::: CCDS54 -GSVWNYKPPADSGGKEIFSLLPHMADMSTYMFKGIISFAKVISYFRDLPIEDQISLLKG 190 200 210 220 230 240 310 320 330 340 350 360 pF1KB3 CCMEIMSLRAAVRYDPESETLTLNGEMAVTRGQLKNGGLGVVSDAIFDLGMSLSSFNLDD .:. .:: . .. :. : :... . .: .. . .. . . :....: . CCDS54 AAFELCQLRFNTVFNAETGTWEC-GRLSYCLEDTAGGFQQLLLEPMLKFHYMLKKLQLHE 250 260 270 280 290 300 370 380 390 400 410 420 pF1KB3 TEVALLQAVLLMSSDRPGLACVERIEKYQDSFLLAFEHYINYRKHHVTH--FWPKLLMKV : .:.::. :.: ::::. . ... :..: .... ::. . . .: .. :.. . CCDS54 EEYVLMQAISLFSPDRPGVLQHRVVDQLQEQFAITLKSYIECNRPQPAHRFLFLKIMAML 310 320 330 340 350 360 430 440 450 460 pF1KB3 TDLRMIGACHASRFLHMKVECPTELFPPLFLEVFED :.:: :.: :..:.:... : . ::. :.: CCDS54 TELRSINAQHTQRLLRIQDIHP--FATPLMQELFGITGS 370 380 390 >>CCDS55873.1 NR1H4 gene_id:9971|Hs108|chr12 (476 aa) initn: 557 init1: 223 opt: 578 Z-score: 598.0 bits: 120.0 E(32554): 5.5e-27 Smith-Waterman score: 584; 31.2% identity (56.9% similar) in 404 aa overlap (78-460:98-474) 50 60 70 80 90 100 pF1KB3 TLKNEQSSPHLIQTTWTSSIFHLDHDDVNDQSVSSAQTFQTEEKKCKGYIPSYLDKDELC :. . . . . .: : . . :::: CCDS55 SNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGASAGRIKGDELC 70 80 90 100 110 120 110 120 130 140 150 160 pF1KB3 VVCGDKATGYHYRCITCEGCKGFFRRTIQKNLHPSYSCKYEGKCVIDKVTRNQCQECRFK :::::.:.:::: .:::::::::::.: :: :.:: :.::.: : .:::::.. CCDS55 VVCGDRASGYHYNALTCEGCKGFFRRSITKN--AVYKCKNGGNCVMDMYMRRKCQECRLR 130 140 150 160 170 180 170 180 190 200 210 pF1KB3 KCIYVGMA-----TDLVLD---DSKRLAKR------KLIEENREKRRREELQ---KSIGH :: .:: : :. . :::: : . ..:. : : ... :: . CCDS55 KCKEMGMLAECMYTGLLTEIQCKSKRLRKNVKQHADQTVNEDSEGRDLRQVTSTTKSCRE 190 200 210 220 230 240 220 230 240 250 260 270 pF1KB3 KPEPTDEEWELIKTVTEAHVATNAQGSHWKQKRKFLPEDIGQAPIVNAPEGGKVDLEAFS : : : .. :.. . ... : : . :.: :... : : CCDS55 KTELTPDQQTLLHFIMDSY---NKQRMPQEITNKILKEEFSAE-------------ENFL 250 260 270 280 280 290 300 310 320 330 pF1KB3 HFTKIITPAITRVVDFAKKLPMFCELPCEDQIILLKGCCMEIMSLRAAVRYDPESETLTL .:.. : . .:.:.:::: : : :::: :::: .: : ::.: .. . . CCDS55 ILTEMATNHVQVLVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPS--- 290 300 310 320 330 340 340 350 360 370 380 pF1KB3 NGEMAVTRGQLKNGGLGVVSDA----IFDLGMSLSSFNLDDTEVALLQAVLLMSSDRPGL :. . . ...:.: .:: .:.. :.. ... . : ::: :....: :: . CCDS55 -GHSDLLEERIRNSG---ISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYI 350 360 370 380 390 400 390 400 410 420 430 440 pF1KB3 ACVERIEKYQDSFLLAFEHYINYRKHHVTHFWPKLLMKVTDLRMIGACHASRFLHMKVEC : .:: :. .: .... . .. . . . :: ..:.:: .. :: .. .:. CCDS55 KDREAVEKLQEPLLDVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVN- 410 420 430 440 450 460 450 460 pF1KB3 PTELFPPLFLEVFED . : ::. :... CCDS55 -DHKFTPLLCEIWDVQ 470 >>CCDS55876.1 NR1H4 gene_id:9971|Hs108|chr12 (486 aa) initn: 557 init1: 223 opt: 578 Z-score: 597.9 bits: 120.0 E(32554): 5.5e-27 Smith-Waterman score: 584; 31.2% identity (56.9% similar) in 404 aa overlap (78-460:108-484) 50 60 70 80 90 100 pF1KB3 TLKNEQSSPHLIQTTWTSSIFHLDHDDVNDQSVSSAQTFQTEEKKCKGYIPSYLDKDELC :. . . . . .: : . . :::: CCDS55 SNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGASAGRIKGDELC 80 90 100 110 120 130 110 120 130 140 150 160 pF1KB3 VVCGDKATGYHYRCITCEGCKGFFRRTIQKNLHPSYSCKYEGKCVIDKVTRNQCQECRFK :::::.:.:::: .:::::::::::.: :: :.:: :.::.: : .:::::.. CCDS55 VVCGDRASGYHYNALTCEGCKGFFRRSITKN--AVYKCKNGGNCVMDMYMRRKCQECRLR 140 150 160 170 180 190 170 180 190 200 210 pF1KB3 KCIYVGMA-----TDLVLD---DSKRLAKR------KLIEENREKRRREELQ---KSIGH :: .:: : :. . :::: : . ..:. : : ... :: . CCDS55 KCKEMGMLAECMYTGLLTEIQCKSKRLRKNVKQHADQTVNEDSEGRDLRQVTSTTKSCRE 200 210 220 230 240 250 220 230 240 250 260 270 pF1KB3 KPEPTDEEWELIKTVTEAHVATNAQGSHWKQKRKFLPEDIGQAPIVNAPEGGKVDLEAFS : : : .. :.. . ... : : . :.: :... : : CCDS55 KTELTPDQQTLLHFIMDSY---NKQRMPQEITNKILKEEFSAE-------------ENFL 260 270 280 290 280 290 300 310 320 330 pF1KB3 HFTKIITPAITRVVDFAKKLPMFCELPCEDQIILLKGCCMEIMSLRAAVRYDPESETLTL .:.. : . .:.:.:::: : : :::: :::: .: : ::.: .. . . CCDS55 ILTEMATNHVQVLVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPS--- 300 310 320 330 340 350 340 350 360 370 380 pF1KB3 NGEMAVTRGQLKNGGLGVVSDA----IFDLGMSLSSFNLDDTEVALLQAVLLMSSDRPGL :. . . ...:.: .:: .:.. :.. ... . : ::: :....: :: . CCDS55 -GHSDLLEERIRNSG---ISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYI 360 370 380 390 400 410 390 400 410 420 430 440 pF1KB3 ACVERIEKYQDSFLLAFEHYINYRKHHVTHFWPKLLMKVTDLRMIGACHASRFLHMKVEC : .:: :. .: .... . .. . . . :: ..:.:: .. :: .. .:. CCDS55 KDREAVEKLQEPLLDVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVN- 420 430 440 450 460 470 450 460 pF1KB3 PTELFPPLFLEVFED . : ::. :... CCDS55 -DHKFTPLLCEIWDVQ 480 461 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 13:51:32 2016 done: Thu Nov 3 13:51:32 2016 Total Scan time: 3.040 Total Display time: 0.080 Function used was FASTA [36.3.4 Apr, 2011]