FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7759, 447 aa 1>>>pF1KB7759 447 - 447 aa - 447 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.5654+/-0.000749; mu= 13.5755+/- 0.046 mean_var=117.1488+/-23.417, 0's: 0 Z-trim(113.0): 124 B-trim: 42 in 1/51 Lambda= 0.118496 statistics sampled from 13519 (13644) to 13519 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.77), E-opt: 0.2 (0.419), width: 16 Scan time: 3.020 The best scores are: opt bits E(32554) CCDS7929.1 NR1H3 gene_id:10062|Hs108|chr11 ( 447) 3026 527.8 8.3e-150 CCDS73285.1 NR1H3 gene_id:10062|Hs108|chr11 ( 453) 2913 508.5 5.5e-144 CCDS44585.1 NR1H3 gene_id:10062|Hs108|chr11 ( 402) 2711 473.9 1.2e-133 CCDS44584.1 NR1H3 gene_id:10062|Hs108|chr11 ( 387) 1646 291.9 7.7e-79 CCDS42593.1 NR1H2 gene_id:7376|Hs108|chr19 ( 460) 1234 221.5 1.4e-57 CCDS58673.1 NR1H2 gene_id:7376|Hs108|chr19 ( 363) 1228 220.4 2.4e-57 CCDS9078.1 NR1H4 gene_id:9971|Hs108|chr12 ( 472) 915 167.0 3.8e-41 CCDS55875.1 NR1H4 gene_id:9971|Hs108|chr12 ( 482) 915 167.0 3.8e-41 CCDS55873.1 NR1H4 gene_id:9971|Hs108|chr12 ( 476) 897 163.9 3.2e-40 CCDS55876.1 NR1H4 gene_id:9971|Hs108|chr12 ( 486) 897 163.9 3.2e-40 CCDS2641.1 THRB gene_id:7068|Hs108|chr3 ( 461) 747 138.2 1.6e-32 CCDS42316.1 THRA gene_id:7067|Hs108|chr17 ( 410) 711 132.0 1.1e-30 CCDS54627.1 NR1I2 gene_id:8856|Hs108|chr3 ( 397) 696 129.5 6.1e-30 CCDS58546.1 THRA gene_id:7067|Hs108|chr17 ( 451) 663 123.9 3.4e-28 CCDS11360.1 THRA gene_id:7067|Hs108|chr17 ( 490) 656 122.7 8.3e-28 CCDS41430.1 NR1I3 gene_id:9970|Hs108|chr1 ( 352) 512 98.0 1.6e-20 CCDS41429.1 NR1I3 gene_id:9970|Hs108|chr1 ( 357) 493 94.7 1.6e-19 CCDS55874.1 NR1H4 gene_id:9971|Hs108|chr12 ( 425) 469 90.7 3.1e-18 CCDS44260.1 NR1I3 gene_id:9970|Hs108|chr1 ( 339) 459 88.9 8.5e-18 CCDS33718.1 NR1D2 gene_id:9975|Hs108|chr3 ( 579) 436 85.1 2e-16 CCDS45671.1 RARA gene_id:5914|Hs108|chr17 ( 365) 431 84.1 2.5e-16 CCDS58237.1 RARG gene_id:5916|Hs108|chr12 ( 432) 430 84.0 3.2e-16 CCDS46775.1 RARB gene_id:5915|Hs108|chr3 ( 336) 424 82.9 5.3e-16 CCDS11361.1 NR1D1 gene_id:9572|Hs108|chr17 ( 614) 419 82.3 1.5e-15 CCDS43136.1 NR1I2 gene_id:8856|Hs108|chr3 ( 434) 399 78.7 1.3e-14 CCDS2995.1 NR1I2 gene_id:8856|Hs108|chr3 ( 473) 399 78.8 1.4e-14 CCDS8310.1 PGR gene_id:5241|Hs108|chr11 ( 933) 402 79.5 1.6e-14 CCDS5234.1 ESR1 gene_id:2099|Hs108|chr6 ( 595) 398 78.7 1.8e-14 CCDS8757.1 VDR gene_id:7421|Hs108|chr12 ( 427) 385 76.3 6.6e-14 CCDS3772.1 NR3C2 gene_id:4306|Hs108|chr4 ( 984) 390 77.5 6.9e-14 CCDS55820.1 VDR gene_id:7421|Hs108|chr12 ( 477) 385 76.4 7.1e-14 CCDS41790.1 RARG gene_id:5916|Hs108|chr12 ( 443) 375 74.6 2.2e-13 CCDS53409.1 NR1I3 gene_id:9970|Hs108|chr1 ( 319) 368 73.3 3.9e-13 CCDS61469.1 ESR2 gene_id:2100|Hs108|chr14 ( 439) 353 70.9 3e-12 CCDS61470.1 ESR2 gene_id:2100|Hs108|chr14 ( 474) 353 70.9 3.2e-12 CCDS55920.1 ESR2 gene_id:2100|Hs108|chr14 ( 481) 353 70.9 3.2e-12 CCDS32096.1 ESR2 gene_id:2100|Hs108|chr14 ( 495) 353 70.9 3.3e-12 CCDS9762.1 ESR2 gene_id:2100|Hs108|chr14 ( 530) 353 70.9 3.4e-12 CCDS73751.1 NR2E3 gene_id:10002|Hs108|chr15 ( 367) 347 69.8 5.3e-12 CCDS2642.1 RARB gene_id:5915|Hs108|chr3 ( 448) 348 70.0 5.5e-12 CCDS73750.1 NR2E3 gene_id:10002|Hs108|chr15 ( 410) 347 69.8 5.7e-12 CCDS4068.1 NR2F1 gene_id:7025|Hs108|chr5 ( 423) 347 69.8 5.9e-12 CCDS44261.1 NR1I3 gene_id:9970|Hs108|chr1 ( 340) 345 69.4 6.3e-12 CCDS74728.1 HNF4A gene_id:3172|Hs108|chr20 ( 449) 346 69.7 6.9e-12 CCDS1228.1 NR1I3 gene_id:9970|Hs108|chr1 ( 348) 343 69.1 8.1e-12 CCDS53405.1 NR1I3 gene_id:9970|Hs108|chr1 ( 296) 341 68.7 9.1e-12 CCDS2610.2 PPARG gene_id:5468|Hs108|chr3 ( 477) 344 69.4 9.2e-12 CCDS44262.1 NR1I3 gene_id:9970|Hs108|chr1 ( 309) 341 68.7 9.4e-12 CCDS41428.1 NR1I3 gene_id:9970|Hs108|chr1 ( 314) 341 68.7 9.5e-12 CCDS2609.1 PPARG gene_id:5468|Hs108|chr3 ( 505) 344 69.4 9.6e-12 >>CCDS7929.1 NR1H3 gene_id:10062|Hs108|chr11 (447 aa) initn: 3026 init1: 3026 opt: 3026 Z-score: 2803.0 bits: 527.8 E(32554): 8.3e-150 Smith-Waterman score: 3026; 100.0% identity (100.0% similar) in 447 aa overlap (1-447:1-447) 10 20 30 40 50 60 pF1KB7 MSLWLGAPVPDIPPDSAVELWKPGAQDASSQAQGGSSCILREEARMPHSAGGTAGVGLEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS79 MSLWLGAPVPDIPPDSAVELWKPGAQDASSQAQGGSSCILREEARMPHSAGGTAGVGLEA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 AEPTALLTRAEPPSEPTEIRPQKRKKGPAPKMLGNELCSVCGDKASGFHYNVLSCEGCKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS79 AEPTALLTRAEPPSEPTEIRPQKRKKGPAPKMLGNELCSVCGDKASGFHYNVLSCEGCKG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 FFRRSVIKGAHYICHSGGHCPMDTYMRRKCQECRLRKCRQAGMREECVLSEEQIRLKKLK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS79 FFRRSVIKGAHYICHSGGHCPMDTYMRRKCQECRLRKCRQAGMREECVLSEEQIRLKKLK 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 RQEEEQAHATSLPPRASSPPQILPQLSPEQLGMIEKLVAAQQQCNRRSFSDRLRVTPWPM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS79 RQEEEQAHATSLPPRASSPPQILPQLSPEQLGMIEKLVAAQQQCNRRSFSDRLRVTPWPM 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 APDPHSREARQQRFAHFTELAIVSVQEIVDFAKQLPGFLQLSREDQIALLKTSAIEVMLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS79 APDPHSREARQQRFAHFTELAIVSVQEIVDFAKQLPGFLQLSREDQIALLKTSAIEVMLL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 ETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS79 ETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLI 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB7 AISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS79 AISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSV 370 380 390 400 410 420 430 440 pF1KB7 HSEQVFALRLQDKKLPPLLSEIWDVHE ::::::::::::::::::::::::::: CCDS79 HSEQVFALRLQDKKLPPLLSEIWDVHE 430 440 >>CCDS73285.1 NR1H3 gene_id:10062|Hs108|chr11 (453 aa) initn: 2910 init1: 2910 opt: 2913 Z-score: 2698.5 bits: 508.5 E(32554): 5.5e-144 Smith-Waterman score: 2913; 99.1% identity (99.1% similar) in 438 aa overlap (13-447:16-453) 10 20 30 40 50 pF1KB7 MSLWLGAPVPDIPPD---SAVELWKPGAQDASSQAQGGSSCILREEARMPHSAGGTA :: ::::::::::::::::::::::::::::::::::::::: CCDS73 MQQTSWNPLGGTCKQPPGRTHSAVELWKPGAQDASSQAQGGSSCILREEARMPHSAGGTA 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB7 GVGLEAAEPTALLTRAEPPSEPTEIRPQKRKKGPAPKMLGNELCSVCGDKASGFHYNVLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 GVGLEAAEPTALLTRAEPPSEPTEIRPQKRKKGPAPKMLGNELCSVCGDKASGFHYNVLS 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB7 CEGCKGFFRRSVIKGAHYICHSGGHCPMDTYMRRKCQECRLRKCRQAGMREECVLSEEQI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 CEGCKGFFRRSVIKGAHYICHSGGHCPMDTYMRRKCQECRLRKCRQAGMREECVLSEEQI 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB7 RLKKLKRQEEEQAHATSLPPRASSPPQILPQLSPEQLGMIEKLVAAQQQCNRRSFSDRLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 RLKKLKRQEEEQAHATSLPPRASSPPQILPQLSPEQLGMIEKLVAAQQQCNRRSFSDRLR 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB7 VTPWPMAPDPHSREARQQRFAHFTELAIVSVQEIVDFAKQLPGFLQLSREDQIALLKTSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 VTPWPMAPDPHSREARQQRFAHFTELAIVSVQEIVDFAKQLPGFLQLSREDQIALLKTSA 250 260 270 280 290 300 300 310 320 330 340 350 pF1KB7 IEVMLLETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFINPIFEFSRAMNELQLNDA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 IEVMLLETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFINPIFEFSRAMNELQLNDA 310 320 330 340 350 360 360 370 380 390 400 410 pF1KB7 EFALLIAISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIHHPHDRLMFPRMLMKLVSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 EFALLIAISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIHHPHDRLMFPRMLMKLVSL 370 380 390 400 410 420 420 430 440 pF1KB7 RTLSSVHSEQVFALRLQDKKLPPLLSEIWDVHE ::::::::::::::::::::::::::::::::: CCDS73 RTLSSVHSEQVFALRLQDKKLPPLLSEIWDVHE 430 440 450 >>CCDS44585.1 NR1H3 gene_id:10062|Hs108|chr11 (402 aa) initn: 2711 init1: 2711 opt: 2711 Z-score: 2512.6 bits: 473.9 E(32554): 1.2e-133 Smith-Waterman score: 2711; 100.0% identity (100.0% similar) in 402 aa overlap (46-447:1-402) 20 30 40 50 60 70 pF1KB7 SAVELWKPGAQDASSQAQGGSSCILREEARMPHSAGGTAGVGLEAAEPTALLTRAEPPSE :::::::::::::::::::::::::::::: CCDS44 MPHSAGGTAGVGLEAAEPTALLTRAEPPSE 10 20 30 80 90 100 110 120 130 pF1KB7 PTEIRPQKRKKGPAPKMLGNELCSVCGDKASGFHYNVLSCEGCKGFFRRSVIKGAHYICH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 PTEIRPQKRKKGPAPKMLGNELCSVCGDKASGFHYNVLSCEGCKGFFRRSVIKGAHYICH 40 50 60 70 80 90 140 150 160 170 180 190 pF1KB7 SGGHCPMDTYMRRKCQECRLRKCRQAGMREECVLSEEQIRLKKLKRQEEEQAHATSLPPR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 SGGHCPMDTYMRRKCQECRLRKCRQAGMREECVLSEEQIRLKKLKRQEEEQAHATSLPPR 100 110 120 130 140 150 200 210 220 230 240 250 pF1KB7 ASSPPQILPQLSPEQLGMIEKLVAAQQQCNRRSFSDRLRVTPWPMAPDPHSREARQQRFA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 ASSPPQILPQLSPEQLGMIEKLVAAQQQCNRRSFSDRLRVTPWPMAPDPHSREARQQRFA 160 170 180 190 200 210 260 270 280 290 300 310 pF1KB7 HFTELAIVSVQEIVDFAKQLPGFLQLSREDQIALLKTSAIEVMLLETSRRYNPGSESITF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 HFTELAIVSVQEIVDFAKQLPGFLQLSREDQIALLKTSAIEVMLLETSRRYNPGSESITF 220 230 240 250 260 270 320 330 340 350 360 370 pF1KB7 LKDFSYNREDFAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLIAISIFSADRPNVQDQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 LKDFSYNREDFAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLIAISIFSADRPNVQDQ 280 290 300 310 320 330 380 390 400 410 420 430 pF1KB7 LQVERLQHTYVEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSVHSEQVFALRLQDKKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 LQVERLQHTYVEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSVHSEQVFALRLQDKKL 340 350 360 370 380 390 440 pF1KB7 PPLLSEIWDVHE :::::::::::: CCDS44 PPLLSEIWDVHE 400 >>CCDS44584.1 NR1H3 gene_id:10062|Hs108|chr11 (387 aa) initn: 1646 init1: 1646 opt: 1646 Z-score: 1528.9 bits: 291.9 E(32554): 7.7e-79 Smith-Waterman score: 2498; 86.6% identity (86.6% similar) in 447 aa overlap (1-447:1-387) 10 20 30 40 50 60 pF1KB7 MSLWLGAPVPDIPPDSAVELWKPGAQDASSQAQGGSSCILREEARMPHSAGGTAGVGLEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 MSLWLGAPVPDIPPDSAVELWKPGAQDASSQAQGGSSCILREEARMPHSAGGTAGVGLEA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 AEPTALLTRAEPPSEPTEIRPQKRKKGPAPKMLGNELCSVCGDKASGFHYNVLSCEGCKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 AEPTALLTRAEPPSEPTEIRPQKRKKGPAPKMLGNELCSVCGDKASGFHYNVLSCEGCKG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 FFRRSVIKGAHYICHSGGHCPMDTYMRRKCQECRLRKCRQAGMREECVLSEEQIRLKKLK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 FFRRSVIKGAHYICHSGGHCPMDTYMRRKCQECRLRKCRQAGMREECVLSEEQIRLKKLK 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 RQEEEQAHATSLPPRASSPPQILPQLSPEQLGMIEKLVAAQQQCNRRSFSDRLRVTPWPM :::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 RQEEEQAHATSLPPRASSPPQILPQLSPEQLGMIEKLVAAQQQCNRRSFSDRLRVT---- 190 200 210 220 230 250 260 270 280 290 300 pF1KB7 APDPHSREARQQRFAHFTELAIVSVQEIVDFAKQLPGFLQLSREDQIALLKTSAIEVMLL :::: CCDS44 --------------------------------------------------------VMLL 240 310 320 330 340 350 360 pF1KB7 ETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 ETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLI 250 260 270 280 290 300 370 380 390 400 410 420 pF1KB7 AISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 AISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSV 310 320 330 340 350 360 430 440 pF1KB7 HSEQVFALRLQDKKLPPLLSEIWDVHE ::::::::::::::::::::::::::: CCDS44 HSEQVFALRLQDKKLPPLLSEIWDVHE 370 380 >>CCDS42593.1 NR1H2 gene_id:7376|Hs108|chr19 (460 aa) initn: 1837 init1: 1228 opt: 1234 Z-score: 1147.2 bits: 221.5 E(32554): 1.4e-57 Smith-Waterman score: 1835; 63.0% identity (78.6% similar) in 459 aa overlap (13-447:4-460) 10 20 30 40 50 60 pF1KB7 MSLWLGAPVPDIPPDSAVELWKPGAQDASSQAQGGSSCILREEARMPHSAGGTAGVGLEA : :... :: . : ..: . .::. : .: : CCDS42 MSSPTTSSLDTPLPGNGPPQPGAPSSSPTV-KEEGPEPWPGGPDPDVPGTD 10 20 30 40 50 70 80 90 100 110 120 pF1KB7 AEPTALLTRAEPPSEPTEIRPQKRKKGPAPKMLGNELCSVCGDKASGFHYNVLSCEGCKG .: : : .: : .::::::::::::.::: ::::::::::::::::::::: CCDS42 EASSACSTDWVIP-DPEEEPERKRKKGPAPKMLGHELCRVCGDKASGFHYNVLSCEGCKG 60 70 80 90 100 130 140 150 160 170 pF1KB7 FFRRSVIKGA--HYICHSGGHCPMDTYMRRKCQECRLRKCRQAGMREECVLSEEQIRLKK ::::::..:. .: :..:: : ::..::::::.::::::..:::::.::::::::: :: CCDS42 FFRRSVVRGGARRYACRGGGTCQMDAFMRRKCQQCRLRKCKEAGMREQCVLSEEQIRKKK 110 120 130 140 150 160 180 190 200 210 pF1KB7 LKRQEEEQAHATSLP--PRASSP----PQILP----------------QLSPEQLGMIEK ...:..:. .. : :..:: : : ::. : ::.. CCDS42 IRKQQQESQSQSQSPVGPQGSSSSASGPGASPGGSEAGSQGSGEGEGVQLTAAQELMIQQ 170 180 190 200 210 220 220 230 240 250 260 270 pF1KB7 LVAAQQQCNRRSFSDRLRVTPWPMAPDPHSREARQQRFAHFTELAIVSVQEIVDFAKQLP ::::: :::.:::::. .:::::.. ::.::.::::::::::::::.:::::::::::.: CCDS42 LVAAQLQCNKRSFSDQPKVTPWPLGADPQSRDARQQRFAHFTELAIISVQEIVDFAKQVP 230 240 250 260 270 280 280 290 300 310 320 330 pF1KB7 GFLQLSREDQIALLKTSAIEVMLLETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFI :::::.:::::::::.:.::.:::::.:::: .: :::::::.:...:: .:::::::: CCDS42 GFLQLGREDQIALLKASTIEIMLLETARRYNHETECITFLKDFTYSKDDFHRAGLQVEFI 290 300 310 320 330 340 340 350 360 370 380 390 pF1KB7 NPIFEFSRAMNELQLNDAEFALLIAISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIH :::::::::: .: :.:::.::::::.::::::::::. .:: ::. ::::: .:. :. CCDS42 NPIFEFSRAMRRLGLDDAEYALLIAINIFSADRPNVQEPGRVEALQQPYVEALLSYTRIK 350 360 370 380 390 400 400 410 420 430 440 pF1KB7 HPHDRLMFPRMLMKLVSLRTLSSVHSEQVFALRLQDKKLPPLLSEIWDVHE .:.:.: :::::::::::::::::::::::::::::::::::::::::::: CCDS42 RPQDQLRFPRMLMKLVSLRTLSSVHSEQVFALRLQDKKLPPLLSEIWDVHE 410 420 430 440 450 460 >>CCDS58673.1 NR1H2 gene_id:7376|Hs108|chr19 (363 aa) initn: 1300 init1: 1228 opt: 1228 Z-score: 1143.0 bits: 220.4 E(32554): 2.4e-57 Smith-Waterman score: 1274; 67.9% identity (83.1% similar) in 302 aa overlap (168-447:62-363) 140 150 160 170 180 190 pF1KB7 GHCPMDTYMRRKCQECRLRKCRQAGMREECVLSEEQIRLKKLKRQEEEQAHATSLP--PR :::::::: ::...:..:. .. : :. CCDS58 EEGPEPWPGGPDPDVPGTDEASSACSTDWGVLSEEQIRKKKIRKQQQESQSQSQSPVGPQ 40 50 60 70 80 90 200 210 220 230 pF1KB7 ASSP----PQILP----------------QLSPEQLGMIEKLVAAQQQCNRRSFSDRLRV .:: : : ::. : ::..::::: :::.:::::. .: CCDS58 GSSSSASGPGASPGGSEAGSQGSGEGEGVQLTAAQELMIQQLVAAQLQCNKRSFSDQPKV 100 110 120 130 140 150 240 250 260 270 280 290 pF1KB7 TPWPMAPDPHSREARQQRFAHFTELAIVSVQEIVDFAKQLPGFLQLSREDQIALLKTSAI ::::.. ::.::.::::::::::::::.:::::::::::.::::::.:::::::::.:.: CCDS58 TPWPLGADPQSRDARQQRFAHFTELAIISVQEIVDFAKQVPGFLQLGREDQIALLKASTI 160 170 180 190 200 210 300 310 320 330 340 350 pF1KB7 EVMLLETSRRYNPGSESITFLKDFSYNREDFAKAGLQVEFINPIFEFSRAMNELQLNDAE :.:::::.:::: .: :::::::.:...:: .:::::::::::::::::: .: :.::: CCDS58 EIMLLETARRYNHETECITFLKDFTYSKDDFHRAGLQVEFINPIFEFSRAMRRLGLDDAE 220 230 240 250 260 270 360 370 380 390 400 410 pF1KB7 FALLIAISIFSADRPNVQDQLQVERLQHTYVEALHAYVSIHHPHDRLMFPRMLMKLVSLR .::::::.::::::::::. .:: ::. ::::: .:. :..:.:.: :::::::::::: CCDS58 YALLIAINIFSADRPNVQEPGRVEALQQPYVEALLSYTRIKRPQDQLRFPRMLMKLVSLR 280 290 300 310 320 330 420 430 440 pF1KB7 TLSSVHSEQVFALRLQDKKLPPLLSEIWDVHE :::::::::::::::::::::::::::::::: CCDS58 TLSSVHSEQVFALRLQDKKLPPLLSEIWDVHE 340 350 360 >>CCDS9078.1 NR1H4 gene_id:9971|Hs108|chr12 (472 aa) initn: 862 init1: 462 opt: 915 Z-score: 852.3 bits: 167.0 E(32554): 3.8e-41 Smith-Waterman score: 915; 39.1% identity (68.5% similar) in 391 aa overlap (63-446:92-472) 40 50 60 70 80 90 pF1KB7 QGGSSCILREEARMPHSAGGTAGVGLEAAEPTALLTRAEPPSEPTEIRPQKRKKGPAPKM :. : ..: . . : . : .. CCDS90 SSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGASAGRI 70 80 90 100 110 120 100 110 120 130 140 150 pF1KB7 LGNELCSVCGDKASGFHYNVLSCEGCKGFFRRSVIKGAHYICHSGGHCPMDTYMRRKCQE :.::: ::::.:::.:::.:.:::::::::::. :.: : :..::.: :: :::::::: CCDS90 KGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCVMDMYMRRKCQE 130 140 150 160 170 180 160 170 180 190 200 210 pF1KB7 CRLRKCRQAGMREECVLSEEQIRLKKLKRQEEEQAHATSLPPRASSPPQILPQLSPEQLG ::::::.. :: ::.:.: : . :.:... ...: : .: . : :.. . CCDS90 CRLRKCKEMGMLAECLLTEIQCKSKRLRKNVKQHADQTV---NEDSEGRDLRQVTSTTKS 190 200 210 220 230 220 230 240 250 260 pF1KB7 MIEKL-VAAQQQCNRRSFSDRL--RVTPWPMAPDPHSRE-ARQQRFAHFTELAIVSVQEI :: .. .:: . . : . : .. ..: . .. : .::.: :: . CCDS90 CREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLILTEMATNHVQVL 240 250 260 270 280 290 270 280 290 300 310 320 pF1KB7 VDFAKQLPGFLQLSREDQIALLKTSAIEVMLLETSRRYN---PGSESITFLKDFSYNRED :.:.:.:::: :..:::::::: ::.:.:.:.... .: :...: :. .: CCDS90 VEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHS-----DLLEER-- 300 310 320 330 340 350 330 340 350 360 370 380 pF1KB7 FAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLIAISIFSADRPNVQDQLQVERLQHTY . ..:.. :.:.:.: : ....::.... :.::: :: :.: :: ..:. ::.::. CCDS90 IRNSGISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEPL 360 370 380 390 400 410 390 400 410 420 430 440 pF1KB7 VEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSVHSEQVFALRLQDKKLPPLLSEIWDV ...:. .::.:.. : .: .:. :::.. :.:.... :..:.:. ::: ::::: CCDS90 LDVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCEIWDV 420 430 440 450 460 470 pF1KB7 HE . CCDS90 Q >>CCDS55875.1 NR1H4 gene_id:9971|Hs108|chr12 (482 aa) initn: 891 init1: 462 opt: 915 Z-score: 852.1 bits: 167.0 E(32554): 3.8e-41 Smith-Waterman score: 915; 39.1% identity (68.5% similar) in 391 aa overlap (63-446:102-482) 40 50 60 70 80 90 pF1KB7 QGGSSCILREEARMPHSAGGTAGVGLEAAEPTALLTRAEPPSEPTEIRPQKRKKGPAPKM :. : ..: . . : . : .. CCDS55 SSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGASAGRI 80 90 100 110 120 130 100 110 120 130 140 150 pF1KB7 LGNELCSVCGDKASGFHYNVLSCEGCKGFFRRSVIKGAHYICHSGGHCPMDTYMRRKCQE :.::: ::::.:::.:::.:.:::::::::::. :.: : :..::.: :: :::::::: CCDS55 KGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCVMDMYMRRKCQE 140 150 160 170 180 190 160 170 180 190 200 210 pF1KB7 CRLRKCRQAGMREECVLSEEQIRLKKLKRQEEEQAHATSLPPRASSPPQILPQLSPEQLG ::::::.. :: ::.:.: : . :.:... ...: : .: . : :.. . CCDS55 CRLRKCKEMGMLAECLLTEIQCKSKRLRKNVKQHADQTV---NEDSEGRDLRQVTSTTKS 200 210 220 230 240 220 230 240 250 260 pF1KB7 MIEKL-VAAQQQCNRRSFSDRL--RVTPWPMAPDPHSRE-ARQQRFAHFTELAIVSVQEI :: .. .:: . . : . : .. ..: . .. : .::.: :: . CCDS55 CREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLILTEMATNHVQVL 250 260 270 280 290 300 270 280 290 300 310 320 pF1KB7 VDFAKQLPGFLQLSREDQIALLKTSAIEVMLLETSRRYN---PGSESITFLKDFSYNRED :.:.:.:::: :..:::::::: ::.:.:.:.... .: :...: :. .: CCDS55 VEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHS-----DLLEER-- 310 320 330 340 350 360 330 340 350 360 370 380 pF1KB7 FAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLIAISIFSADRPNVQDQLQVERLQHTY . ..:.. :.:.:.: : ....::.... :.::: :: :.: :: ..:. ::.::. CCDS55 IRNSGISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKLQEPL 370 380 390 400 410 420 390 400 410 420 430 440 pF1KB7 VEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSVHSEQVFALRLQDKKLPPLLSEIWDV ...:. .::.:.. : .: .:. :::.. :.:.... :..:.:. ::: ::::: CCDS55 LDVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCEIWDV 430 440 450 460 470 480 pF1KB7 HE . CCDS55 Q >>CCDS55873.1 NR1H4 gene_id:9971|Hs108|chr12 (476 aa) initn: 820 init1: 420 opt: 897 Z-score: 835.6 bits: 163.9 E(32554): 3.2e-40 Smith-Waterman score: 897; 38.7% identity (67.8% similar) in 395 aa overlap (63-446:92-476) 40 50 60 70 80 90 pF1KB7 QGGSSCILREEARMPHSAGGTAGVGLEAAEPTALLTRAEPPSEPTEIRPQKRKKGPAPKM :. : ..: . . : . : .. CCDS55 SSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGASAGRI 70 80 90 100 110 120 100 110 120 130 140 150 pF1KB7 LGNELCSVCGDKASGFHYNVLSCEGCKGFFRRSVIKGAHYICHSGGHCPMDTYMRRKCQE :.::: ::::.:::.:::.:.:::::::::::. :.: : :..::.: :: :::::::: CCDS55 KGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCVMDMYMRRKCQE 130 140 150 160 170 180 160 170 180 190 200 pF1KB7 CRLRKCRQAGMREECV----LSEEQIRLKKLKRQEEEQAHATSLPPRASSPPQILPQLSP ::::::.. :: ::. :.: : . :.:... ...: : .: . : :.. CCDS55 CRLRKCKEMGMLAECMYTGLLTEIQCKSKRLRKNVKQHADQTV---NEDSEGRDLRQVTS 190 200 210 220 230 210 220 230 240 250 260 pF1KB7 EQLGMIEKL-VAAQQQCNRRSFSDRL--RVTPWPMAPDPHSRE-ARQQRFAHFTELAIVS . :: .. .:: . . : . : .. ..: . .. : .::.: CCDS55 TTKSCREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLILTEMATNH 240 250 260 270 280 290 270 280 290 300 310 320 pF1KB7 VQEIVDFAKQLPGFLQLSREDQIALLKTSAIEVMLLETSRRYN---PGSESITFLKDFSY :: .:.:.:.:::: :..:::::::: ::.:.:.:.... .: :...: :. CCDS55 VQVLVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHS-----DLLE 300 310 320 330 340 350 330 340 350 360 370 380 pF1KB7 NREDFAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLIAISIFSADRPNVQDQLQVERL .: . ..:.. :.:.:.: : ....::.... :.::: :: :.: :: ..:. ::.: CCDS55 ER--IRNSGISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKL 360 370 380 390 400 410 390 400 410 420 430 440 pF1KB7 QHTYVEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSVHSEQVFALRLQDKKLPPLLSE :. ...:. .::.:.. : .: .:. :::.. :.:.... :..:.:. ::: : CCDS55 QEPLLDVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCE 420 430 440 450 460 470 pF1KB7 IWDVHE ::::. CCDS55 IWDVQ >>CCDS55876.1 NR1H4 gene_id:9971|Hs108|chr12 (486 aa) initn: 873 init1: 420 opt: 897 Z-score: 835.5 bits: 163.9 E(32554): 3.2e-40 Smith-Waterman score: 897; 38.7% identity (67.8% similar) in 395 aa overlap (63-446:102-486) 40 50 60 70 80 90 pF1KB7 QGGSSCILREEARMPHSAGGTAGVGLEAAEPTALLTRAEPPSEPTEIRPQKRKKGPAPKM :. : ..: . . : . : .. CCDS55 SSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGASAGRI 80 90 100 110 120 130 100 110 120 130 140 150 pF1KB7 LGNELCSVCGDKASGFHYNVLSCEGCKGFFRRSVIKGAHYICHSGGHCPMDTYMRRKCQE :.::: ::::.:::.:::.:.:::::::::::. :.: : :..::.: :: :::::::: CCDS55 KGDELCVVCGDRASGYHYNALTCEGCKGFFRRSITKNAVYKCKNGGNCVMDMYMRRKCQE 140 150 160 170 180 190 160 170 180 190 200 pF1KB7 CRLRKCRQAGMREECV----LSEEQIRLKKLKRQEEEQAHATSLPPRASSPPQILPQLSP ::::::.. :: ::. :.: : . :.:... ...: : .: . : :.. CCDS55 CRLRKCKEMGMLAECMYTGLLTEIQCKSKRLRKNVKQHADQTV---NEDSEGRDLRQVTS 200 210 220 230 240 210 220 230 240 250 260 pF1KB7 EQLGMIEKL-VAAQQQCNRRSFSDRL--RVTPWPMAPDPHSRE-ARQQRFAHFTELAIVS . :: .. .:: . . : . : .. ..: . .. : .::.: CCDS55 TTKSCREKTELTPDQQTLLHFIMDSYNKQRMPQEITNKILKEEFSAEENFLILTEMATNH 250 260 270 280 290 300 270 280 290 300 310 320 pF1KB7 VQEIVDFAKQLPGFLQLSREDQIALLKTSAIEVMLLETSRRYN---PGSESITFLKDFSY :: .:.:.:.:::: :..:::::::: ::.:.:.:.... .: :...: :. CCDS55 VQVLVEFTKKLPGFQTLDHEDQIALLKGSAVEAMFLRSAEIFNKKLPSGHS-----DLLE 310 320 330 340 350 360 330 340 350 360 370 380 pF1KB7 NREDFAKAGLQVEFINPIFEFSRAMNELQLNDAEFALLIAISIFSADRPNVQDQLQVERL .: . ..:.. :.:.:.: : ....::.... :.::: :: :.: :: ..:. ::.: CCDS55 ER--IRNSGISDEYITPMFSFYKSIGELKMTQEEYALLTAIVILSPDRQYIKDREAVEKL 370 380 390 400 410 420 390 400 410 420 430 440 pF1KB7 QHTYVEALHAYVSIHHPHDRLMFPRMLMKLVSLRTLSSVHSEQVFALRLQDKKLPPLLSE :. ...:. .::.:.. : .: .:. :::.. :.:.... :..:.:. ::: : CCDS55 QEPLLDVLQKLCKIHQPENPQHFACLLGRLTELRTFNHHHAEMLMSWRVNDHKFTPLLCE 430 440 450 460 470 480 pF1KB7 IWDVHE ::::. CCDS55 IWDVQ 447 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 22:11:33 2016 done: Fri Nov 4 22:11:33 2016 Total Scan time: 3.020 Total Display time: 0.060 Function used was FASTA [36.3.4 Apr, 2011]