FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB4629, 441 aa
1>>>pF1KB4629 441 - 441 aa - 441 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.1838+/-0.00086; mu= 14.2123+/- 0.052
mean_var=94.2870+/-18.822, 0's: 0 Z-trim(109.5): 116 B-trim: 277 in 1/50
Lambda= 0.132083
statistics sampled from 10783 (10906) to 10783 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.7), E-opt: 0.2 (0.335), width: 16
Scan time: 3.180
The best scores are: opt bits E(32554)
CCDS4803.1 PPARD gene_id:5467|Hs108|chr6 ( 441) 2951 572.4 3e-163
CCDS54994.1 PPARD gene_id:5467|Hs108|chr6 ( 402) 2668 518.5 4.8e-147
CCDS4804.1 PPARD gene_id:5467|Hs108|chr6 ( 361) 2412 469.7 2.1e-132
CCDS54995.1 PPARD gene_id:5467|Hs108|chr6 ( 343) 1956 382.8 3e-106
CCDS33669.1 PPARA gene_id:5465|Hs108|chr22 ( 468) 1865 365.5 6.3e-101
CCDS2610.2 PPARG gene_id:5468|Hs108|chr3 ( 477) 1724 338.6 7.9e-93
CCDS2609.1 PPARG gene_id:5468|Hs108|chr3 ( 505) 1724 338.7 8.2e-93
CCDS42593.1 NR1H2 gene_id:7376|Hs108|chr19 ( 460) 516 108.4 1.5e-23
CCDS73750.1 NR2E3 gene_id:10002|Hs108|chr15 ( 410) 468 99.3 7.8e-21
CCDS11361.1 NR1D1 gene_id:9572|Hs108|chr17 ( 614) 449 95.7 1.3e-19
CCDS5063.1 NR2E1 gene_id:7101|Hs108|chr6 ( 385) 431 92.2 9.8e-19
CCDS69165.1 NR2E1 gene_id:7101|Hs108|chr6 ( 422) 427 91.5 1.8e-18
CCDS73751.1 NR2E3 gene_id:10002|Hs108|chr15 ( 367) 410 88.2 1.5e-17
CCDS6646.1 RORB gene_id:6096|Hs108|chr9 ( 459) 391 84.6 2.2e-16
CCDS30856.1 RORC gene_id:6097|Hs108|chr1 ( 497) 377 82.0 1.5e-15
CCDS1004.1 RORC gene_id:6097|Hs108|chr1 ( 518) 377 82.0 1.6e-15
CCDS10375.1 NR2F2 gene_id:7026|Hs108|chr15 ( 414) 374 81.3 1.9e-15
CCDS12352.1 NR2F6 gene_id:2063|Hs108|chr19 ( 404) 369 80.4 3.7e-15
CCDS45271.1 RORA gene_id:6095|Hs108|chr15 ( 468) 369 80.4 4.1e-15
CCDS10177.1 RORA gene_id:6095|Hs108|chr15 ( 523) 369 80.5 4.5e-15
CCDS10178.1 RORA gene_id:6095|Hs108|chr15 ( 548) 369 80.5 4.7e-15
CCDS10179.1 RORA gene_id:6095|Hs108|chr15 ( 556) 369 80.5 4.8e-15
CCDS33718.1 NR1D2 gene_id:9975|Hs108|chr3 ( 579) 367 80.1 6.4e-15
CCDS4068.1 NR2F1 gene_id:7025|Hs108|chr5 ( 423) 363 79.3 8.4e-15
CCDS4768.1 RXRB gene_id:6257|Hs108|chr6 ( 533) 364 79.5 8.9e-15
CCDS59007.1 RXRB gene_id:6257|Hs108|chr6 ( 537) 364 79.5 9e-15
CCDS35172.1 RXRA gene_id:6256|Hs108|chr9 ( 462) 356 77.9 2.3e-14
CCDS1248.1 RXRG gene_id:6258|Hs108|chr1 ( 463) 353 77.4 3.4e-14
CCDS72970.1 RXRG gene_id:6258|Hs108|chr1 ( 340) 345 75.8 7.6e-14
CCDS8818.1 NR4A1 gene_id:3164|Hs108|chr12 ( 598) 339 74.8 2.7e-13
CCDS55828.1 NR4A1 gene_id:3164|Hs108|chr12 ( 611) 339 74.8 2.7e-13
CCDS73471.1 NR4A1 gene_id:3164|Hs108|chr12 ( 652) 339 74.8 2.8e-13
CCDS6744.1 NR4A3 gene_id:8013|Hs108|chr9 ( 443) 334 73.7 4e-13
CCDS41821.1 NR2C1 gene_id:7181|Hs108|chr12 ( 467) 334 73.8 4.2e-13
CCDS44953.1 NR2C1 gene_id:7181|Hs108|chr12 ( 483) 334 73.8 4.3e-13
CCDS55340.1 NR6A1 gene_id:2649|Hs108|chr9 ( 475) 333 73.6 4.9e-13
CCDS65127.1 NR6A1 gene_id:2649|Hs108|chr9 ( 476) 333 73.6 4.9e-13
CCDS9051.1 NR2C1 gene_id:7181|Hs108|chr12 ( 603) 334 73.8 5.2e-13
CCDS6743.1 NR4A3 gene_id:8013|Hs108|chr9 ( 626) 334 73.8 5.3e-13
CCDS6742.1 NR4A3 gene_id:8013|Hs108|chr9 ( 637) 334 73.8 5.4e-13
CCDS2201.1 NR4A2 gene_id:4929|Hs108|chr2 ( 598) 333 73.6 5.9e-13
CCDS35137.1 NR6A1 gene_id:2649|Hs108|chr9 ( 480) 331 73.2 6.4e-13
CCDS45671.1 RARA gene_id:5914|Hs108|chr17 ( 365) 327 72.4 8.7e-13
CCDS42317.1 RARA gene_id:5914|Hs108|chr17 ( 457) 327 72.4 1e-12
CCDS11366.1 RARA gene_id:5914|Hs108|chr17 ( 462) 327 72.4 1e-12
CCDS6856.1 NR5A1 gene_id:2516|Hs108|chr9 ( 461) 325 72.0 1.4e-12
CCDS46775.1 RARB gene_id:5915|Hs108|chr3 ( 336) 323 71.6 1.4e-12
CCDS2642.1 RARB gene_id:5915|Hs108|chr3 ( 448) 323 71.7 1.7e-12
CCDS74905.1 NR2C2 gene_id:7182|Hs108|chr3 ( 596) 324 71.9 1.9e-12
CCDS2621.1 NR2C2 gene_id:7182|Hs108|chr3 ( 615) 324 71.9 2e-12
>>CCDS4803.1 PPARD gene_id:5467|Hs108|chr6 (441 aa)
initn: 2951 init1: 2951 opt: 2951 Z-score: 3044.2 bits: 572.4 E(32554): 3e-163
Smith-Waterman score: 2951; 100.0% identity (100.0% similar) in 441 aa overlap (1-441:1-441)
10 20 30 40 50 60
pF1KB4 MEQPQEEAPEVREEEEKEEVAEAEGAPELNGGPQHALPSSSYTDLSRSSSPPSLLDQLQM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 MEQPQEEAPEVREEEEKEEVAEAEGAPELNGGPQHALPSSSYTDLSRSSSPPSLLDQLQM
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 GCDGASCGSLNMECRVCGDKASGFHYGVHACEGCKGFFRRTIRMKLEYEKCERSCKIQKK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 GCDGASCGSLNMECRVCGDKASGFHYGVHACEGCKGFFRRTIRMKLEYEKCERSCKIQKK
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB4 NRNKCQYCRFQKCLALGMSHNAIRFGRMPEAEKRKLVAGLTANEGSQYNPQVADLKAFSK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 NRNKCQYCRFQKCLALGMSHNAIRFGRMPEAEKRKLVAGLTANEGSQYNPQVADLKAFSK
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB4 HIYNAYLKNFNMTKKKARSILTGKASHTAPFVIHDIETLWQAEKGLVWKQLVNGLPPYKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 HIYNAYLKNFNMTKKKARSILTGKASHTAPFVIHDIETLWQAEKGLVWKQLVNGLPPYKE
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB4 ISVHVFYRCQCTTVETVRELTEFAKSIPSFSSLFLNDQVTLLKYGVHEAIFAMLASIVNK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 ISVHVFYRCQCTTVETVRELTEFAKSIPSFSSLFLNDQVTLLKYGVHEAIFAMLASIVNK
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB4 DGLLVANGSGFVTREFLRSLRKPFSDIIEPKFEFAVKFNALELDDSDLALFIAAIILCGD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 DGLLVANGSGFVTREFLRSLRKPFSDIIEPKFEFAVKFNALELDDSDLALFIAAIILCGD
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB4 RPGLMNVPRVEAIQDTILRALEFHLQANHPDAQYLFPKLLQKMADLRQLVTEHAQMMQRI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 RPGLMNVPRVEAIQDTILRALEFHLQANHPDAQYLFPKLLQKMADLRQLVTEHAQMMQRI
370 380 390 400 410 420
430 440
pF1KB4 KKTETETSLHPLLQEIYKDMY
:::::::::::::::::::::
CCDS48 KKTETETSLHPLLQEIYKDMY
430 440
>>CCDS54994.1 PPARD gene_id:5467|Hs108|chr6 (402 aa)
initn: 2668 init1: 2668 opt: 2668 Z-score: 2753.3 bits: 518.5 E(32554): 4.8e-147
Smith-Waterman score: 2668; 100.0% identity (100.0% similar) in 398 aa overlap (44-441:5-402)
20 30 40 50 60 70
pF1KB4 EEEKEEVAEAEGAPELNGGPQHALPSSSYTDLSRSSSPPSLLDQLQMGCDGASCGSLNME
::::::::::::::::::::::::::::::
CCDS54 MHQRDLSRSSSPPSLLDQLQMGCDGASCGSLNME
10 20 30
80 90 100 110 120 130
pF1KB4 CRVCGDKASGFHYGVHACEGCKGFFRRTIRMKLEYEKCERSCKIQKKNRNKCQYCRFQKC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 CRVCGDKASGFHYGVHACEGCKGFFRRTIRMKLEYEKCERSCKIQKKNRNKCQYCRFQKC
40 50 60 70 80 90
140 150 160 170 180 190
pF1KB4 LALGMSHNAIRFGRMPEAEKRKLVAGLTANEGSQYNPQVADLKAFSKHIYNAYLKNFNMT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 LALGMSHNAIRFGRMPEAEKRKLVAGLTANEGSQYNPQVADLKAFSKHIYNAYLKNFNMT
100 110 120 130 140 150
200 210 220 230 240 250
pF1KB4 KKKARSILTGKASHTAPFVIHDIETLWQAEKGLVWKQLVNGLPPYKEISVHVFYRCQCTT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 KKKARSILTGKASHTAPFVIHDIETLWQAEKGLVWKQLVNGLPPYKEISVHVFYRCQCTT
160 170 180 190 200 210
260 270 280 290 300 310
pF1KB4 VETVRELTEFAKSIPSFSSLFLNDQVTLLKYGVHEAIFAMLASIVNKDGLLVANGSGFVT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 VETVRELTEFAKSIPSFSSLFLNDQVTLLKYGVHEAIFAMLASIVNKDGLLVANGSGFVT
220 230 240 250 260 270
320 330 340 350 360 370
pF1KB4 REFLRSLRKPFSDIIEPKFEFAVKFNALELDDSDLALFIAAIILCGDRPGLMNVPRVEAI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 REFLRSLRKPFSDIIEPKFEFAVKFNALELDDSDLALFIAAIILCGDRPGLMNVPRVEAI
280 290 300 310 320 330
380 390 400 410 420 430
pF1KB4 QDTILRALEFHLQANHPDAQYLFPKLLQKMADLRQLVTEHAQMMQRIKKTETETSLHPLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 QDTILRALEFHLQANHPDAQYLFPKLLQKMADLRQLVTEHAQMMQRIKKTETETSLHPLL
340 350 360 370 380 390
440
pF1KB4 QEIYKDMY
::::::::
CCDS54 QEIYKDMY
400
>>CCDS4804.1 PPARD gene_id:5467|Hs108|chr6 (361 aa)
initn: 2412 init1: 2412 opt: 2412 Z-score: 2490.4 bits: 469.7 E(32554): 2.1e-132
Smith-Waterman score: 2412; 100.0% identity (100.0% similar) in 359 aa overlap (1-359:1-359)
10 20 30 40 50 60
pF1KB4 MEQPQEEAPEVREEEEKEEVAEAEGAPELNGGPQHALPSSSYTDLSRSSSPPSLLDQLQM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 MEQPQEEAPEVREEEEKEEVAEAEGAPELNGGPQHALPSSSYTDLSRSSSPPSLLDQLQM
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 GCDGASCGSLNMECRVCGDKASGFHYGVHACEGCKGFFRRTIRMKLEYEKCERSCKIQKK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 GCDGASCGSLNMECRVCGDKASGFHYGVHACEGCKGFFRRTIRMKLEYEKCERSCKIQKK
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB4 NRNKCQYCRFQKCLALGMSHNAIRFGRMPEAEKRKLVAGLTANEGSQYNPQVADLKAFSK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 NRNKCQYCRFQKCLALGMSHNAIRFGRMPEAEKRKLVAGLTANEGSQYNPQVADLKAFSK
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB4 HIYNAYLKNFNMTKKKARSILTGKASHTAPFVIHDIETLWQAEKGLVWKQLVNGLPPYKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 HIYNAYLKNFNMTKKKARSILTGKASHTAPFVIHDIETLWQAEKGLVWKQLVNGLPPYKE
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB4 ISVHVFYRCQCTTVETVRELTEFAKSIPSFSSLFLNDQVTLLKYGVHEAIFAMLASIVNK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 ISVHVFYRCQCTTVETVRELTEFAKSIPSFSSLFLNDQVTLLKYGVHEAIFAMLASIVNK
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB4 DGLLVANGSGFVTREFLRSLRKPFSDIIEPKFEFAVKFNALELDDSDLALFIAAIILCGD
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 DGLLVANGSGFVTREFLRSLRKPFSDIIEPKFEFAVKFNALELDDSDLALFIAAIILCGG
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB4 RPGLMNVPRVEAIQDTILRALEFHLQANHPDAQYLFPKLLQKMADLRQLVTEHAQMMQRI
CCDS48 E
>>CCDS54995.1 PPARD gene_id:5467|Hs108|chr6 (343 aa)
initn: 1956 init1: 1956 opt: 1956 Z-score: 2021.1 bits: 382.8 E(32554): 3e-106
Smith-Waterman score: 2026; 77.8% identity (77.8% similar) in 441 aa overlap (1-441:1-343)
10 20 30 40 50 60
pF1KB4 MEQPQEEAPEVREEEEKEEVAEAEGAPELNGGPQHALPSSSYTDLSRSSSPPSLLDQLQM
:::::::::::::::::::::::::::::::::::::::::::
CCDS54 MEQPQEEAPEVREEEEKEEVAEAEGAPELNGGPQHALPSSSYT-----------------
10 20 30 40
70 80 90 100 110 120
pF1KB4 GCDGASCGSLNMECRVCGDKASGFHYGVHACEGCKGFFRRTIRMKLEYEKCERSCKIQKK
CCDS54 ------------------------------------------------------------
130 140 150 160 170 180
pF1KB4 NRNKCQYCRFQKCLALGMSHNAIRFGRMPEAEKRKLVAGLTANEGSQYNPQVADLKAFSK
:::::::::::::::::::::::::::::::::::::::
CCDS54 ---------------------AIRFGRMPEAEKRKLVAGLTANEGSQYNPQVADLKAFSK
50 60 70 80
190 200 210 220 230 240
pF1KB4 HIYNAYLKNFNMTKKKARSILTGKASHTAPFVIHDIETLWQAEKGLVWKQLVNGLPPYKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 HIYNAYLKNFNMTKKKARSILTGKASHTAPFVIHDIETLWQAEKGLVWKQLVNGLPPYKE
90 100 110 120 130 140
250 260 270 280 290 300
pF1KB4 ISVHVFYRCQCTTVETVRELTEFAKSIPSFSSLFLNDQVTLLKYGVHEAIFAMLASIVNK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 ISVHVFYRCQCTTVETVRELTEFAKSIPSFSSLFLNDQVTLLKYGVHEAIFAMLASIVNK
150 160 170 180 190 200
310 320 330 340 350 360
pF1KB4 DGLLVANGSGFVTREFLRSLRKPFSDIIEPKFEFAVKFNALELDDSDLALFIAAIILCGD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 DGLLVANGSGFVTREFLRSLRKPFSDIIEPKFEFAVKFNALELDDSDLALFIAAIILCGD
210 220 230 240 250 260
370 380 390 400 410 420
pF1KB4 RPGLMNVPRVEAIQDTILRALEFHLQANHPDAQYLFPKLLQKMADLRQLVTEHAQMMQRI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 RPGLMNVPRVEAIQDTILRALEFHLQANHPDAQYLFPKLLQKMADLRQLVTEHAQMMQRI
270 280 290 300 310 320
430 440
pF1KB4 KKTETETSLHPLLQEIYKDMY
:::::::::::::::::::::
CCDS54 KKTETETSLHPLLQEIYKDMY
330 340
>>CCDS33669.1 PPARA gene_id:5465|Hs108|chr22 (468 aa)
initn: 1845 init1: 1018 opt: 1865 Z-score: 1925.4 bits: 365.5 E(32554): 6.3e-101
Smith-Waterman score: 1865; 68.8% identity (87.9% similar) in 404 aa overlap (40-441:66-468)
10 20 30 40 50 60
pF1KB4 EVREEEEKEEVAEAEGAPELNGGPQHALPSSSYTD-LSRSSSPPSLLDQLQMGC-DGASC
: :: :: .::: :. . : : .
CCDS33 EISQSIGEDSSGSFGFTEYQYLGSCPGSDGSVITDTLSPASSPSSVTYPVVPGSVDESPS
40 50 60 70 80 90
70 80 90 100 110 120
pF1KB4 GSLNMECRVCGDKASGFHYGVHACEGCKGFFRRTIRMKLEYEKCERSCKIQKKNRNKCQY
:.::.:::.:::::::.:::::::::::::::::::.:: :.::.:::::::::::::::
CCDS33 GALNIECRICGDKASGYHYGVHACEGCKGFFRRTIRLKLVYDKCDRSCKIQKKNRNKCQY
100 110 120 130 140 150
130 140 150 160 170 180
pF1KB4 CRFQKCLALGMSHNAIRFGRMPEAEKRKLVAGLTANEGSQYNPQVADLKAFSKHIYNAYL
:::.:::..:::::::::::::..:: :: : . . : . . ..::::...:.::.:::
CCDS33 CRFHKCLSVGMSHNAIRFGRMPRSEKAKLKAEILTCEHDIEDSETADLKSLAKRIYEAYL
160 170 180 190 200 210
190 200 210 220 230 240
pF1KB4 KNFNMTKKKARSILTGKASHTAPFVIHDIETLWQAEKGLVWKQLVNGLPPYKEISVHVFY
:::::.: ::: ::.::::.. ::::::.::: .::: :: : ..::. :: :..:.
CCDS33 KNFNMNKVKARVILSGKASNNPPFVIHDMETLCMAEKTLVAKLVANGIQN-KEAEVRIFH
220 230 240 250 260 270
250 260 270 280 290 300
pF1KB4 RCQCTTVETVRELTEFAKSIPSFSSLFLNDQVTLLKYGVHEAIFAMLASIVNKDGLLVAN
::::.:::: :::::::.::.:..: ::::::::::::.:::::::.:..::::.:::
CCDS33 CCQCTSVETVTELTEFAKAIPGFANLDLNDQVTLLKYGVYEAIFAMLSSVMNKDGMLVAY
280 290 300 310 320 330
310 320 330 340 350 360
pF1KB4 GSGFVTREFLRSLRKPFSDIIEPKFEFAVKFNALELDDSDLALFIAAIILCGDRPGLMNV
:.::.:::::.:::::: ::.::::.::.:::::::::::..::.:::: :::::::.::
CCDS33 GNGFITREFLKSLRKPFCDIMEPKFDFAMKFNALELDDSDISLFVAAIICCGDRPGLLNV
340 350 360 370 380 390
370 380 390 400 410 420
pF1KB4 PRVEAIQDTILRALEFHLQANHPDAQYLFPKLLQKMADLRQLVTEHAQMMQRIKKTETET
..: .:. :...:..:::.:::: .:::::::::::::::::::::..: :::::...
CCDS33 GHIEKMQEGIVHVLRLHLQSNHPDDIFLFPKLLQKMADLRQLVTEHAQLVQIIKKTESDA
400 410 420 430 440 450
430 440
pF1KB4 SLHPLLQEIYKDMY
.:::::::::.:::
CCDS33 ALHPLLQEIYRDMY
460
>>CCDS2610.2 PPARG gene_id:5468|Hs108|chr3 (477 aa)
initn: 1706 init1: 1163 opt: 1724 Z-score: 1780.1 bits: 338.6 E(32554): 7.9e-93
Smith-Waterman score: 1724; 62.9% identity (87.1% similar) in 396 aa overlap (49-441:83-477)
20 30 40 50 60 70
pF1KB4 EVAEAEGAPELNGGPQHALPSSSYTDLSRSSSPPSLLDQLQMGC---DGASCGSLNMECR
.::: .. :. . : . . .:::
CCDS26 IPFTRTDPVVADYKYDLKLQEYQSAIKVEPASPPYYSEKTQLYNKPHEEPSNSLMAIECR
60 70 80 90 100 110
80 90 100 110 120 130
pF1KB4 VCGDKASGFHYGVHACEGCKGFFRRTIRMKLEYEKCERSCKIQKKNRNKCQYCRFQKCLA
::::::::::::::::::::::::::::.:: :..:. .:.:.::.::::::::::::::
CCDS26 VCGDKASGFHYGVHACEGCKGFFRRTIRLKLIYDRCDLNCRIHKKSRNKCQYCRFQKCLA
120 130 140 150 160 170
140 150 160 170 180 190
pF1KB4 LGMSHNAIRFGRMPEAEKRKLVAGLTANEGSQYNPQVADLKAFSKHIYNAYLKNFNMTKK
.:::::::::::::.:::.::.: .... .: ::. :::.:..::.:..:.:.: .::
CCDS26 VGMSHNAIRFGRMPQAEKEKLLAEISSDI-DQLNPESADLRALAKHLYDSYIKSFPLTKA
180 190 200 210 220 230
200 210 220 230 240 250
pF1KB4 KARSILTGKASHTAPFVIHDIETLWQAEKGLVWKQLVNGLPPYKEISVHVFYRCQCTTVE
:::.:::::.. .::::.:...: ..: . .:... ::.....: :: .::
CCDS26 KARAILTGKTTDKSPFVIYDMNSLMMGEDKIKFKHITPLQEQSKEVAIRIFQGCQFRSVE
240 250 260 270 280 290
260 270 280 290 300 310
pF1KB4 TVRELTEFAKSIPSFSSLFLNDQVTLLKYGVHEAIFAMLASIVNKDGLLVANGSGFVTRE
.:.:.::.:::::.: .: :::::::::::::: :..::::..::::.:...:.::.:::
CCDS26 AVQEITEYAKSIPGFVNLDLNDQVTLLKYGVHEIIYTMLASLMNKDGVLISEGQGFMTRE
300 310 320 330 340 350
320 330 340 350 360 370
pF1KB4 FLRSLRKPFSDIIEPKFEFAVKFNALELDDSDLALFIAAIILCGDRPGLMNVPRVEAIQD
::.::::::.:..:::::::::::::::::::::.:::.::: ::::::.:: .: :::
CCDS26 FLKSLRKPFGDFMEPKFEFAVKFNALELDDSDLAIFIAVIILSGDRPGLLNVKPIEDIQD
360 370 380 390 400 410
380 390 400 410 420 430
pF1KB4 TILRALEFHLQANHPDAQYLFPKLLQKMADLRQLVTEHAQMMQRIKKTETETSLHPLLQE
..:.:::..:. :::... :: ::::::.::::.::::.:..: ::::::. ::::::::
CCDS26 NLLQALELQLKLNHPESSQLFAKLLQKMTDLRQIVTEHVQLLQVIKKTETDMSLHPLLQE
420 430 440 450 460 470
440
pF1KB4 IYKDMY
::::.:
CCDS26 IYKDLY
>>CCDS2609.1 PPARG gene_id:5468|Hs108|chr3 (505 aa)
initn: 1706 init1: 1163 opt: 1724 Z-score: 1779.7 bits: 338.7 E(32554): 8.2e-93
Smith-Waterman score: 1724; 62.9% identity (87.1% similar) in 396 aa overlap (49-441:111-505)
20 30 40 50 60 70
pF1KB4 EVAEAEGAPELNGGPQHALPSSSYTDLSRSSSPPSLLDQLQMGC---DGASCGSLNMECR
.::: .. :. . : . . .:::
CCDS26 IPFTRTDPVVADYKYDLKLQEYQSAIKVEPASPPYYSEKTQLYNKPHEEPSNSLMAIECR
90 100 110 120 130 140
80 90 100 110 120 130
pF1KB4 VCGDKASGFHYGVHACEGCKGFFRRTIRMKLEYEKCERSCKIQKKNRNKCQYCRFQKCLA
::::::::::::::::::::::::::::.:: :..:. .:.:.::.::::::::::::::
CCDS26 VCGDKASGFHYGVHACEGCKGFFRRTIRLKLIYDRCDLNCRIHKKSRNKCQYCRFQKCLA
150 160 170 180 190 200
140 150 160 170 180 190
pF1KB4 LGMSHNAIRFGRMPEAEKRKLVAGLTANEGSQYNPQVADLKAFSKHIYNAYLKNFNMTKK
.:::::::::::::.:::.::.: .... .: ::. :::.:..::.:..:.:.: .::
CCDS26 VGMSHNAIRFGRMPQAEKEKLLAEISSDI-DQLNPESADLRALAKHLYDSYIKSFPLTKA
210 220 230 240 250
200 210 220 230 240 250
pF1KB4 KARSILTGKASHTAPFVIHDIETLWQAEKGLVWKQLVNGLPPYKEISVHVFYRCQCTTVE
:::.:::::.. .::::.:...: ..: . .:... ::.....: :: .::
CCDS26 KARAILTGKTTDKSPFVIYDMNSLMMGEDKIKFKHITPLQEQSKEVAIRIFQGCQFRSVE
260 270 280 290 300 310
260 270 280 290 300 310
pF1KB4 TVRELTEFAKSIPSFSSLFLNDQVTLLKYGVHEAIFAMLASIVNKDGLLVANGSGFVTRE
.:.:.::.:::::.: .: :::::::::::::: :..::::..::::.:...:.::.:::
CCDS26 AVQEITEYAKSIPGFVNLDLNDQVTLLKYGVHEIIYTMLASLMNKDGVLISEGQGFMTRE
320 330 340 350 360 370
320 330 340 350 360 370
pF1KB4 FLRSLRKPFSDIIEPKFEFAVKFNALELDDSDLALFIAAIILCGDRPGLMNVPRVEAIQD
::.::::::.:..:::::::::::::::::::::.:::.::: ::::::.:: .: :::
CCDS26 FLKSLRKPFGDFMEPKFEFAVKFNALELDDSDLAIFIAVIILSGDRPGLLNVKPIEDIQD
380 390 400 410 420 430
380 390 400 410 420 430
pF1KB4 TILRALEFHLQANHPDAQYLFPKLLQKMADLRQLVTEHAQMMQRIKKTETETSLHPLLQE
..:.:::..:. :::... :: ::::::.::::.::::.:..: ::::::. ::::::::
CCDS26 NLLQALELQLKLNHPESSQLFAKLLQKMTDLRQIVTEHVQLLQVIKKTETDMSLHPLLQE
440 450 460 470 480 490
440
pF1KB4 IYKDMY
::::.:
CCDS26 IYKDLY
500
>>CCDS42593.1 NR1H2 gene_id:7376|Hs108|chr19 (460 aa)
initn: 535 init1: 250 opt: 516 Z-score: 536.2 bits: 108.4 E(32554): 1.5e-23
Smith-Waterman score: 534; 27.9% identity (57.9% similar) in 451 aa overlap (4-437:19-456)
10 20 30 40
pF1KB4 MEQPQEEAPEVREEEEKEEVAEAEGAPELNGGPQHALPSSSYTDL
:: :: . ... :: :::. .:... ..
CCDS42 MSSPTTSSLDTPLPGNGPPQPGAPS------SSPTVKEEGPEPWPGGPDPDVPGTDEASS
10 20 30 40 50
50 60 70 80 90 100
pF1KB4 SRSSS---PPSLLDQLQMGCDGASCGSLNME-CRVCGDKASGFHYGVHACEGCKGFFRRT
. :.. : . . : . :. : :::::::::::::.: .::::::::::.
CCDS42 ACSTDWVIPDPEEEPERKRKKGPAPKMLGHELCRVCGDKASGFHYNVLSCEGCKGFFRRS
60 70 80 90 100 110
110 120 130 140 150
pF1KB4 I-RMKLEYEKCER--SCKIQKKNRNKCQYCRFQKCLALGMSHNAIRFGRMPEAEK-RKLV
. : . :. .:... : ::: ::..:: :: .. . .. . .: ::
CCDS42 VVRGGARRYACRGGGTCQMDAFMRRKCQQCRLRKCKEAGMREQCVLSEEQIRKKKIRKQQ
120 130 140 150 160 170
160 170 180 190 200 210
pF1KB4 AGLTANEGSQYNPQVADLKAFSKHIYNAYLKNFNMTKKKARSILTGKASHTA--PFVIHD
.. : .:: .. .: . . . .. . ..... :.. .: .
CCDS42 QESQSQSQSPVGPQGSSSSASGPGASPGGSEAGSQGSGEGEGVQLTAAQELMIQQLVAAQ
180 190 200 210 220 230
220 230 240 250 260 270
pF1KB4 IE----TLWQAEKGLVWKQLVNGLPPYKEISVHVFYRCQCTTVETVRELTEFAKSIPSFS
.. .. . : : ... : .. . : . .. .:.:...:::..:.:
CCDS42 LQCNKRSFSDQPKVTPWP--LGADPQSRDARQQRFAHFTELAIISVQEIVDFAKQVPGFL
240 250 260 270 280 290
280 290 300 310 320
pF1KB4 SLFLNDQVTLLKYGVHEAIFAMLASIVNKDGLLVANGSGFVTR--EFLRS-LRKPFSDII
.: .::..::: .. : .. : :.. .. . :. .: :. :. : :
CCDS42 QLGREDQIALLKASTIEIMLLETARRYNHETECITFLKDFTYSKDDFHRAGLQVEF---I
300 310 320 330 340
330 340 350 360 370 380
pF1KB4 EPKFEFAVKFNALELDDSDLALFIAAIILCGDRPGLMNVPRVEAIQDTILRALEFHLQAN
.: :::. . : :::.. ::.:: :. .:::.... ::::.:. ..:: . . .
CCDS42 NPIFEFSRAMRRLGLDDAEYALLIAINIFSADRPNVQEPGRVEALQQPYVEALLSYTRIK
350 360 370 380 390 400
390 400 410 420 430 440
pF1KB4 HPDAQYLFPKLLQKMADLRQLVTEHAQMMQRIKKTETETSLHPLLQEIYKDMY
.:. : ::..:.:...:: : . :.... .. . . : :::.::.
CCDS42 RPQDQLRFPRMLMKLVSLRTLSSVHSEQVFALRLQDKK--LPPLLSEIWDVHE
410 420 430 440 450 460
>>CCDS73750.1 NR2E3 gene_id:10002|Hs108|chr15 (410 aa)
initn: 476 init1: 192 opt: 468 Z-score: 487.5 bits: 99.3 E(32554): 7.8e-21
Smith-Waterman score: 468; 27.9% identity (58.9% similar) in 409 aa overlap (46-439:24-410)
20 30 40 50 60 70
pF1KB4 EKEEVAEAEGAPELNGGPQHALPSSSYTDLSRSSSPPSLLDQLQMGCDGASCGSLNMECR
::. :: . .: : .. : ...::
CCDS73 METRPTALMSSTVAAAAPAAGAASRKESP----GRWGLGEDPTGV-SPSLQCR
10 20 30 40
80 90 100 110 120 130
pF1KB4 VCGDKASGFHYGVHACEGCKGFFRRTIRMKLEYEKCERS---CKIQKKNRNKCQYCRFQK
::::..:: :::..::.::.:::.:..: .: : .:. . : ..: .::.:: ::..:
CCDS73 VCGDSSSGKHYGIYACNGCSGFFKRSVRRRLIY-RCQVGAGMCPVDKAHRNQCQACRLKK
50 60 70 80 90 100
140 150 160 170 180 190
pF1KB4 CLALGMSHNAIRFGRMPEAEKRKLVAGLTANEGSQYNPQVADLKAFSKHIYNAYLKNFNM
:: ::...:.. :.:.. . . .. .: :. . :: .. .
CCDS73 CLQAGMNQDAVQNERQPRSTAQVHLDSMESNTESRPESLVAPPAPAGRSPRGP------T
110 120 130 140 150 160
200 210 220 230 240
pF1KB4 TKKKARSILTGKASHTAPFVIHDIETLWQAEKGLVWKQLVNGLP-----PYKEISVHVFY
. ::.. :. : .. . . . : . ..... : ::. : .
CCDS73 PMSAARAL--GH-HFMASLITAETCAKLEPEDADENIDVTSNDPEFPSSPYSSSSPCGLD
170 180 190 200 210
250 260 270 280 290 300
pF1KB4 RCQCTTVETVRELTEFAKSIPSFSSLFLNDQVTLLKYGVHEAIF--AMLASI-VNKDGLL
. :... . ...::..: :::: . ::: ::. . : .. :. :. ... ::
CCDS73 SIHETSARLLFMAVKWAKNLPVFSSLPFRDQVILLEEAWSELFLLGAIQWSLPLDSCPLL
220 230 240 250 260 270
310 320 330 340 350 360
pF1KB4 V---ANGSGFVT-REFLRSLRKPFSDIIEPKFEFAVKFNALELDDSDLALFIAAIILCGD
. :...: . : : :.. . ... : .: :: .: ...: . : ... .
CCDS73 APPEASAAGGAQGRLTLASME---TRVLQ---ETISRFRALAVDPTEFACMKALVLFKPE
280 290 300 310 320 330
370 380 390 400 410 420
pF1KB4 RPGLMNVPRVEAIQDTILRALEFHLQANHPDAQYLFPKLLQKMADLRQLVTEHAQMMQRI
:: . .:::.:: : : .:.::. : ::: . .:: ...:. ... .
CCDS73 TRGLKDPEHVEALQDQSQVMLSQHSKAHHPSQPVRFGKLLLLLPSLRFITAERIELL-FF
340 350 360 370 380 390
430 440
pF1KB4 KKTETETSLHPLLQEIYKDMY
.:: .: .. :: ...:.
CCDS73 RKTIGNTPMEKLLCDMFKN
400 410
>>CCDS11361.1 NR1D1 gene_id:9572|Hs108|chr17 (614 aa)
initn: 709 init1: 241 opt: 449 Z-score: 465.4 bits: 95.7 E(32554): 1.3e-19
Smith-Waterman score: 455; 46.1% identity (78.0% similar) in 141 aa overlap (30-158:78-218)
10 20 30 40 50
pF1KB4 MEQPQEEAPEVREEEEKEEVAEAEGAPELNGGPQHALPSSSYTDLSRSSSPPSLL----
.:.:. . ::: .. ..:::. :
CCDS11 CPTYFPPSPTGSLTQDPARSFGSIPPSLSDDGSPSSSSSSSSSSSSFYNGSPPGSLQVAM
50 60 70 80 90 100
60 70 80 90 100
pF1KB4 -DQLQMGCDGASCG--SLN---MECRVCGDKASGFHYGVHACEGCKGFFRRTIRMKLEYE
:. ... . .. . .:: . :.:::: ::::::::::::::::::::.:.....:.
CCDS11 EDSSRVSPSKSTSNITKLNGMVLLCKVCGDVASGFHYGVHACEGCKGFFRRSIQQNIQYK
110 120 130 140 150 160
110 120 130 140 150 160
pF1KB4 KCERS--CKIQKKNRNKCQYCRFQKCLALGMSHNAIRFGRMPEAEKRKLVAGLTANEGSQ
.: .. :.: . :::.:: :::.:::..:::..:.::::.:. ::....:
CCDS11 RCLKNENCSIVRINRNRCQQCRFKKCLSVGMSRDAVRFGRIPKREKQRMLAEMQSAMNLA
170 180 190 200 210 220
170 180 190 200 210 220
pF1KB4 YNPQVADLKAFSKHIYNAYLKNFNMTKKKARSILTGKASHTAPFVIHDIETLWQAEKGLV
CCDS11 NNQLSSQCPLETSPTQHPTPGPMGPSPPPAPVPSPLVGFSQFPQQLTPPRSPSPEPTVED
230 240 250 260 270 280
>--
initn: 307 init1: 150 opt: 327 Z-score: 339.8 bits: 72.5 E(32554): 1.3e-12
Smith-Waterman score: 327; 38.6% identity (66.3% similar) in 166 aa overlap (257-417:447-606)
230 240 250 260 270 280
pF1KB4 VWKQLVNGLPPYKEISVHVFYRCQCTTVETVRELTEFAKSIPSFSSLFLNDQVTLLKYGV
:::..:::: ::.: .: .::::::: :.
CCDS11 ACPMNMYPHGRSGRTVQEIWEDFSMSFTPAVREVVEFAKHIPGFRDLSQHDQVTLLKAGT
420 430 440 450 460 470
290 300 310 320 330 340
pF1KB4 HEAIFAMLASIVN-KDGLLVANGSGFVTREFLRSLRK----PFSDIIEPKFEFAVKFNAL
:.... .::. : :: .. :..: ::.. ..:.. :.:. :.:.:
CCDS11 FEVLMVRFASLFNVKDQTVM-----FLSRT-TYSLQELGAMGMGDLLSAMFDFSEKLNSL
480 490 500 510 520 530
350 360 370 380 390 400
pF1KB4 ELDDSDLALFIAAIILCGDRPGLMNVPRVEAIQDTILRALEFHLQANHPDAQYLFPKLLQ
: . .:.:: :.... .:: :. : :: .:.:.::::. . :.: : :::
CCDS11 ALTEEELGLFTAVVLVSADRSGMENSASVEQLQETLLRALRALVLKNRPLETSRFTKLLL
540 550 560 570 580 590
410 420 430 440
pF1KB4 KMADLRQLVTEHAQMMQRIKKTETETSLHPLLQEIYKDMY
:. ::: : . :.. .
CCDS11 KLPDLRTLNNMHSEKLLSFRVDAQ
600 610
441 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 03:06:38 2016 done: Fri Nov 4 03:06:39 2016
Total Scan time: 3.180 Total Display time: 0.070
Function used was FASTA [36.3.4 Apr, 2011]