FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB5869, 463 aa
1>>>pF1KB5869 463 - 463 aa - 463 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 8.4156+/-0.000893; mu= 4.1307+/- 0.054
mean_var=165.3627+/-33.545, 0's: 0 Z-trim(111.8): 125 B-trim: 0 in 0/52
Lambda= 0.099737
statistics sampled from 12541 (12666) to 12541 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.737), E-opt: 0.2 (0.389), width: 16
Scan time: 3.440
The best scores are: opt bits E(32554)
CCDS1248.1 RXRG gene_id:6258|Hs108|chr1 ( 463) 3107 458.9 4.9e-129
CCDS72970.1 RXRG gene_id:6258|Hs108|chr1 ( 340) 2280 339.9 2.5e-93
CCDS35172.1 RXRA gene_id:6256|Hs108|chr9 ( 462) 2162 323.0 4.2e-88
CCDS4768.1 RXRB gene_id:6257|Hs108|chr6 ( 533) 1942 291.3 1.6e-78
CCDS59007.1 RXRB gene_id:6257|Hs108|chr6 ( 537) 1785 268.8 1e-71
CCDS10375.1 NR2F2 gene_id:7026|Hs108|chr15 ( 414) 976 152.3 9e-37
CCDS4068.1 NR2F1 gene_id:7025|Hs108|chr5 ( 423) 976 152.3 9.1e-37
CCDS13331.1 HNF4A gene_id:3172|Hs108|chr20 ( 417) 903 141.8 1.3e-33
CCDS46605.1 HNF4A gene_id:3172|Hs108|chr20 ( 464) 903 141.8 1.4e-33
CCDS13330.1 HNF4A gene_id:3172|Hs108|chr20 ( 474) 903 141.8 1.5e-33
CCDS6220.2 HNF4G gene_id:3174|Hs108|chr8 ( 445) 902 141.7 1.5e-33
CCDS68131.1 HNF4A gene_id:3172|Hs108|chr20 ( 395) 898 141.1 2.1e-33
CCDS46604.1 HNF4A gene_id:3172|Hs108|chr20 ( 442) 898 141.1 2.3e-33
CCDS74728.1 HNF4A gene_id:3172|Hs108|chr20 ( 449) 898 141.1 2.3e-33
CCDS42876.1 HNF4A gene_id:3172|Hs108|chr20 ( 452) 898 141.1 2.3e-33
CCDS83303.1 HNF4G gene_id:3174|Hs108|chr8 ( 408) 897 140.9 2.3e-33
CCDS45359.1 NR2F2 gene_id:7026|Hs108|chr15 ( 261) 571 93.9 2.1e-19
CCDS45358.1 NR2F2 gene_id:7026|Hs108|chr15 ( 281) 571 93.9 2.3e-19
CCDS8818.1 NR4A1 gene_id:3164|Hs108|chr12 ( 598) 524 87.3 4.6e-17
CCDS55828.1 NR4A1 gene_id:3164|Hs108|chr12 ( 611) 524 87.3 4.7e-17
CCDS73471.1 NR4A1 gene_id:3164|Hs108|chr12 ( 652) 524 87.4 5e-17
CCDS74905.1 NR2C2 gene_id:7182|Hs108|chr3 ( 596) 486 81.9 2e-15
CCDS2621.1 NR2C2 gene_id:7182|Hs108|chr3 ( 615) 486 81.9 2.1e-15
CCDS58060.1 ESRRG gene_id:2104|Hs108|chr1 ( 396) 472 79.8 5.8e-15
CCDS41821.1 NR2C1 gene_id:7181|Hs108|chr12 ( 467) 470 79.5 8.2e-15
CCDS44953.1 NR2C1 gene_id:7181|Hs108|chr12 ( 483) 470 79.5 8.4e-15
CCDS9051.1 NR2C1 gene_id:7181|Hs108|chr12 ( 603) 470 79.6 1e-14
CCDS73750.1 NR2E3 gene_id:10002|Hs108|chr15 ( 410) 444 75.7 9.8e-14
CCDS11366.1 RARA gene_id:5914|Hs108|chr17 ( 462) 438 74.9 2e-13
CCDS6744.1 NR4A3 gene_id:8013|Hs108|chr9 ( 443) 430 73.7 4.2e-13
CCDS8850.1 RARG gene_id:5916|Hs108|chr12 ( 454) 430 73.7 4.3e-13
CCDS12352.1 NR2F6 gene_id:2063|Hs108|chr19 ( 404) 427 73.3 5.3e-13
CCDS6743.1 NR4A3 gene_id:8013|Hs108|chr9 ( 626) 430 73.8 5.7e-13
CCDS6742.1 NR4A3 gene_id:8013|Hs108|chr9 ( 637) 430 73.8 5.7e-13
CCDS2642.1 RARB gene_id:5915|Hs108|chr3 ( 448) 425 73.0 7e-13
CCDS42317.1 RARA gene_id:5914|Hs108|chr17 ( 457) 424 72.9 7.9e-13
CCDS58236.1 RARG gene_id:5916|Hs108|chr12 ( 382) 422 72.6 8.3e-13
CCDS41790.1 RARG gene_id:5916|Hs108|chr12 ( 443) 422 72.6 9.4e-13
CCDS10177.1 RORA gene_id:6095|Hs108|chr15 ( 523) 395 68.7 1.6e-11
CCDS2201.1 NR4A2 gene_id:4929|Hs108|chr2 ( 598) 395 68.8 1.8e-11
CCDS69165.1 NR2E1 gene_id:7101|Hs108|chr6 ( 422) 391 68.1 2e-11
CCDS35137.1 NR6A1 gene_id:2649|Hs108|chr9 ( 480) 392 68.3 2e-11
CCDS33669.1 PPARA gene_id:5465|Hs108|chr22 ( 468) 388 67.7 2.9e-11
CCDS55340.1 NR6A1 gene_id:2649|Hs108|chr9 ( 475) 388 67.7 3e-11
CCDS65127.1 NR6A1 gene_id:2649|Hs108|chr9 ( 476) 388 67.7 3e-11
CCDS11361.1 NR1D1 gene_id:9572|Hs108|chr17 ( 614) 390 68.1 3e-11
CCDS6646.1 RORB gene_id:6096|Hs108|chr9 ( 459) 387 67.6 3.2e-11
CCDS73751.1 NR2E3 gene_id:10002|Hs108|chr15 ( 367) 385 67.2 3.2e-11
CCDS1401.1 NR5A2 gene_id:2494|Hs108|chr1 ( 541) 388 67.7 3.3e-11
CCDS45271.1 RORA gene_id:6095|Hs108|chr15 ( 468) 385 67.3 3.9e-11
>>CCDS1248.1 RXRG gene_id:6258|Hs108|chr1 (463 aa)
initn: 3107 init1: 3107 opt: 3107 Z-score: 2430.1 bits: 458.9 E(32554): 4.9e-129
Smith-Waterman score: 3107; 100.0% identity (100.0% similar) in 463 aa overlap (1-463:1-463)
10 20 30 40 50 60
pF1KB5 MYGNYSHFMKFPAGYGGSPGHTGSTSMSPSAALSTGKPMDSHPSYTDTPVSAPRTLSAVG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 MYGNYSHFMKFPAGYGGSPGHTGSTSMSPSAALSTGKPMDSHPSYTDTPVSAPRTLSAVG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB5 TPLNALGSPYRVITSAMGPPSGALAAPPGINLVAPPSSQLNVVNSVSSSEDIKPLPGLPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 TPLNALGSPYRVITSAMGPPSGALAAPPGINLVAPPSSQLNVVNSVSSSEDIKPLPGLPG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB5 IGNMNYPSTSPGSLVKHICAICGDRSSGKHYGVYSCEGCKGFFKRTIRKDLIYTCRDNKD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 IGNMNYPSTSPGSLVKHICAICGDRSSGKHYGVYSCEGCKGFFKRTIRKDLIYTCRDNKD
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB5 CLIDKRQRNRCQYCRYQKCLVMGMKREAVQEERQRSRERAESEAECATSGHEDMPVERIL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 CLIDKRQRNRCQYCRYQKCLVMGMKREAVQEERQRSRERAESEAECATSGHEDMPVERIL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB5 EAELAVEPKTESYGDMNMENSTNDPVTNICHAADKQLFTLVEWAKRIPHFSDLTLEDQVI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 EAELAVEPKTESYGDMNMENSTNDPVTNICHAADKQLFTLVEWAKRIPHFSDLTLEDQVI
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB5 LLRAGWNELLIASFSHRSVSVQDGILLATGLHVHRSSAHSAGVGSIFDRVLTELVSKMKD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 LLRAGWNELLIASFSHRSVSVQDGILLATGLHVHRSSAHSAGVGSIFDRVLTELVSKMKD
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB5 MQMDKSELGCLRAIVLFNPDAKGLSNPSEVETLREKVYATLEAYTKQKYPEQPGRFAKLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 MQMDKSELGCLRAIVLFNPDAKGLSNPSEVETLREKVYATLEAYTKQKYPEQPGRFAKLL
370 380 390 400 410 420
430 440 450 460
pF1KB5 LRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLETPLQIT
:::::::::::::::::::::::::::::::::::::::::::
CCDS12 LRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLETPLQIT
430 440 450 460
>>CCDS72970.1 RXRG gene_id:6258|Hs108|chr1 (340 aa)
initn: 2280 init1: 2280 opt: 2280 Z-score: 1789.0 bits: 339.9 E(32554): 2.5e-93
Smith-Waterman score: 2280; 100.0% identity (100.0% similar) in 340 aa overlap (124-463:1-340)
100 110 120 130 140 150
pF1KB5 APPSSQLNVVNSVSSSEDIKPLPGLPGIGNMNYPSTSPGSLVKHICAICGDRSSGKHYGV
::::::::::::::::::::::::::::::
CCDS72 MNYPSTSPGSLVKHICAICGDRSSGKHYGV
10 20 30
160 170 180 190 200 210
pF1KB5 YSCEGCKGFFKRTIRKDLIYTCRDNKDCLIDKRQRNRCQYCRYQKCLVMGMKREAVQEER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 YSCEGCKGFFKRTIRKDLIYTCRDNKDCLIDKRQRNRCQYCRYQKCLVMGMKREAVQEER
40 50 60 70 80 90
220 230 240 250 260 270
pF1KB5 QRSRERAESEAECATSGHEDMPVERILEAELAVEPKTESYGDMNMENSTNDPVTNICHAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 QRSRERAESEAECATSGHEDMPVERILEAELAVEPKTESYGDMNMENSTNDPVTNICHAA
100 110 120 130 140 150
280 290 300 310 320 330
pF1KB5 DKQLFTLVEWAKRIPHFSDLTLEDQVILLRAGWNELLIASFSHRSVSVQDGILLATGLHV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 DKQLFTLVEWAKRIPHFSDLTLEDQVILLRAGWNELLIASFSHRSVSVQDGILLATGLHV
160 170 180 190 200 210
340 350 360 370 380 390
pF1KB5 HRSSAHSAGVGSIFDRVLTELVSKMKDMQMDKSELGCLRAIVLFNPDAKGLSNPSEVETL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 HRSSAHSAGVGSIFDRVLTELVSKMKDMQMDKSELGCLRAIVLFNPDAKGLSNPSEVETL
220 230 240 250 260 270
400 410 420 430 440 450
pF1KB5 REKVYATLEAYTKQKYPEQPGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 REKVYATLEAYTKQKYPEQPGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLM
280 290 300 310 320 330
460
pF1KB5 EMLETPLQIT
::::::::::
CCDS72 EMLETPLQIT
340
>>CCDS35172.1 RXRA gene_id:6256|Hs108|chr9 (462 aa)
initn: 2139 init1: 1217 opt: 2162 Z-score: 1695.3 bits: 323.0 E(32554): 4.2e-88
Smith-Waterman score: 2162; 74.1% identity (87.2% similar) in 452 aa overlap (18-463:21-462)
10 20 30 40 50
pF1KB5 MYGNYSHFMKFPAGYGGSPGHTGSTSMS-PSAALSTGKPMDSHPSYTDTPVSAPRTL
:: :: ::. :: : : . : :. .:.: ::
CCDS35 MDTKHFLPLDFSTQVNSSLTSP--TGRGSMAAPSLHPSLGPGIGS-PGQLHSPIS---TL
10 20 30 40 50
60 70 80 90 100 110
pF1KB5 SAVGTPLNALGSPYRVITSAMGPPSGALAAPPGINLVAPPSSQLNV-VNSVSSSEDIKPL
: .:.:..: :. ::.: ::: : .. . : ... . : ::. .: :::::::::
CCDS35 S---SPINGMGPPFSVISSPMGPHSMSVPTTPTLGF-STGSPQLSSPMNPVSSSEDIKPP
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB5 PGLPGIGNM-NYPSTSPGSLVKHICAICGDRSSGKHYGVYSCEGCKGFFKRTIRKDLIYT
:: :. .. .:: . .:..:::::::::::::::::::::::::::::::.:::: ::
CCDS35 LGLNGVLKVPAHPSGNMASFTKHICAICGDRSSGKHYGVYSCEGCKGFFKRTVRKDLTYT
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB5 CRDNKDCLIDKRQRNRCQYCRYQKCLVMGMKREAVQEERQRSRERAESEAECATSGHEDM
::::::::::::::::::::::::::.::::::::::::::...: :.:.: ..:..:::
CCDS35 CRDNKDCLIDKRQRNRCQYCRYQKCLAMGMKREAVQEERQRGKDRNENEVESTSSANEDM
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB5 PVERILEAELAVEPKTESYGDMNM---ENSTNDPVTNICHAADKQLFTLVEWAKRIPHFS
:::::::::::::::::.: . :: .: ::::::::.::::::::::::::::::::
CCDS35 PVERILEAELAVEPKTETYVEANMGLNPSSPNDPVTNICQAADKQLFTLVEWAKRIPHFS
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB5 DLTLEDQVILLRAGWNELLIASFSHRSVSVQDGILLATGLHVHRSSAHSAGVGSIFDRVL
.: :.::::::::::::::::::::::..:.:::::::::::::.::::::::.::::::
CCDS35 ELPLDDQVILLRAGWNELLIASFSHRSIAVKDGILLATGLHVHRNSAHSAGVGAIFDRVL
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB5 TELVSKMKDMQMDKSELGCLRAIVLFNPDAKGLSNPSEVETLREKVYATLEAYTKQKYPE
:::::::.::::::.::::::::::::::.::::::.:::.:::::::.:::: :.::::
CCDS35 TELVSKMRDMQMDKTELGCLRAIVLFNPDSKGLSNPAEVEALREKVYASLEAYCKHKYPE
360 370 380 390 400 410
420 430 440 450 460
pF1KB5 QPGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLETPLQIT
::::::::::::::::::::::::::::::::::::::::::::::.: :.:
CCDS35 QPGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLEAPHQMT
420 430 440 450 460
>>CCDS4768.1 RXRB gene_id:6257|Hs108|chr6 (533 aa)
initn: 1926 init1: 1199 opt: 1942 Z-score: 1523.2 bits: 291.3 E(32554): 1.6e-78
Smith-Waterman score: 1984; 67.4% identity (81.8% similar) in 473 aa overlap (13-462:68-532)
10 20 30
pF1KB5 MYGNYSHFMKFPAGYGGSPGHTGSTSMSPSAA----LSTGKP
:: : : .: : ::... : : :
CCDS47 RRRPWLDPAAAAAAAVAGGEQQTPEPEPGEAGRDGM-GDSGRDSRSPDSSSPNPLPQGVP
40 50 60 70 80 90
40 50 60 70 80 90
pF1KB5 MDSHPSYTDTPVSAPRTLSAVGTPLNA------LGSPYRVITSAMGPPSGALAAPPGINL
: :. : .:: .:.. :.: ::::. ::.:.:: :. ::::..
CCDS47 PPSPPGPPLPPSTAP-SLGGSGAPPPPPMPPPPLGSPFPVISSSMGSPGLPPPAPPGFS-
100 110 120 130 140 150
100 110 120 130 140
pF1KB5 VAPPSS-QLNVVNSVSSS-----EDIKPLPGLPGIGNMNYPST--SPGSLVKHICAICGD
.: :: :.: . :. .. ::.:: : : :. ... : .::. :..::::::
CCDS47 -GPVSSPQINSTVSLPGGGSGPPEDVKP-PVL-GVRGLHCPPPPGGPGAG-KRLCAICGD
160 170 180 190 200 210
150 160 170 180 190 200
pF1KB5 RSSGKHYGVYSCEGCKGFFKRTIRKDLIYTCRDNKDCLIDKRQRNRCQYCRYQKCLVMGM
::::::::::::::::::::::::::: :.::::::: .:::::::::::::::::. ::
CCDS47 RSSGKHYGVYSCEGCKGFFKRTIRKDLTYSCRDNKDCTVDKRQRNRCQYCRYQKCLATGM
220 230 240 250 260 270
210 220 230 240 250
pF1KB5 KREAVQEERQRSRERAESEAECATSGHEDMPVERILEAELAVEPKTESY-----GDMNME
:::::::::::.... ....: : .. :.:::.:::::::::: :... : .
CCDS47 KREAVQEERQRGKDK-DGDGEGAGGAPEEMPVDRILEAELAVEQKSDQGVEGPGGTGGSG
280 290 300 310 320
260 270 280 290 300 310
pF1KB5 NSTNDPVTNICHAADKQLFTLVEWAKRIPHFSDLTLEDQVILLRAGWNELLIASFSHRSV
.: ::::::::.::::::::::::::::::::.: :.::::::::::::::::::::::.
CCDS47 SSPNDPVTNICQAADKQLFTLVEWAKRIPHFSSLPLDDQVILLRAGWNELLIASFSHRSI
330 340 350 360 370 380
320 330 340 350 360 370
pF1KB5 SVQDGILLATGLHVHRSSAHSAGVGSIFDRVLTELVSKMKDMQMDKSELGCLRAIVLFNP
.:.:::::::::::::.::::::::.:::::::::::::.::.:::.::::::::.::::
CCDS47 DVRDGILLATGLHVHRNSAHSAGVGAIFDRVLTELVSKMRDMRMDKTELGCLRAIILFNP
390 400 410 420 430 440
380 390 400 410 420 430
pF1KB5 DAKGLSNPSEVETLREKVYATLEAYTKQKYPEQPGRFAKLLLRLPALRSIGLKCLEHLFF
::::::::::::.:::::::.::.: ::::::: ::::::::::::::::::::::::::
CCDS47 DAKGLSNPSEVEVLREKVYASLETYCKQKYPEQQGRFAKLLLRLPALRSIGLKCLEHLFF
450 460 470 480 490 500
440 450 460
pF1KB5 FKLIGDTPIDTFLMEMLETPLQIT
::::::::::::::::::.: :.
CCDS47 FKLIGDTPIDTFLMEMLEAPHQLA
510 520 530
>>CCDS59007.1 RXRB gene_id:6257|Hs108|chr6 (537 aa)
initn: 1938 init1: 678 opt: 1785 Z-score: 1401.1 bits: 268.8 E(32554): 1e-71
Smith-Waterman score: 1966; 66.9% identity (81.1% similar) in 477 aa overlap (13-462:68-536)
10 20 30
pF1KB5 MYGNYSHFMKFPAGYGGSPGHTGSTSMSPSAA----LSTGKP
:: : : .: : ::... : : :
CCDS59 RRRPWLDPAAAAAAAVAGGEQQTPEPEPGEAGRDGM-GDSGRDSRSPDSSSPNPLPQGVP
40 50 60 70 80 90
40 50 60 70 80 90
pF1KB5 MDSHPSYTDTPVSAPRTLSAVGTPLNA------LGSPYRVITSAMGPPSGALAAPPGINL
: :. : .:: .:.. :.: ::::. ::.:.:: :. ::::..
CCDS59 PPSPPGPPLPPSTAP-SLGGSGAPPPPPMPPPPLGSPFPVISSSMGSPGLPPPAPPGFS-
100 110 120 130 140 150
100 110 120 130 140
pF1KB5 VAPPSS-QLNVVNSVSSS-----EDIKPLPGLPGIGNMNYPST--SPGSLVKHICAICGD
.: :: :.: . :. .. ::.:: : : :. ... : .::. :..::::::
CCDS59 -GPVSSPQINSTVSLPGGGSGPPEDVKP-PVL-GVRGLHCPPPPGGPGAG-KRLCAICGD
160 170 180 190 200 210
150 160 170 180 190 200
pF1KB5 RSSGKHYGVYSCEGCKGFFKRTIRKDLIYTCRDNKDCLIDKRQRNRCQYCRYQKCLVMGM
::::::::::::::::::::::::::: :.::::::: .:::::::::::::::::. ::
CCDS59 RSSGKHYGVYSCEGCKGFFKRTIRKDLTYSCRDNKDCTVDKRQRNRCQYCRYQKCLATGM
220 230 240 250 260 270
210 220 230 240 250
pF1KB5 KREAVQEERQRSRERAESEAECATSGHEDMPVERILEAELAVEPKTESY-----GDMNME
:::::::::::.... ....: : .. :.:::.:::::::::: :... : .
CCDS59 KREAVQEERQRGKDK-DGDGEGAGGAPEEMPVDRILEAELAVEQKSDQGVEGPGGTGGSG
280 290 300 310 320
260 270 280 290 300 310
pF1KB5 NSTNDPVTNICHAADKQLFTLVEWAKRIPHFSDLTLEDQVILLRAGWNELLIASFSHRSV
.: ::::::::.::::::::::::::::::::.: :.::::::::::::::::::::::.
CCDS59 SSPNDPVTNICQAADKQLFTLVEWAKRIPHFSSLPLDDQVILLRAGWNELLIASFSHRSI
330 340 350 360 370 380
320 330 340 350 360 370
pF1KB5 SVQDGILLATGLHVHRSSAHSAGVGSIFDR----VLTELVSKMKDMQMDKSELGCLRAIV
.:.:::::::::::::.::::::::.:::: :::::::::.::.:::.::::::::.
CCDS59 DVRDGILLATGLHVHRNSAHSAGVGAIFDRSLSRVLTELVSKMRDMRMDKTELGCLRAII
390 400 410 420 430 440
380 390 400 410 420 430
pF1KB5 LFNPDAKGLSNPSEVETLREKVYATLEAYTKQKYPEQPGRFAKLLLRLPALRSIGLKCLE
::::::::::::::::.:::::::.::.: ::::::: ::::::::::::::::::::::
CCDS59 LFNPDAKGLSNPSEVEVLREKVYASLETYCKQKYPEQQGRFAKLLLRLPALRSIGLKCLE
450 460 470 480 490 500
440 450 460
pF1KB5 HLFFFKLIGDTPIDTFLMEMLETPLQIT
::::::::::::::::::::::.: :.
CCDS59 HLFFFKLIGDTPIDTFLMEMLEAPHQLA
510 520 530
>>CCDS10375.1 NR2F2 gene_id:7026|Hs108|chr15 (414 aa)
initn: 822 init1: 389 opt: 976 Z-score: 773.7 bits: 152.3 E(32554): 9e-37
Smith-Waterman score: 976; 40.9% identity (69.6% similar) in 391 aa overlap (75-456:23-400)
50 60 70 80 90 100
pF1KB5 YTDTPVSAPRTLSAVGTPLNALGSPYRVITSAMGPPSGALAAPPGINLVAPPSSQLNVVN
....:: . ::: :: . : .
CCDS10 MAMVVSTWRDPQDEVPGSQGSQASQAPPVPG--PPPG----APHTPQTPGQG
10 20 30 40
110 120 130 140 150 160
pF1KB5 SVSSSEDIKPLPGLPGIGNMNYPSTSPGSLVKHI-CAICGDRSSGKHYGVYSCEGCKGFF
. .:. : : :. :... . .:: :..:::.::::::: ..:::::.::
CCDS10 GPASTPAQTAAGGQGGPGG---PGSDKQQQQQHIECVVCGDKSSGKHYGQFTCEGCKSFF
50 60 70 80 90 100
170 180 190 200 210 220
pF1KB5 KRTIRKDLIYTCRDNKDCLIDKRQRNRCQYCRYQKCLVMGMKREAVQEERQRSRERAESE
::..:..: :::: :..: ::...::.::::: .::: .::.::::: : : ..
CCDS10 KRSVRRNLSYTCRANRNCPIDQHHRNQCQYCRLKKCLKVGMRREAVQ--RGRMPPTQPTH
110 120 130 140 150 160
230 240 250 260 270
pF1KB5 AECATSGHEDMPVERILEAELAV----EP-KTESYGDMNMENSTNDPVTNICHAADKQLF
.. : .. . . . : . ... :: : .:.. :. .. . :::. : ..::
CCDS10 GQFALTNGDPLNCHSYLSGYISLLLRAEPYPTSRFGSQCMQPNNIMGIENICELAARMLF
170 180 190 200 210 220
280 290 300 310 320 330
pF1KB5 TLVEWAKRIPHFSDLTLEDQVILLRAGWNELLIASFSHRSVSVQDGILLAT-GLHVHRSS
. ::::. :: : :: . ::: ::: :.::.. . .. :. .. . :::. :::. :
CCDS10 SAVEWARNIPFFPDLQITDQVALLRLTWSELFVLNAAQCSMPLHVAPLLAAAGLHASPMS
230 240 250 260 270 280
340 350 360 370 380 390
pF1KB5 AHSAGVGSIFD--RVLTELVSKMKDMQMDKSELGCLRAIVLFNPDAKGLSNPSEVETLRE
: : ...: :.. : : :.: ...:..: .::.:::::. :: :::. ..::.:.:
CCDS10 ADR--VVAFMDHIRIFQEQVEKLKALHVDSAEYSCLKAIVLFTSDACGLSDVAHVESLQE
290 300 310 320 330
400 410 420 430 440 450
pF1KB5 KVYATLEAYTKQKYPEQPGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEM
: .:: :....::.:: ::.:::::::.::... . .:.::: .:.: :::.:.. .:
CCDS10 KSQCALEEYVRSQYPNQPTRFGKLLLRLPSLRTVSSSVIEQLFFVRLVGKTPIETLIRDM
340 350 360 370 380 390
460
pF1KB5 LETPLQIT
:
CCDS10 LLSGSSFNWPYMAIQ
400 410
>>CCDS4068.1 NR2F1 gene_id:7025|Hs108|chr5 (423 aa)
initn: 793 init1: 392 opt: 976 Z-score: 773.6 bits: 152.3 E(32554): 9.1e-37
Smith-Waterman score: 976; 40.0% identity (67.3% similar) in 413 aa overlap (53-456:11-407)
30 40 50 60 70 80
pF1KB5 GSTSMSPSAALSTGKPMDSHPSYTDTPVSAPRTLSAVGTPLNALGSPYRVITSAMGPPSG
:. : :.: :.: . .: : .:
CCDS40 MAMVVSSWRDPQDDVAGGNP----GGPNPAAQAARGGGGG
10 20 30
90 100 110 120 130 140
pF1KB5 ALAAPPGINLVAPPSSQLNVVNSVSSSEDIKPLPGLPGIGNMNYPSTSPGSLVKHI-CAI
: . :: . : . .. :: : ... :.. :. .:: :..
CCDS40 AGEQQQQAGSGAPHTPQ------TPGQPGAPATPGTAGDKGQGPPGS--GQSQQHIECVV
40 50 60 70 80
150 160 170 180 190 200
pF1KB5 CGDRSSGKHYGVYSCEGCKGFFKRTIRKDLIYTCRDNKDCLIDKRQRNRCQYCRYQKCLV
:::.::::::: ..:::::.::::..:..: :::: :..: ::...::.::::: .:::
CCDS40 CGDKSSGKHYGQFTCEGCKSFFKRSVRRNLTYTCRANRNCPIDQHHRNQCQYCRLKKCLK
90 100 110 120 130 140
210 220 230 240 250
pF1KB5 MGMKREAVQEERQRSRERAESEAECATSGHEDMPVERILEAELAV----EP-KTESYGDM
.::.::::: : : . .. : .. . . . : . ... :: : ::..
CCDS40 VGMRREAVQ--RGRMPPTQPNPGQYALTNGDPLNGHCYLSGYISLLLRAEPYPTSRYGSQ
150 160 170 180 190 200
260 270 280 290 300 310
pF1KB5 NMENSTNDPVTNICHAADKQLFTLVEWAKRIPHFSDLTLEDQVILLRAGWNELLIASFSH
:. .. . :::. : . ::. ::::. :: : :: . ::: ::: :.::.. . ..
CCDS40 CMQPNNIMGIENICELAARLLFSAVEWARNIPFFPDLQITDQVSLLRLTWSELFVLNAAQ
210 220 230 240 250 260
320 330 340 350 360 370
pF1KB5 RSVSVQDGILLAT-GLHVHRSSAHSAGVGSIFD--RVLTELVSKMKDMQMDKSELGCLRA
:. .. . :::. :::. :: : ...: :.. : : :.: ...:..: .::.:
CCDS40 CSMPLHVAPLLAAAGLHASPMSADR--VVAFMDHIRIFQEQVEKLKALHVDSAEYSCLKA
270 280 290 300 310 320
380 390 400 410 420 430
pF1KB5 IVLFNPDAKGLSNPSEVETLREKVYATLEAYTKQKYPEQPGRFAKLLLRLPALRSIGLKC
::::. :: :::. ...:.:.:: .:: :....::.::.::.:::::::.::... .
CCDS40 IVLFTSDACGLSDAAHIESLQEKSQCALEEYVRSQYPNQPSRFGKLLLRLPSLRTVSSSV
330 340 350 360 370 380
440 450 460
pF1KB5 LEHLFFFKLIGDTPIDTFLMEMLETPLQIT
.:.::: .:.: :::.:.. .::
CCDS40 IEQLFFVRLVGKTPIETLIRDMLLSGSSFNWPYMSIQCS
390 400 410 420
>>CCDS13331.1 HNF4A gene_id:3172|Hs108|chr20 (417 aa)
initn: 888 init1: 490 opt: 903 Z-score: 716.9 bits: 141.8 E(32554): 1.3e-33
Smith-Waterman score: 903; 39.2% identity (71.4% similar) in 370 aa overlap (93-456:12-374)
70 80 90 100 110 120
pF1KB5 LNALGSPYRVITSAMGPPSGALAAPPGINLVAPPSSQLNVVNSVSSSEDIKPLPGLPGIG
.: :. :. . .. :... : .:
CCDS13 MRLSKTLVDMDMADYSAALDPAYTTLEFENVQVLT----MG
10 20 30
130 140 150 160 170
pF1KB5 NMNYPS-----TSPGSL-VKHICAICGDRSSGKHYGVYSCEGCKGFFKRTIRKDLIYTCR
: . :: ..:.:: :. .:::::::..:::::. ::.::::::.:..::. .:.::
CCDS13 NDTSPSEGTNLNAPNSLGVSALCAICGDRATGKHYGASSCDGCKGFFRRSVRKNHMYSCR
40 50 60 70 80 90
180 190 200 210 220 230
pF1KB5 DNKDCLIDKRQRNRCQYCRYQKCLVMGMKREAVQEERQRSRERAESEAECATSGHEDMPV
...:..:: .::.:.::: .::. :::.::::.::.: : : . . . . .
CCDS13 FSRQCVVDKDKRNQCRYCRLKKCFRAGMKKEAVQNERDRISTRRSSYEDSSLPSINALLQ
100 110 120 130 140 150
240 250 260 270 280 290
pF1KB5 ERILEAELAVEPKTESYGDMNMENSTNDPVTNICHAADKQLFTLVEWAKRIPHFSDLTLE
..: ... : . ::. .. .. ....:.. .::..:::::: :: : .: :.
CCDS13 AEVLSRQIT-SPVSGINGDIRAKKIAS--IADVCESMKEQLLVLVEWAKYIPAFCELPLD
160 170 180 190 200 210
300 310 320 330 340 350
pF1KB5 DQVILLRAGWNELLIASFSHRSVSVQDGILLATGLHVHRSSAHSAGVGSIFDRVLTELVS
::: :::: .: :. . ..::. .: .::.. : : . : .. . :.: :::
CCDS13 DQVALLRAHAGEHLLLGATKRSMVFKDVLLLGNDYIVPRHCPELAEMSRVSIRILDELVL
220 230 240 250 260 270
360 370 380 390 400 410
pF1KB5 KMKDMQMDKSELGCLRAIVLFNPDAKGLSNPSEVETLREKVYATLEAYTKQKYPEQPGRF
....:.: .: . :.::..:.:::::::.:.... :: .: ..:: : ... .. :::
CCDS13 PFQELQIDDNEYAYLKAIIFFDPDAKGLSDPGKIKRLRSQVQVSLEDYINDRQYDSRGRF
280 290 300 310 320 330
420 430 440 450 460
pF1KB5 AKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLETPLQIT
..::: ::.:.:: . .:.. :.::.: . ::..:.:::
CCDS13 GELLLLLPTLQSITWQMIEQIQFIKLFGMAKIDNLLQEMLLGGPCQAQEGRGWSGDSPGD
340 350 360 370 380 390
CCDS13 RPHTVSSPLSSLASPLCRFGQVA
400 410
>>CCDS46605.1 HNF4A gene_id:3172|Hs108|chr20 (464 aa)
initn: 888 init1: 490 opt: 903 Z-score: 716.2 bits: 141.8 E(32554): 1.4e-33
Smith-Waterman score: 903; 39.2% identity (71.4% similar) in 370 aa overlap (93-456:12-374)
70 80 90 100 110 120
pF1KB5 LNALGSPYRVITSAMGPPSGALAAPPGINLVAPPSSQLNVVNSVSSSEDIKPLPGLPGIG
.: :. :. . .. :... : .:
CCDS46 MRLSKTLVDMDMADYSAALDPAYTTLEFENVQVLT----MG
10 20 30
130 140 150 160 170
pF1KB5 NMNYPS-----TSPGSL-VKHICAICGDRSSGKHYGVYSCEGCKGFFKRTIRKDLIYTCR
: . :: ..:.:: :. .:::::::..:::::. ::.::::::.:..::. .:.::
CCDS46 NDTSPSEGTNLNAPNSLGVSALCAICGDRATGKHYGASSCDGCKGFFRRSVRKNHMYSCR
40 50 60 70 80 90
180 190 200 210 220 230
pF1KB5 DNKDCLIDKRQRNRCQYCRYQKCLVMGMKREAVQEERQRSRERAESEAECATSGHEDMPV
...:..:: .::.:.::: .::. :::.::::.::.: : : . . . . .
CCDS46 FSRQCVVDKDKRNQCRYCRLKKCFRAGMKKEAVQNERDRISTRRSSYEDSSLPSINALLQ
100 110 120 130 140 150
240 250 260 270 280 290
pF1KB5 ERILEAELAVEPKTESYGDMNMENSTNDPVTNICHAADKQLFTLVEWAKRIPHFSDLTLE
..: ... : . ::. .. .. ....:.. .::..:::::: :: : .: :.
CCDS46 AEVLSRQIT-SPVSGINGDIRAKKIAS--IADVCESMKEQLLVLVEWAKYIPAFCELPLD
160 170 180 190 200 210
300 310 320 330 340 350
pF1KB5 DQVILLRAGWNELLIASFSHRSVSVQDGILLATGLHVHRSSAHSAGVGSIFDRVLTELVS
::: :::: .: :. . ..::. .: .::.. : : . : .. . :.: :::
CCDS46 DQVALLRAHAGEHLLLGATKRSMVFKDVLLLGNDYIVPRHCPELAEMSRVSIRILDELVL
220 230 240 250 260 270
360 370 380 390 400 410
pF1KB5 KMKDMQMDKSELGCLRAIVLFNPDAKGLSNPSEVETLREKVYATLEAYTKQKYPEQPGRF
....:.: .: . :.::..:.:::::::.:.... :: .: ..:: : ... .. :::
CCDS46 PFQELQIDDNEYAYLKAIIFFDPDAKGLSDPGKIKRLRSQVQVSLEDYINDRQYDSRGRF
280 290 300 310 320 330
420 430 440 450 460
pF1KB5 AKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLETPLQIT
..::: ::.:.:: . .:.. :.::.: . ::..:.:::
CCDS46 GELLLLLPTLQSITWQMIEQIQFIKLFGMAKIDNLLQEMLLGGSPSDAPHAHHPLHPHLM
340 350 360 370 380 390
CCDS46 QEHMGTNVIVANTMPTHLSNGQMSTPETPQPSPPGGSGSEPYKLLPGAVATIVKPLSAIP
400 410 420 430 440 450
>>CCDS13330.1 HNF4A gene_id:3172|Hs108|chr20 (474 aa)
initn: 888 init1: 490 opt: 903 Z-score: 716.0 bits: 141.8 E(32554): 1.5e-33
Smith-Waterman score: 903; 39.2% identity (71.4% similar) in 370 aa overlap (93-456:12-374)
70 80 90 100 110 120
pF1KB5 LNALGSPYRVITSAMGPPSGALAAPPGINLVAPPSSQLNVVNSVSSSEDIKPLPGLPGIG
.: :. :. . .. :... : .:
CCDS13 MRLSKTLVDMDMADYSAALDPAYTTLEFENVQVLT----MG
10 20 30
130 140 150 160 170
pF1KB5 NMNYPS-----TSPGSL-VKHICAICGDRSSGKHYGVYSCEGCKGFFKRTIRKDLIYTCR
: . :: ..:.:: :. .:::::::..:::::. ::.::::::.:..::. .:.::
CCDS13 NDTSPSEGTNLNAPNSLGVSALCAICGDRATGKHYGASSCDGCKGFFRRSVRKNHMYSCR
40 50 60 70 80 90
180 190 200 210 220 230
pF1KB5 DNKDCLIDKRQRNRCQYCRYQKCLVMGMKREAVQEERQRSRERAESEAECATSGHEDMPV
...:..:: .::.:.::: .::. :::.::::.::.: : : . . . . .
CCDS13 FSRQCVVDKDKRNQCRYCRLKKCFRAGMKKEAVQNERDRISTRRSSYEDSSLPSINALLQ
100 110 120 130 140 150
240 250 260 270 280 290
pF1KB5 ERILEAELAVEPKTESYGDMNMENSTNDPVTNICHAADKQLFTLVEWAKRIPHFSDLTLE
..: ... : . ::. .. .. ....:.. .::..:::::: :: : .: :.
CCDS13 AEVLSRQIT-SPVSGINGDIRAKKIAS--IADVCESMKEQLLVLVEWAKYIPAFCELPLD
160 170 180 190 200 210
300 310 320 330 340 350
pF1KB5 DQVILLRAGWNELLIASFSHRSVSVQDGILLATGLHVHRSSAHSAGVGSIFDRVLTELVS
::: :::: .: :. . ..::. .: .::.. : : . : .. . :.: :::
CCDS13 DQVALLRAHAGEHLLLGATKRSMVFKDVLLLGNDYIVPRHCPELAEMSRVSIRILDELVL
220 230 240 250 260 270
360 370 380 390 400 410
pF1KB5 KMKDMQMDKSELGCLRAIVLFNPDAKGLSNPSEVETLREKVYATLEAYTKQKYPEQPGRF
....:.: .: . :.::..:.:::::::.:.... :: .: ..:: : ... .. :::
CCDS13 PFQELQIDDNEYAYLKAIIFFDPDAKGLSDPGKIKRLRSQVQVSLEDYINDRQYDSRGRF
280 290 300 310 320 330
420 430 440 450 460
pF1KB5 AKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLETPLQIT
..::: ::.:.:: . .:.. :.::.: . ::..:.:::
CCDS13 GELLLLLPTLQSITWQMIEQIQFIKLFGMAKIDNLLQEMLLGGSPSDAPHAHHPLHPHLM
340 350 360 370 380 390
CCDS13 QEHMGTNVIVANTMPTHLSNGQMCEWPRPRGQAATPETPQPSPPGGSGSEPYKLLPGAVA
400 410 420 430 440 450
463 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 15:23:31 2016 done: Sat Nov 5 15:23:31 2016
Total Scan time: 3.440 Total Display time: 0.080
Function used was FASTA [36.3.4 Apr, 2011]