FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB9734, 486 aa
1>>>pF1KB9734 486 - 486 aa - 486 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 11.5827+/-0.000965; mu= -9.1538+/- 0.057
mean_var=411.9180+/-87.046, 0's: 0 Z-trim(117.4): 783 B-trim: 183 in 1/53
Lambda= 0.063193
statistics sampled from 17266 (18174) to 17266 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.829), E-opt: 0.2 (0.558), width: 16
Scan time: 4.220
The best scores are: opt bits E(32554)
CCDS1925.2 EGR4 gene_id:1961|Hs108|chr2 ( 589) 3441 327.6 2.2e-89
CCDS44409.1 EGR2 gene_id:1959|Hs108|chr10 ( 426) 596 68.1 2.1e-11
CCDS4206.1 EGR1 gene_id:1958|Hs108|chr5 ( 543) 598 68.4 2.2e-11
CCDS7267.1 EGR2 gene_id:1959|Hs108|chr10 ( 476) 596 68.2 2.3e-11
CCDS56528.1 EGR3 gene_id:1960|Hs108|chr8 ( 349) 574 66.0 7.3e-11
CCDS6033.1 EGR3 gene_id:1960|Hs108|chr8 ( 387) 574 66.1 7.9e-11
>>CCDS1925.2 EGR4 gene_id:1961|Hs108|chr2 (589 aa)
initn: 3441 init1: 3441 opt: 3441 Z-score: 1718.1 bits: 327.6 E(32554): 2.2e-89
Smith-Waterman score: 3441; 100.0% identity (100.0% similar) in 486 aa overlap (1-486:104-589)
10 20 30
pF1KB9 MLHLSEFSEPDALLVKSTEGCCAEPSAELP
::::::::::::::::::::::::::::::
CCDS19 GEPLPPASPPPARPQAQRARPRAPHSRRRAMLHLSEFSEPDALLVKSTEGCCAEPSAELP
80 90 100 110 120 130
40 50 60 70 80 90
pF1KB9 RLPARDAPAATGYPGAGDFLSWALNSCGASGDLADSCFLEGPAPTPPPGLSYSGSFFIQA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 RLPARDAPAATGYPGAGDFLSWALNSCGASGDLADSCFLEGPAPTPPPGLSYSGSFFIQA
140 150 160 170 180 190
100 110 120 130 140 150
pF1KB9 VPEHPHDPEALFNLMSGILGLAPFPGPEAAASRSPLDAPFPAGSDALLPGPPDLYSPDLG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 VPEHPHDPEALFNLMSGILGLAPFPGPEAAASRSPLDAPFPAGSDALLPGPPDLYSPDLG
200 210 220 230 240 250
160 170 180 190 200 210
pF1KB9 AAPFPEAFWEASPCAGAPSQCLYEPQLSPPDVKPGLRAPPASPALDAVSAFKGPYAPWEL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 AAPFPEAFWEASPCAGAPSQCLYEPQLSPPDVKPGLRAPPASPALDAVSAFKGPYAPWEL
260 270 280 290 300 310
220 230 240 250 260 270
pF1KB9 LSVGAPGNCGSQGDYQAAPEARFPVIGTKIEDLLSISCPAELPAVPANRLYPSGAYDAFP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 LSVGAPGNCGSQGDYQAAPEARFPVIGTKIEDLLSISCPAELPAVPANRLYPSGAYDAFP
320 330 340 350 360 370
280 290 300 310 320 330
pF1KB9 LAPGDLGEGAEGLPGLLTPPSGEGGSSGDGGEFLASTQPQLSPLGLRSAAAADFPKPLVA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 LAPGDLGEGAEGLPGLLTPPSGEGGSSGDGGEFLASTQPQLSPLGLRSAAAADFPKPLVA
380 390 400 410 420 430
340 350 360 370 380 390
pF1KB9 DIPGSSGVAAPPVPPPPPTPFPQAKARRKGRRGGKCSTRCFCPRPHAKAFACPVESCVRS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 DIPGSSGVAAPPVPPPPPTPFPQAKARRKGRRGGKCSTRCFCPRPHAKAFACPVESCVRS
440 450 460 470 480 490
400 410 420 430 440 450
pF1KB9 FARSDELNRHLRIHTGHKPFQCRICLRNFSRSDHLTTHVRTHTGEKPFACDVCGRRFARS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 FARSDELNRHLRIHTGHKPFQCRICLRNFSRSDHLTTHVRTHTGEKPFACDVCGRRFARS
500 510 520 530 540 550
460 470 480
pF1KB9 DEKKRHSKVHLKQKARAEERLKGLGFYSLGLSFASL
::::::::::::::::::::::::::::::::::::
CCDS19 DEKKRHSKVHLKQKARAEERLKGLGFYSLGLSFASL
560 570 580
>>CCDS44409.1 EGR2 gene_id:1959|Hs108|chr10 (426 aa)
initn: 803 init1: 541 opt: 596 Z-score: 318.2 bits: 68.1 E(32554): 2.1e-11
Smith-Waterman score: 649; 38.0% identity (51.2% similar) in 418 aa overlap (73-466:30-376)
50 60 70 80 90
pF1KB9 YPGAGDFLSWALNSCGASGDLADSCFLEGPAPTPPP---GLSYSGSFFIQAVPEHPHD--
::. : ..: :.: :. :..:
CCDS44 MNGVAGDGMINIDMTGEKRSLDLPYPSSFAPVSAPRNQTFTYMGKFSID--PQYPGASC
10 20 30 40 50
100 110 120 130 140
pF1KB9 -PEALFNLMS-GILGLAPFPGPEAA------ASRSPLDAPFPAGSDALLPGPPDL---YS
::...:..: ::: . :. .: :: .:: : : : .. ::: ::
CCDS44 YPEGIINIVSAGILQGVTSPASTTASSSVTSASPNPL-ATGPLGVCTMSQTQPDLDHLYS
60 70 80 90 100 110
150 160 170 180 190
pF1KB9 PDLGAAPFPEAFWEASPCAGA----PSQCLYEPQLSPPD---VKPGLRAPPASPALDAVS
: : : . : ::: :: : : . : : .:: : .
CCDS44 P----PPPPPPY---SGCAGDLYQDPSAFLSAATTSTSSSLAYPPPPSYPSPKPATDP-G
120 130 140 150 160
200 210 220 230 240 250
pF1KB9 AFKGPYAPWELLSVGAPGNCGSQGDYQAAPEARFPVIGTKIEDLLSISCPAELPAVPANR
: :. : :: :: . . :: : . :: . ::
CCDS44 LF--PMIP------DYPGFFPSQ--------CQRDLHGTAGPDRKPFPCPLDTLRVPPP-
170 180 190 200 210
260 270 280 290 300 310
pF1KB9 LYPSGAYDAFPLAPGDLGEGAEGLPGLLTPPSGEGGSSGDGGEFLASTQPQLSPLGLRSA
: : .. : :: . :. : :.. ::: : :.: : : ::
CCDS44 LTPLSTIRNFT-----LGGPSAGVTG----PGASGGSEG----------PRL-P-GSSSA
220 230 240 250
320 330 340 350 360 370
pF1KB9 AAADFPKPLVADIPGSSGVAAPPVPPPPPTPF-PQAKARRKGRRGGKCSTRCFCPRPHAK
::: .:: . : :. : . :. : .: . : .
CCDS44 AAA---------------AAAAAAYNPHHLPLRPILRPRKYPNRPSKTPV-------HER
260 270 280
380 390 400 410 420 430
pF1KB9 AFACPVESCVRSFARSDELNRHLRIHTGHKPFQCRICLRNFSRSDHLTTHVRTHTGEKPF
. ::.:.: : :.:::::.::.::::::::::::::.::::::::::::.:::::::::
CCDS44 PYPCPAEGCDRRFSRSDELTRHIRIHTGHKPFQCRICMRNFSRSDHLTTHIRTHTGEKPF
290 300 310 320 330 340
440 450 460 470 480
pF1KB9 ACDVCGRRFARSDEKKRHSKVHLKQKARAEERLKGLGFYSLGLSFASL
::: :::.::::::.:::.:.::.:: :
CCDS44 ACDYCGRKFARSDERKRHTKIHLRQKERKSSAPSASVPAPSTASCSGGVQPGGTLCSSNS
350 360 370 380 390 400
>>CCDS4206.1 EGR1 gene_id:1958|Hs108|chr5 (543 aa)
initn: 686 init1: 575 opt: 598 Z-score: 317.8 bits: 68.4 E(32554): 2.2e-11
Smith-Waterman score: 668; 34.8% identity (55.7% similar) in 465 aa overlap (23-470:17-428)
10 20 30 40 50
pF1KB9 MLHLSEFSEPDALLVKSTEGCCAEPSAELPRLPARDA-PAATGY----PGAGDFLSWALN
..: . .:. :. : : . :: .::. :
CCDS42 MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKLEEMMLLSNGAPQFLGAAGA
10 20 30 40 50
60 70 80 90 100 110
pF1KB9 SCGASGDLADSCFLEGPAPTPPPGLSYSGSFFI-QA-VPEHPHDPEALFNLMSGILGLAP
:.... ..: : . . : :.: : :: . :.:.. :
CCDS42 PEGSGSNSSSSSSGGGGGGGGGSNSSSSSSTFNPQADTGEQPYEH----------LTAES
60 70 80 90 100
120 130 140 150 160 170
pF1KB9 FPGPEAAASRSPLDAPFPAGSDALLPGPPDLYSPDLGAAPFPEA---FWEASPCAGAPSQ
:: . ... .:. . : :: :. .. : :.. .: : . :
CCDS42 FPDISLNNEKVLVETSYPSQTTRL---PPITYTGRFSLEPAPNSGNTLWPE-PLFSLVSG
110 120 130 140 150 160
180 190 200 210 220 230
pF1KB9 CLYEPQLSPPDVKPGLRAPPASPALDAVSAFKGPYAPWELLSVGAPGNCGSQGDYQAAPE
. . .:: . . :: ::: ...:: ..: : :: ..:.: :. :.:::
CCDS42 LV--SMTNPPASSSS--AP--SPAASSASASQSP--P---LSCAVPSN-DSSPIYSAAPT
170 180 190 200
240 250 260 270 280
pF1KB9 ARFPVIGTKIEDLLSISCPAELPAVPANRL-YPSGAYDAFPLAPGDLGEGAEGLPGLLTP
::. .: :.. .:. .. : :: :: : : : : . .: : :
CCDS42 --FPTPNT---DIFPEPQSQAFPGSAGTALQYPPPAY---PAAKG--GFQVPMIPDYLFP
210 220 230 240 250
290 300 310 320 330 340
pF1KB9 PS-GEGG-SSGDGGEFLA----STQPQLSPLGLRSAAAADFPKPLVADIPGSSGVAAPPV
. :. : .. : : . . ::.:.::. .: :.. ::. . : .
CCDS42 QQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKAFATQ---------SGSQDLKALNT
260 270 280 290 300
350 360 370 380 390 400
pF1KB9 PPPPPTPFPQAKARRKGRRGGKCSTRCFCPRPHAKAFACPVESCVRSFARSDELNRHLRI
: .. :. : .: : :: . .::::::: : :.:::::.::.::
CCDS42 SYQSQLIKP-SRMRKYPNRPSKT------P-PHERPYACPVESCDRRFSRSDELTRHIRI
310 320 330 340 350 360
410 420 430 440 450 460
pF1KB9 HTGHKPFQCRICLRNFSRSDHLTTHVRTHTGEKPFACDVCGRRFARSDEKKRHSKVHLKQ
:::.::::::::.::::::::::::.::::::::::::.:::.::::::.:::.:.::.:
CCDS42 HTGQKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACDICGRKFARSDERKRHTKIHLRQ
370 380 390 400 410 420
470 480
pF1KB9 KARAEERLKGLGFYSLGLSFASL
: . ..
CCDS42 KDKKADKSVVASSATSSLSSYPSPVATSYPSPVTTSYPSPATTSYPSPVPTSFSSPGSST
430 440 450 460 470 480
>>CCDS7267.1 EGR2 gene_id:1959|Hs108|chr10 (476 aa)
initn: 803 init1: 541 opt: 596 Z-score: 317.5 bits: 68.2 E(32554): 2.3e-11
Smith-Waterman score: 649; 38.0% identity (51.2% similar) in 418 aa overlap (73-466:80-426)
50 60 70 80 90
pF1KB9 YPGAGDFLSWALNSCGASGDLADSCFLEGPAPTPPP---GLSYSGSFFIQAVPEHPHD--
::. : ..: :.: :. :..:
CCDS72 QMNGVAGDGMINIDMTGEKRSLDLPYPSSFAPVSAPRNQTFTYMGKFSID--PQYPGASC
50 60 70 80 90 100
100 110 120 130 140
pF1KB9 -PEALFNLMS-GILGLAPFPGPEAA------ASRSPLDAPFPAGSDALLPGPPDL---YS
::...:..: ::: . :. .: :: .:: : : : .. ::: ::
CCDS72 YPEGIINIVSAGILQGVTSPASTTASSSVTSASPNPL-ATGPLGVCTMSQTQPDLDHLYS
110 120 130 140 150 160
150 160 170 180 190
pF1KB9 PDLGAAPFPEAFWEASPCAGA----PSQCLYEPQLSPPD---VKPGLRAPPASPALDAVS
: : : . : ::: :: : : . : : .:: : .
CCDS72 P----PPPPPPY---SGCAGDLYQDPSAFLSAATTSTSSSLAYPPPPSYPSPKPATDP-G
170 180 190 200 210
200 210 220 230 240 250
pF1KB9 AFKGPYAPWELLSVGAPGNCGSQGDYQAAPEARFPVIGTKIEDLLSISCPAELPAVPANR
: :. : :: :: . . :: : . :: . ::
CCDS72 LF--PMIP------DYPGFFPSQ--------CQRDLHGTAGPDRKPFPCPLDTLRVPPP-
220 230 240 250 260
260 270 280 290 300 310
pF1KB9 LYPSGAYDAFPLAPGDLGEGAEGLPGLLTPPSGEGGSSGDGGEFLASTQPQLSPLGLRSA
: : .. : :: . :. : :.. ::: : :.: : : ::
CCDS72 LTPLSTIRNFT-----LGGPSAGVTG----PGASGGSEG----------PRL-P-GSSSA
270 280 290 300
320 330 340 350 360 370
pF1KB9 AAADFPKPLVADIPGSSGVAAPPVPPPPPTPF-PQAKARRKGRRGGKCSTRCFCPRPHAK
::: .:: . : :. : . :. : .: . : .
CCDS72 AAA---------------AAAAAAYNPHHLPLRPILRPRKYPNRPSKTPV-------HER
310 320 330
380 390 400 410 420 430
pF1KB9 AFACPVESCVRSFARSDELNRHLRIHTGHKPFQCRICLRNFSRSDHLTTHVRTHTGEKPF
. ::.:.: : :.:::::.::.::::::::::::::.::::::::::::.:::::::::
CCDS72 PYPCPAEGCDRRFSRSDELTRHIRIHTGHKPFQCRICMRNFSRSDHLTTHIRTHTGEKPF
340 350 360 370 380 390
440 450 460 470 480
pF1KB9 ACDVCGRRFARSDEKKRHSKVHLKQKARAEERLKGLGFYSLGLSFASL
::: :::.::::::.:::.:.::.:: :
CCDS72 ACDYCGRKFARSDERKRHTKIHLRQKERKSSAPSASVPAPSTASCSGGVQPGGTLCSSNS
400 410 420 430 440 450
>>CCDS56528.1 EGR3 gene_id:1960|Hs108|chr8 (349 aa)
initn: 834 init1: 554 opt: 574 Z-score: 308.5 bits: 66.0 E(32554): 7.3e-11
Smith-Waterman score: 599; 36.4% identity (54.0% similar) in 363 aa overlap (117-470:3-327)
90 100 110 120 130 140
pF1KB9 FIQAVPEHPHDPEALFNLMSGILGLAPFPGPEAAAS-RSPLDAPFPAGSDALLPGPPDLY
: :: : :. . . : :.: :
CCDS56 MEPCAAWSPRGGRENVMDIGLTNEKPNPELSY
10 20 30
150 160 170 180 190
pF1KB9 SPDLGAAPFPEAFWEASPCA-GAPSQCLYEPQLSPPDVKPG-LRAPPASPALDA----VS
: .. :: .. . : .::. . .: .. : : .:::: ::.. .:
CCDS56 SGSFQPAPGNKTVTYLGKFAFDSPSNWCQDNIISL--MSAGILGVPPASGALSTQTSTAS
40 50 60 70 80 90
200 210 220 230 240 250
pF1KB9 AFKGPYAPWELLSVGAP--GNCGSQGDYQAAPEARFPVIGTKIEDLLSISCPAELPAVPA
. : . : . . : .::: : . : . :. . . ::. .
CCDS56 MVQPPQGDVEAMYPALPPYSNCG---DLYSEPVSFHDPQGNPGLAYSPQDYQSAKPALDS
100 110 120 130 140
260 270 280 290 300 310
pF1KB9 NRLYPSGAYDAFPLAPGDLGEGAEGLPGLLTPPSGEGGSSGDGGEFLASTQPQLSPLGLR
: :.: . :.:.: : : .: . . . : ..::
CCDS56 N-LFPMIPDYNLYHHPNDMGSIPEHKPF-------------QGMDPIRVNPPPITPLETI
150 160 170 180 190
320 330 340 350 360 370
pF1KB9 SAAAADFPKPLVADIPGSSGVAAPPVPPPPPTPFPQAKARRKGRRGGKCSTRCFCPRPHA
.: : . :: ... ::. : : :. : .: . ::::
CCDS56 KA----FKDKQIH--PGFGSLPQPPLTLKPIRP------RKYPNRPSKTPLH---ERPHA
200 210 220 230
380 390 400 410 420 430
pF1KB9 KAFACPVESCVRSFARSDELNRHLRIHTGHKPFQCRICLRNFSRSDHLTTHVRTHTGEKP
::.:.: : :.:::::.:::::::::::::::::.:.::::::::::.::::::::
CCDS56 ----CPAEGCDRRFSRSDELTRHLRIHTGHKPFQCRICMRSFSRSDHLTTHIRTHTGEKP
240 250 260 270 280 290
440 450 460 470 480
pF1KB9 FACDVCGRRFARSDEKKRHSKVHLKQKARAEERLKGLGFYSLGLSFASL
:::. :::.::::::.:::.:.::::: . :.
CCDS56 FACEFCGRKFARSDERKRHAKIHLKQKEKKAEKGGAPSASSAPPVSLAPVVTTCA
300 310 320 330 340
>>CCDS6033.1 EGR3 gene_id:1960|Hs108|chr8 (387 aa)
initn: 834 init1: 554 opt: 574 Z-score: 307.9 bits: 66.1 E(32554): 7.9e-11
Smith-Waterman score: 600; 34.2% identity (53.9% similar) in 401 aa overlap (80-470:9-365)
50 60 70 80 90 100
pF1KB9 LSWALNSCGASGDLADSCFLEGPAPTPPPGLSYSGSFFIQAVPE--HPHDPEALFNLMSG
: . : ... .:. .:.. . .::.::
CCDS60 MTGKLAEKLPVTMSSLLNQLPDNLYPEEIPSALNLFSG
10 20 30
110 120 130 140 150 160
pF1KB9 ILGLAPFPGPEAAASRSPLDAPFPAGSDALLPGPPDLYSPDLGAAPFPEAFWEASPCA-G
. . :... .: : :.: :: .. :: .. . :
CCDS60 --SSDSVVHYNQMATENVMDI----GLTNEKPNPELSYSGSFQPAPGNKTVTYLGKFAFD
40 50 60 70 80 90
170 180 190 200 210
pF1KB9 APSQCLYEPQLSPPDVKPG-LRAPPASPALDA----VSAFKGPYAPWELLSVGAP--GNC
.::. . .: .. : : .:::: ::.. .: . : . : . . : .::
CCDS60 SPSNWCQDNIISL--MSAGILGVPPASGALSTQTSTASMVQPPQGDVEAMYPALPPYSNC
100 110 120 130 140 150
220 230 240 250 260 270
pF1KB9 GSQGDYQAAPEARFPVIGTKIEDLLSISCPAELPAVPANRLYPSGAYDAFPLAPGDLGEG
: : . : . :. . . ::. .: :.: . :.:.:
CCDS60 G---DLYSEPVSFHDPQGNPGLAYSPQDYQSAKPALDSN-LFPMIPDYNLYHHPNDMGSI
160 170 180 190 200
280 290 300 310 320 330
pF1KB9 AEGLPGLLTPPSGEGGSSGDGGEFLASTQPQLSPLGLRSAAAADFPKPLVADIPGSSGVA
: : .: . . . : ..:: .: : . :: ...
CCDS60 PEHKPF-------------QGMDPIRVNPPPITPLETIKA----FKDKQIH--PGFGSLP
210 220 230 240
340 350 360 370 380 390
pF1KB9 APPVPPPPPTPFPQAKARRKGRRGGKCSTRCFCPRPHAKAFACPVESCVRSFARSDELNR
::. : : :. : .: . :::: ::.:.: : :.:::::.:
CCDS60 QPPLTLKPIRP------RKYPNRPSKTPLH---ERPHA----CPAEGCDRRFSRSDELTR
250 260 270 280 290
400 410 420 430 440 450
pF1KB9 HLRIHTGHKPFQCRICLRNFSRSDHLTTHVRTHTGEKPFACDVCGRRFARSDEKKRHSKV
::::::::::::::::.:.::::::::::.:::::::::::. :::.::::::.:::.:.
CCDS60 HLRIHTGHKPFQCRICMRSFSRSDHLTTHIRTHTGEKPFACEFCGRKFARSDERKRHAKI
300 310 320 330 340 350
460 470 480
pF1KB9 HLKQKARAEERLKGLGFYSLGLSFASL
::::: . :.
CCDS60 HLKQKEKKAEKGGAPSASSAPPVSLAPVVTTCA
360 370 380
486 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 18:35:41 2016 done: Fri Nov 4 18:35:41 2016
Total Scan time: 4.220 Total Display time: 0.030
Function used was FASTA [36.3.4 Apr, 2011]