FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB8985, 387 aa 1>>>pF1KB8985 387 - 387 aa - 387 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.5883+/-0.000934; mu= 3.0606+/- 0.055 mean_var=265.7092+/-56.068, 0's: 0 Z-trim(114.4): 857 B-trim: 0 in 0/52 Lambda= 0.078681 statistics sampled from 13999 (14974) to 13999 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.791), E-opt: 0.2 (0.46), width: 16 Scan time: 3.110 The best scores are: opt bits E(32554) CCDS6033.1 EGR3 gene_id:1960|Hs108|chr8 ( 387) 2704 319.9 2.4e-87 CCDS56528.1 EGR3 gene_id:1960|Hs108|chr8 ( 349) 2380 283.1 2.6e-76 CCDS4206.1 EGR1 gene_id:1958|Hs108|chr5 ( 543) 968 123.0 6.3e-28 CCDS44409.1 EGR2 gene_id:1959|Hs108|chr10 ( 426) 768 100.2 3.7e-21 CCDS7267.1 EGR2 gene_id:1959|Hs108|chr10 ( 476) 768 100.3 3.9e-21 CCDS1925.2 EGR4 gene_id:1961|Hs108|chr2 ( 589) 574 78.3 1.9e-14 >>CCDS6033.1 EGR3 gene_id:1960|Hs108|chr8 (387 aa) initn: 2704 init1: 2704 opt: 2704 Z-score: 1681.6 bits: 319.9 E(32554): 2.4e-87 Smith-Waterman score: 2704; 100.0% identity (100.0% similar) in 387 aa overlap (1-387:1-387) 10 20 30 40 50 60 pF1KB8 MTGKLAEKLPVTMSSLLNQLPDNLYPEEIPSALNLFSGSSDSVVHYNQMATENVMDIGLT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 MTGKLAEKLPVTMSSLLNQLPDNLYPEEIPSALNLFSGSSDSVVHYNQMATENVMDIGLT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB8 NEKPNPELSYSGSFQPAPGNKTVTYLGKFAFDSPSNWCQDNIISLMSAGILGVPPASGAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 NEKPNPELSYSGSFQPAPGNKTVTYLGKFAFDSPSNWCQDNIISLMSAGILGVPPASGAL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB8 STQTSTASMVQPPQGDVEAMYPALPPYSNCGDLYSEPVSFHDPQGNPGLAYSPQDYQSAK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 STQTSTASMVQPPQGDVEAMYPALPPYSNCGDLYSEPVSFHDPQGNPGLAYSPQDYQSAK 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB8 PALDSNLFPMIPDYNLYHHPNDMGSIPEHKPFQGMDPIRVNPPPITPLETIKAFKDKQIH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 PALDSNLFPMIPDYNLYHHPNDMGSIPEHKPFQGMDPIRVNPPPITPLETIKAFKDKQIH 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB8 PGFGSLPQPPLTLKPIRPRKYPNRPSKTPLHERPHACPAEGCDRRFSRSDELTRHLRIHT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 PGFGSLPQPPLTLKPIRPRKYPNRPSKTPLHERPHACPAEGCDRRFSRSDELTRHLRIHT 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB8 GHKPFQCRICMRSFSRSDHLTTHIRTHTGEKPFACEFCGRKFARSDERKRHAKIHLKQKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 GHKPFQCRICMRSFSRSDHLTTHIRTHTGEKPFACEFCGRKFARSDERKRHAKIHLKQKE 310 320 330 340 350 360 370 380 pF1KB8 KKAEKGGAPSASSAPPVSLAPVVTTCA ::::::::::::::::::::::::::: CCDS60 KKAEKGGAPSASSAPPVSLAPVVTTCA 370 380 >>CCDS56528.1 EGR3 gene_id:1960|Hs108|chr8 (349 aa) initn: 2380 init1: 2380 opt: 2380 Z-score: 1483.4 bits: 283.1 E(32554): 2.6e-76 Smith-Waterman score: 2380; 100.0% identity (100.0% similar) in 336 aa overlap (52-387:14-349) 30 40 50 60 70 80 pF1KB8 DNLYPEEIPSALNLFSGSSDSVVHYNQMATENVMDIGLTNEKPNPELSYSGSFQPAPGNK :::::::::::::::::::::::::::::: CCDS56 MEPCAAWSPRGGRENVMDIGLTNEKPNPELSYSGSFQPAPGNK 10 20 30 40 90 100 110 120 130 140 pF1KB8 TVTYLGKFAFDSPSNWCQDNIISLMSAGILGVPPASGALSTQTSTASMVQPPQGDVEAMY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 TVTYLGKFAFDSPSNWCQDNIISLMSAGILGVPPASGALSTQTSTASMVQPPQGDVEAMY 50 60 70 80 90 100 150 160 170 180 190 200 pF1KB8 PALPPYSNCGDLYSEPVSFHDPQGNPGLAYSPQDYQSAKPALDSNLFPMIPDYNLYHHPN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 PALPPYSNCGDLYSEPVSFHDPQGNPGLAYSPQDYQSAKPALDSNLFPMIPDYNLYHHPN 110 120 130 140 150 160 210 220 230 240 250 260 pF1KB8 DMGSIPEHKPFQGMDPIRVNPPPITPLETIKAFKDKQIHPGFGSLPQPPLTLKPIRPRKY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 DMGSIPEHKPFQGMDPIRVNPPPITPLETIKAFKDKQIHPGFGSLPQPPLTLKPIRPRKY 170 180 190 200 210 220 270 280 290 300 310 320 pF1KB8 PNRPSKTPLHERPHACPAEGCDRRFSRSDELTRHLRIHTGHKPFQCRICMRSFSRSDHLT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 PNRPSKTPLHERPHACPAEGCDRRFSRSDELTRHLRIHTGHKPFQCRICMRSFSRSDHLT 230 240 250 260 270 280 330 340 350 360 370 380 pF1KB8 THIRTHTGEKPFACEFCGRKFARSDERKRHAKIHLKQKEKKAEKGGAPSASSAPPVSLAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 THIRTHTGEKPFACEFCGRKFARSDERKRHAKIHLKQKEKKAEKGGAPSASSAPPVSLAP 290 300 310 320 330 340 pF1KB8 VVTTCA :::::: CCDS56 VVTTCA >>CCDS4206.1 EGR1 gene_id:1958|Hs108|chr5 (543 aa) initn: 1043 init1: 716 opt: 968 Z-score: 614.8 bits: 123.0 E(32554): 6.3e-28 Smith-Waterman score: 1025; 48.7% identity (70.0% similar) in 380 aa overlap (31-385:81-449) 10 20 30 40 50 pF1KB8 MTGKLAEKLPVTMSSLLNQLPDNLYPEEIPSALNLFSGSSDSVVH-YNQMATENVMDIGL :. . :. ..:. . :.....:. ::.: CCDS42 AAGAPEGSGSNSSSSSSGGGGGGGGGSNSSSSSSTFNPQADTGEQPYEHLTAESFPDISL 60 70 80 90 100 110 60 70 80 90 100 110 pF1KB8 TNEKPNPELSYSGSFQPAPGNKTVTYLGKFAFDSPSN-----WCQDNIISLMSAGILGV- .::: : :: .. : .:: :.:... : : . ..::.: :.... CCDS42 NNEKVLVETSYPSQTTRLP---PITYTGRFSLEPAPNSGNTLW-PEPLFSLVS-GLVSMT 120 130 140 150 160 120 130 140 150 160 pF1KB8 -PPASG--ALSTQTSTASMVQ-PP------QGDVEAMYPALPPY-SNCGDLYSEPVSFHD ::::. : : .:.:: : :: ..: .: : : . . :.. :: : CCDS42 NPPASSSSAPSPAASSASASQSPPLSCAVPSNDSSPIYSAAPTFPTPNTDIFPEPQSQAF 170 180 190 200 210 220 170 180 190 200 210 pF1KB8 PQGNPGLA--YSPQDYQSAKPALDSNLFPMIPDYNLYHHPNDMG-SIPEHKPFQGMDPIR : :. : : : : : .:: ... :::::: . .. .:.: . :..:::::.. : CCDS42 P-GSAGTALQYPPPAYPAAKGGFQ---VPMIPDYLFPQQQGDLGLGTPDQKPFQGLES-R 230 240 250 260 270 280 220 230 240 250 260 270 pF1KB8 VNPPPITPLETIKAFKDKQIHPGFGSLP---QPPLTLKPIRPRKYPNRPSKTPLHERPHA .. : .::: ::::: .. . .: : : .:: : ::::::::::: ::::.: CCDS42 TQQPSLTPLSTIKAFATQSGSQDLKALNTSYQSQL-IKPSRMRKYPNRPSKTPPHERPYA 290 300 310 320 330 280 290 300 310 320 330 pF1KB8 CPAEGCDRRFSRSDELTRHLRIHTGHKPFQCRICMRSFSRSDHLTTHIRTHTGEKPFACE ::.:.::::::::::::::.:::::.::::::::::.::::::::::::::::::::::. CCDS42 CPVESCDRRFSRSDELTRHIRIHTGQKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACD 340 350 360 370 380 390 340 350 360 370 380 pF1KB8 FCGRKFARSDERKRHAKIHLKQKEKKAEKGG-APSASSAPPVSLAPVVTTCA .::::::::::::::.::::.::.:::.:. : ::.:. .::.:. CCDS42 ICGRKFARSDERKRHTKIHLRQKDKKADKSVVASSATSSLSSYPSPVATSYPSPVTTSYP 400 410 420 430 440 450 CCDS42 SPATTSYPSPVPTSFSSPGSSTYPSPVHSGFPSPSVATTYSSVPPAFPAQVSSFPSSAVT 460 470 480 490 500 510 >>CCDS44409.1 EGR2 gene_id:1959|Hs108|chr10 (426 aa) initn: 1136 init1: 731 opt: 768 Z-score: 493.4 bits: 100.2 E(32554): 3.7e-21 Smith-Waterman score: 1124; 51.1% identity (68.7% similar) in 403 aa overlap (47-387:2-394) 20 30 40 50 60 70 pF1KB8 LNQLPDNLYPEEIPSALNLFSGSSDSVVHYNQMATENVMDIGLTNEKPNPELSYSGSFQP : .: .....: .:.:: . .: : .:: : CCDS44 MNGVAGDGMINIDMTGEKRSLDLPYPSSFAP 10 20 30 80 90 100 110 120 pF1KB8 --APGNKTVTYLGKFAFDS--PSNWCQ-DNIISLMSAGIL-GVP-PASGALSTQTSTAS- :: :.: ::.:::..: :. : ..::...::::: :: ::: . :.....:: CCDS44 VSAPRNQTFTYMGKFSIDPQYPGASCYPEGIINIVSAGILQGVTSPASTTASSSVTSASP 40 50 60 70 80 90 130 140 150 160 170 pF1KB8 --MVQPPQG---------DVEAMY---PALPPYSNC-GDLYSEPVSFHDP---QGNPGLA .. : : :.. .: : ::::.: ::::..: .: . . . .:: CCDS44 NPLATGPLGVCTMSQTQPDLDHLYSPPPPPPPYSGCAGDLYQDPSAFLSAATTSTSSSLA 100 110 120 130 140 150 180 190 200 210 220 pF1KB8 YSPQ-DYQSAKPALDSNLFPMIPDYNLYHHPN----DM-GSI-PEHKPFQ-GMDPIRVNP : : .: : ::: : .:::::::: . :. :. :. :..::: .: .:: : CCDS44 YPPPPSYPSPKPATDPGLFPMIPDYPGFF-PSQCQRDLHGTAGPDRKPFPCPLDTLRV-P 160 170 180 190 200 230 240 250 pF1KB8 PPITPLETIKAF-----KDKQIHPGF--GSL-PQPP-------------------LTLKP ::.::: ::. : . :: :: :. : : :.: CCDS44 PPLTPLSTIRNFTLGGPSAGVTGPGASGGSEGPRLPGSSSAAAAAAAAAAYNPHHLPLRP 210 220 230 240 250 260 260 270 280 290 300 310 pF1KB8 I-RPRKYPNRPSKTPLHERPHACPAEGCDRRFSRSDELTRHLRIHTGHKPFQCRICMRSF : :::::::::::::.::::. :::::::::::::::::::.::::::::::::::::.: CCDS44 ILRPRKYPNRPSKTPVHERPYPCPAEGCDRRFSRSDELTRHIRIHTGHKPFQCRICMRNF 270 280 290 300 310 320 320 330 340 350 360 370 pF1KB8 SRSDHLTTHIRTHTGEKPFACEFCGRKFARSDERKRHAKIHLKQKEKKAEKGGAPSASSA :::::::::::::::::::::..::::::::::::::.::::.:::.:. .::::: . CCDS44 SRSDHLTTHIRTHTGEKPFACDYCGRKFARSDERKRHTKIHLRQKERKS---SAPSAS-V 330 340 350 360 370 380 380 pF1KB8 PPVSLAPVVTTCA : :: ...:. CCDS44 P----APSTASCSGGVQPGGTLCSSNSSSLGGGPLAPCSSRTRTP 390 400 410 420 >>CCDS7267.1 EGR2 gene_id:1959|Hs108|chr10 (476 aa) initn: 1228 init1: 731 opt: 768 Z-score: 492.8 bits: 100.3 E(32554): 3.9e-21 Smith-Waterman score: 1125; 50.9% identity (68.9% similar) in 405 aa overlap (45-387:50-444) 20 30 40 50 60 70 pF1KB8 SLLNQLPDNLYPEEIPSALNLFSGSSDSVVHYNQMATENVMDIGLTNEKPNPELSYSGSF ..: .: .....: .:.:: . .: : .:: CCDS72 QLSDNIYPVEDLAATSVTIFPNAELGGPFDQMNGVAGDGMINIDMTGEKRSLDLPYPSSF 20 30 40 50 60 70 80 90 100 110 120 pF1KB8 QP--APGNKTVTYLGKFAFDS--PSNWCQ-DNIISLMSAGIL-GVP-PASGALSTQTSTA : :: :.: ::.:::..: :. : ..::...::::: :: ::: . :.....: CCDS72 APVSAPRNQTFTYMGKFSIDPQYPGASCYPEGIINIVSAGILQGVTSPASTTASSSVTSA 80 90 100 110 120 130 130 140 150 160 pF1KB8 S---MVQPPQG---------DVEAMY---PALPPYSNC-GDLYSEPVSFHDP---QGNPG : .. : : :.. .: : ::::.: ::::..: .: . . . . CCDS72 SPNPLATGPLGVCTMSQTQPDLDHLYSPPPPPPPYSGCAGDLYQDPSAFLSAATTSTSSS 140 150 160 170 180 190 170 180 190 200 210 220 pF1KB8 LAYSPQ-DYQSAKPALDSNLFPMIPDYNLYHHPN----DM-GSI-PEHKPFQ-GMDPIRV ::: : .: : ::: : .:::::::: . :. :. :. :..::: .: .:: CCDS72 LAYPPPPSYPSPKPATDPGLFPMIPDYPGFF-PSQCQRDLHGTAGPDRKPFPCPLDTLRV 200 210 220 230 240 250 230 240 250 pF1KB8 NPPPITPLETIKAF-----KDKQIHPGF--GSL-PQPP-------------------LTL :::.::: ::. : . :: :: :. : : : CCDS72 -PPPLTPLSTIRNFTLGGPSAGVTGPGASGGSEGPRLPGSSSAAAAAAAAAAYNPHHLPL 260 270 280 290 300 310 260 270 280 290 300 310 pF1KB8 KPI-RPRKYPNRPSKTPLHERPHACPAEGCDRRFSRSDELTRHLRIHTGHKPFQCRICMR .:: :::::::::::::.::::. :::::::::::::::::::.:::::::::::::::: CCDS72 RPILRPRKYPNRPSKTPVHERPYPCPAEGCDRRFSRSDELTRHIRIHTGHKPFQCRICMR 320 330 340 350 360 370 320 330 340 350 360 370 pF1KB8 SFSRSDHLTTHIRTHTGEKPFACEFCGRKFARSDERKRHAKIHLKQKEKKAEKGGAPSAS .::::::::::::::::::::::..::::::::::::::.::::.:::.:. .::::: CCDS72 NFSRSDHLTTHIRTHTGEKPFACDYCGRKFARSDERKRHTKIHLRQKERKS---SAPSAS 380 390 400 410 420 430 380 pF1KB8 SAPPVSLAPVVTTCA .: :: ...:. CCDS72 -VP----APSTASCSGGVQPGGTLCSSNSSSLGGGPLAPCSSRTRTP 440 450 460 470 >>CCDS1925.2 EGR4 gene_id:1961|Hs108|chr2 (589 aa) initn: 768 init1: 554 opt: 574 Z-score: 372.7 bits: 78.3 E(32554): 1.9e-14 Smith-Waterman score: 600; 34.2% identity (55.2% similar) in 404 aa overlap (9-365:183-573) 10 20 30 pF1KB8 MTGKLAEKLPVTMSSLLNQLPDNLYPEEIPSALNLFSG : . : ... .:. .:.. . .::.:: CCDS19 LSWALNSCGASGDLADSCFLEGPAPTPPPGLSYSGSFFIQAVPE--HPHDPEALFNLMSG 160 170 180 190 200 210 40 50 60 70 80 90 pF1KB8 --SSDSVVHYNQMATENVMDI----GLTNEKPNPELSYSGSFQPAPGNKTVTYLGKFAFD . . :... .: : :.: :: .. :: .. . : CCDS19 ILGLAPFPGPEAAASRSPLDAPFPAGSDALLPGPPDLYSPDLGAAPFPEAFWEASPCA-G 220 230 240 250 260 100 110 120 130 140 150 pF1KB8 SPSNWCQDNIISL--MSAGILGVPPASGALSTQTSTASMVQPPQGDVEAMYPALPPYSNC .::. . .: .. : : .:::: :: ...: . : . : . . : .:: CCDS19 APSQCLYEPQLSPPDVKPG-LRAPPASPAL----DAVSAFKGPYAPWELLSVGAP--GNC 270 280 290 300 310 320 160 170 180 190 200 pF1KB8 GDLYSEPVSFHDPQGN-PGLAYSPQDYQSAK-----PALDSN-LFPMIPDYNLYHHPNDM :. . .. :.. : .. . .: : . ::. .: :.: . :.:. CCDS19 GSQGDYQAA---PEARFPVIGTKIEDLLSISCPAELPAVPANRLYPSGAYDAFPLAPGDL 330 340 350 360 370 210 220 230 240 pF1KB8 GSIPEHKPF-------------QGMDPIRVNPPPITPLETIKA----FKDKQIH--PGFG : : : .: . . . : ..:: .: : . :: . CCDS19 GEGAEGLPGLLTPPSGEGGSSGDGGEFLASTQPQLSPLGLRSAAAADFPKPLVADIPGSS 380 390 400 410 420 430 250 260 270 280 290 pF1KB8 SLPQPPLTLKPIRP------RKYPNRPSKTPLH---ERPHA----CPAEGCDRRFSRSDE .. ::. : : :. : .: . :::: ::.:.: : :.:::: CCDS19 GVAAPPVPPPPPTPFPQAKARRKGRRGGKCSTRCFCPRPHAKAFACPVESCVRSFARSDE 440 450 460 470 480 490 300 310 320 330 340 350 pF1KB8 LTRHLRIHTGHKPFQCRICMRSFSRSDHLTTHIRTHTGEKPFACEFCGRKFARSDERKRH :.:::::::::::::::::.:.::::::::::.:::::::::::. :::.::::::.::: CCDS19 LNRHLRIHTGHKPFQCRICLRNFSRSDHLTTHVRTHTGEKPFACDVCGRRFARSDEKKRH 500 510 520 530 540 550 360 370 380 pF1KB8 AKIHLKQKEKKAEKGGAPSASSAPPVSLAPVVTTCA .:.::::: . :. CCDS19 SKVHLKQKARAEERLKGLGFYSLGLSFASL 560 570 580 387 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 08:28:10 2016 done: Sat Nov 5 08:28:10 2016 Total Scan time: 3.110 Total Display time: 0.020 Function used was FASTA [36.3.4 Apr, 2011]