FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB9734, 486 aa 1>>>pF1KB9734 486 - 486 aa - 486 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 11.5827+/-0.000965; mu= -9.1538+/- 0.057 mean_var=411.9180+/-87.046, 0's: 0 Z-trim(117.4): 783 B-trim: 183 in 1/53 Lambda= 0.063193 statistics sampled from 17266 (18174) to 17266 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.829), E-opt: 0.2 (0.558), width: 16 Scan time: 4.220 The best scores are: opt bits E(32554) CCDS1925.2 EGR4 gene_id:1961|Hs108|chr2 ( 589) 3441 327.6 2.2e-89 CCDS44409.1 EGR2 gene_id:1959|Hs108|chr10 ( 426) 596 68.1 2.1e-11 CCDS4206.1 EGR1 gene_id:1958|Hs108|chr5 ( 543) 598 68.4 2.2e-11 CCDS7267.1 EGR2 gene_id:1959|Hs108|chr10 ( 476) 596 68.2 2.3e-11 CCDS56528.1 EGR3 gene_id:1960|Hs108|chr8 ( 349) 574 66.0 7.3e-11 CCDS6033.1 EGR3 gene_id:1960|Hs108|chr8 ( 387) 574 66.1 7.9e-11 >>CCDS1925.2 EGR4 gene_id:1961|Hs108|chr2 (589 aa) initn: 3441 init1: 3441 opt: 3441 Z-score: 1718.1 bits: 327.6 E(32554): 2.2e-89 Smith-Waterman score: 3441; 100.0% identity (100.0% similar) in 486 aa overlap (1-486:104-589) 10 20 30 pF1KB9 MLHLSEFSEPDALLVKSTEGCCAEPSAELP :::::::::::::::::::::::::::::: CCDS19 GEPLPPASPPPARPQAQRARPRAPHSRRRAMLHLSEFSEPDALLVKSTEGCCAEPSAELP 80 90 100 110 120 130 40 50 60 70 80 90 pF1KB9 RLPARDAPAATGYPGAGDFLSWALNSCGASGDLADSCFLEGPAPTPPPGLSYSGSFFIQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 RLPARDAPAATGYPGAGDFLSWALNSCGASGDLADSCFLEGPAPTPPPGLSYSGSFFIQA 140 150 160 170 180 190 100 110 120 130 140 150 pF1KB9 VPEHPHDPEALFNLMSGILGLAPFPGPEAAASRSPLDAPFPAGSDALLPGPPDLYSPDLG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 VPEHPHDPEALFNLMSGILGLAPFPGPEAAASRSPLDAPFPAGSDALLPGPPDLYSPDLG 200 210 220 230 240 250 160 170 180 190 200 210 pF1KB9 AAPFPEAFWEASPCAGAPSQCLYEPQLSPPDVKPGLRAPPASPALDAVSAFKGPYAPWEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 AAPFPEAFWEASPCAGAPSQCLYEPQLSPPDVKPGLRAPPASPALDAVSAFKGPYAPWEL 260 270 280 290 300 310 220 230 240 250 260 270 pF1KB9 LSVGAPGNCGSQGDYQAAPEARFPVIGTKIEDLLSISCPAELPAVPANRLYPSGAYDAFP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 LSVGAPGNCGSQGDYQAAPEARFPVIGTKIEDLLSISCPAELPAVPANRLYPSGAYDAFP 320 330 340 350 360 370 280 290 300 310 320 330 pF1KB9 LAPGDLGEGAEGLPGLLTPPSGEGGSSGDGGEFLASTQPQLSPLGLRSAAAADFPKPLVA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 LAPGDLGEGAEGLPGLLTPPSGEGGSSGDGGEFLASTQPQLSPLGLRSAAAADFPKPLVA 380 390 400 410 420 430 340 350 360 370 380 390 pF1KB9 DIPGSSGVAAPPVPPPPPTPFPQAKARRKGRRGGKCSTRCFCPRPHAKAFACPVESCVRS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 DIPGSSGVAAPPVPPPPPTPFPQAKARRKGRRGGKCSTRCFCPRPHAKAFACPVESCVRS 440 450 460 470 480 490 400 410 420 430 440 450 pF1KB9 FARSDELNRHLRIHTGHKPFQCRICLRNFSRSDHLTTHVRTHTGEKPFACDVCGRRFARS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 FARSDELNRHLRIHTGHKPFQCRICLRNFSRSDHLTTHVRTHTGEKPFACDVCGRRFARS 500 510 520 530 540 550 460 470 480 pF1KB9 DEKKRHSKVHLKQKARAEERLKGLGFYSLGLSFASL :::::::::::::::::::::::::::::::::::: CCDS19 DEKKRHSKVHLKQKARAEERLKGLGFYSLGLSFASL 560 570 580 >>CCDS44409.1 EGR2 gene_id:1959|Hs108|chr10 (426 aa) initn: 803 init1: 541 opt: 596 Z-score: 318.2 bits: 68.1 E(32554): 2.1e-11 Smith-Waterman score: 649; 38.0% identity (51.2% similar) in 418 aa overlap (73-466:30-376) 50 60 70 80 90 pF1KB9 YPGAGDFLSWALNSCGASGDLADSCFLEGPAPTPPP---GLSYSGSFFIQAVPEHPHD-- ::. : ..: :.: :. :..: CCDS44 MNGVAGDGMINIDMTGEKRSLDLPYPSSFAPVSAPRNQTFTYMGKFSID--PQYPGASC 10 20 30 40 50 100 110 120 130 140 pF1KB9 -PEALFNLMS-GILGLAPFPGPEAA------ASRSPLDAPFPAGSDALLPGPPDL---YS ::...:..: ::: . :. .: :: .:: : : : .. ::: :: CCDS44 YPEGIINIVSAGILQGVTSPASTTASSSVTSASPNPL-ATGPLGVCTMSQTQPDLDHLYS 60 70 80 90 100 110 150 160 170 180 190 pF1KB9 PDLGAAPFPEAFWEASPCAGA----PSQCLYEPQLSPPD---VKPGLRAPPASPALDAVS : : : . : ::: :: : : . : : .:: : . CCDS44 P----PPPPPPY---SGCAGDLYQDPSAFLSAATTSTSSSLAYPPPPSYPSPKPATDP-G 120 130 140 150 160 200 210 220 230 240 250 pF1KB9 AFKGPYAPWELLSVGAPGNCGSQGDYQAAPEARFPVIGTKIEDLLSISCPAELPAVPANR : :. : :: :: . . :: : . :: . :: CCDS44 LF--PMIP------DYPGFFPSQ--------CQRDLHGTAGPDRKPFPCPLDTLRVPPP- 170 180 190 200 210 260 270 280 290 300 310 pF1KB9 LYPSGAYDAFPLAPGDLGEGAEGLPGLLTPPSGEGGSSGDGGEFLASTQPQLSPLGLRSA : : .. : :: . :. : :.. ::: : :.: : : :: CCDS44 LTPLSTIRNFT-----LGGPSAGVTG----PGASGGSEG----------PRL-P-GSSSA 220 230 240 250 320 330 340 350 360 370 pF1KB9 AAADFPKPLVADIPGSSGVAAPPVPPPPPTPF-PQAKARRKGRRGGKCSTRCFCPRPHAK ::: .:: . : :. : . :. : .: . : . CCDS44 AAA---------------AAAAAAYNPHHLPLRPILRPRKYPNRPSKTPV-------HER 260 270 280 380 390 400 410 420 430 pF1KB9 AFACPVESCVRSFARSDELNRHLRIHTGHKPFQCRICLRNFSRSDHLTTHVRTHTGEKPF . ::.:.: : :.:::::.::.::::::::::::::.::::::::::::.::::::::: CCDS44 PYPCPAEGCDRRFSRSDELTRHIRIHTGHKPFQCRICMRNFSRSDHLTTHIRTHTGEKPF 290 300 310 320 330 340 440 450 460 470 480 pF1KB9 ACDVCGRRFARSDEKKRHSKVHLKQKARAEERLKGLGFYSLGLSFASL ::: :::.::::::.:::.:.::.:: : CCDS44 ACDYCGRKFARSDERKRHTKIHLRQKERKSSAPSASVPAPSTASCSGGVQPGGTLCSSNS 350 360 370 380 390 400 >>CCDS4206.1 EGR1 gene_id:1958|Hs108|chr5 (543 aa) initn: 686 init1: 575 opt: 598 Z-score: 317.8 bits: 68.4 E(32554): 2.2e-11 Smith-Waterman score: 668; 34.8% identity (55.7% similar) in 465 aa overlap (23-470:17-428) 10 20 30 40 50 pF1KB9 MLHLSEFSEPDALLVKSTEGCCAEPSAELPRLPARDA-PAATGY----PGAGDFLSWALN ..: . .:. :. : : . :: .::. : CCDS42 MAAAKAEMQLMSPLQISDPFGSFPHSPTMDNYPKLEEMMLLSNGAPQFLGAAGA 10 20 30 40 50 60 70 80 90 100 110 pF1KB9 SCGASGDLADSCFLEGPAPTPPPGLSYSGSFFI-QA-VPEHPHDPEALFNLMSGILGLAP :.... ..: : . . : :.: : :: . :.:.. : CCDS42 PEGSGSNSSSSSSGGGGGGGGGSNSSSSSSTFNPQADTGEQPYEH----------LTAES 60 70 80 90 100 120 130 140 150 160 170 pF1KB9 FPGPEAAASRSPLDAPFPAGSDALLPGPPDLYSPDLGAAPFPEA---FWEASPCAGAPSQ :: . ... .:. . : :: :. .. : :.. .: : . : CCDS42 FPDISLNNEKVLVETSYPSQTTRL---PPITYTGRFSLEPAPNSGNTLWPE-PLFSLVSG 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB9 CLYEPQLSPPDVKPGLRAPPASPALDAVSAFKGPYAPWELLSVGAPGNCGSQGDYQAAPE . . .:: . . :: ::: ...:: ..: : :: ..:.: :. :.::: CCDS42 LV--SMTNPPASSSS--AP--SPAASSASASQSP--P---LSCAVPSN-DSSPIYSAAPT 170 180 190 200 240 250 260 270 280 pF1KB9 ARFPVIGTKIEDLLSISCPAELPAVPANRL-YPSGAYDAFPLAPGDLGEGAEGLPGLLTP ::. .: :.. .:. .. : :: :: : : : : . .: : : CCDS42 --FPTPNT---DIFPEPQSQAFPGSAGTALQYPPPAY---PAAKG--GFQVPMIPDYLFP 210 220 230 240 250 290 300 310 320 330 340 pF1KB9 PS-GEGG-SSGDGGEFLA----STQPQLSPLGLRSAAAADFPKPLVADIPGSSGVAAPPV . :. : .. : : . . ::.:.::. .: :.. ::. . : . CCDS42 QQQGDLGLGTPDQKPFQGLESRTQQPSLTPLSTIKAFATQ---------SGSQDLKALNT 260 270 280 290 300 350 360 370 380 390 400 pF1KB9 PPPPPTPFPQAKARRKGRRGGKCSTRCFCPRPHAKAFACPVESCVRSFARSDELNRHLRI : .. :. : .: : :: . .::::::: : :.:::::.::.:: CCDS42 SYQSQLIKP-SRMRKYPNRPSKT------P-PHERPYACPVESCDRRFSRSDELTRHIRI 310 320 330 340 350 360 410 420 430 440 450 460 pF1KB9 HTGHKPFQCRICLRNFSRSDHLTTHVRTHTGEKPFACDVCGRRFARSDEKKRHSKVHLKQ :::.::::::::.::::::::::::.::::::::::::.:::.::::::.:::.:.::.: CCDS42 HTGQKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACDICGRKFARSDERKRHTKIHLRQ 370 380 390 400 410 420 470 480 pF1KB9 KARAEERLKGLGFYSLGLSFASL : . .. CCDS42 KDKKADKSVVASSATSSLSSYPSPVATSYPSPVTTSYPSPATTSYPSPVPTSFSSPGSST 430 440 450 460 470 480 >>CCDS7267.1 EGR2 gene_id:1959|Hs108|chr10 (476 aa) initn: 803 init1: 541 opt: 596 Z-score: 317.5 bits: 68.2 E(32554): 2.3e-11 Smith-Waterman score: 649; 38.0% identity (51.2% similar) in 418 aa overlap (73-466:80-426) 50 60 70 80 90 pF1KB9 YPGAGDFLSWALNSCGASGDLADSCFLEGPAPTPPP---GLSYSGSFFIQAVPEHPHD-- ::. : ..: :.: :. :..: CCDS72 QMNGVAGDGMINIDMTGEKRSLDLPYPSSFAPVSAPRNQTFTYMGKFSID--PQYPGASC 50 60 70 80 90 100 100 110 120 130 140 pF1KB9 -PEALFNLMS-GILGLAPFPGPEAA------ASRSPLDAPFPAGSDALLPGPPDL---YS ::...:..: ::: . :. .: :: .:: : : : .. ::: :: CCDS72 YPEGIINIVSAGILQGVTSPASTTASSSVTSASPNPL-ATGPLGVCTMSQTQPDLDHLYS 110 120 130 140 150 160 150 160 170 180 190 pF1KB9 PDLGAAPFPEAFWEASPCAGA----PSQCLYEPQLSPPD---VKPGLRAPPASPALDAVS : : : . : ::: :: : : . : : .:: : . CCDS72 P----PPPPPPY---SGCAGDLYQDPSAFLSAATTSTSSSLAYPPPPSYPSPKPATDP-G 170 180 190 200 210 200 210 220 230 240 250 pF1KB9 AFKGPYAPWELLSVGAPGNCGSQGDYQAAPEARFPVIGTKIEDLLSISCPAELPAVPANR : :. : :: :: . . :: : . :: . :: CCDS72 LF--PMIP------DYPGFFPSQ--------CQRDLHGTAGPDRKPFPCPLDTLRVPPP- 220 230 240 250 260 260 270 280 290 300 310 pF1KB9 LYPSGAYDAFPLAPGDLGEGAEGLPGLLTPPSGEGGSSGDGGEFLASTQPQLSPLGLRSA : : .. : :: . :. : :.. ::: : :.: : : :: CCDS72 LTPLSTIRNFT-----LGGPSAGVTG----PGASGGSEG----------PRL-P-GSSSA 270 280 290 300 320 330 340 350 360 370 pF1KB9 AAADFPKPLVADIPGSSGVAAPPVPPPPPTPF-PQAKARRKGRRGGKCSTRCFCPRPHAK ::: .:: . : :. : . :. : .: . : . CCDS72 AAA---------------AAAAAAYNPHHLPLRPILRPRKYPNRPSKTPV-------HER 310 320 330 380 390 400 410 420 430 pF1KB9 AFACPVESCVRSFARSDELNRHLRIHTGHKPFQCRICLRNFSRSDHLTTHVRTHTGEKPF . ::.:.: : :.:::::.::.::::::::::::::.::::::::::::.::::::::: CCDS72 PYPCPAEGCDRRFSRSDELTRHIRIHTGHKPFQCRICMRNFSRSDHLTTHIRTHTGEKPF 340 350 360 370 380 390 440 450 460 470 480 pF1KB9 ACDVCGRRFARSDEKKRHSKVHLKQKARAEERLKGLGFYSLGLSFASL ::: :::.::::::.:::.:.::.:: : CCDS72 ACDYCGRKFARSDERKRHTKIHLRQKERKSSAPSASVPAPSTASCSGGVQPGGTLCSSNS 400 410 420 430 440 450 >>CCDS56528.1 EGR3 gene_id:1960|Hs108|chr8 (349 aa) initn: 834 init1: 554 opt: 574 Z-score: 308.5 bits: 66.0 E(32554): 7.3e-11 Smith-Waterman score: 599; 36.4% identity (54.0% similar) in 363 aa overlap (117-470:3-327) 90 100 110 120 130 140 pF1KB9 FIQAVPEHPHDPEALFNLMSGILGLAPFPGPEAAAS-RSPLDAPFPAGSDALLPGPPDLY : :: : :. . . : :.: : CCDS56 MEPCAAWSPRGGRENVMDIGLTNEKPNPELSY 10 20 30 150 160 170 180 190 pF1KB9 SPDLGAAPFPEAFWEASPCA-GAPSQCLYEPQLSPPDVKPG-LRAPPASPALDA----VS : .. :: .. . : .::. . .: .. : : .:::: ::.. .: CCDS56 SGSFQPAPGNKTVTYLGKFAFDSPSNWCQDNIISL--MSAGILGVPPASGALSTQTSTAS 40 50 60 70 80 90 200 210 220 230 240 250 pF1KB9 AFKGPYAPWELLSVGAP--GNCGSQGDYQAAPEARFPVIGTKIEDLLSISCPAELPAVPA . : . : . . : .::: : . : . :. . . ::. . CCDS56 MVQPPQGDVEAMYPALPPYSNCG---DLYSEPVSFHDPQGNPGLAYSPQDYQSAKPALDS 100 110 120 130 140 260 270 280 290 300 310 pF1KB9 NRLYPSGAYDAFPLAPGDLGEGAEGLPGLLTPPSGEGGSSGDGGEFLASTQPQLSPLGLR : :.: . :.:.: : : .: . . . : ..:: CCDS56 N-LFPMIPDYNLYHHPNDMGSIPEHKPF-------------QGMDPIRVNPPPITPLETI 150 160 170 180 190 320 330 340 350 360 370 pF1KB9 SAAAADFPKPLVADIPGSSGVAAPPVPPPPPTPFPQAKARRKGRRGGKCSTRCFCPRPHA .: : . :: ... ::. : : :. : .: . :::: CCDS56 KA----FKDKQIH--PGFGSLPQPPLTLKPIRP------RKYPNRPSKTPLH---ERPHA 200 210 220 230 380 390 400 410 420 430 pF1KB9 KAFACPVESCVRSFARSDELNRHLRIHTGHKPFQCRICLRNFSRSDHLTTHVRTHTGEKP ::.:.: : :.:::::.:::::::::::::::::.:.::::::::::.:::::::: CCDS56 ----CPAEGCDRRFSRSDELTRHLRIHTGHKPFQCRICMRSFSRSDHLTTHIRTHTGEKP 240 250 260 270 280 290 440 450 460 470 480 pF1KB9 FACDVCGRRFARSDEKKRHSKVHLKQKARAEERLKGLGFYSLGLSFASL :::. :::.::::::.:::.:.::::: . :. CCDS56 FACEFCGRKFARSDERKRHAKIHLKQKEKKAEKGGAPSASSAPPVSLAPVVTTCA 300 310 320 330 340 >>CCDS6033.1 EGR3 gene_id:1960|Hs108|chr8 (387 aa) initn: 834 init1: 554 opt: 574 Z-score: 307.9 bits: 66.1 E(32554): 7.9e-11 Smith-Waterman score: 600; 34.2% identity (53.9% similar) in 401 aa overlap (80-470:9-365) 50 60 70 80 90 100 pF1KB9 LSWALNSCGASGDLADSCFLEGPAPTPPPGLSYSGSFFIQAVPE--HPHDPEALFNLMSG : . : ... .:. .:.. . .::.:: CCDS60 MTGKLAEKLPVTMSSLLNQLPDNLYPEEIPSALNLFSG 10 20 30 110 120 130 140 150 160 pF1KB9 ILGLAPFPGPEAAASRSPLDAPFPAGSDALLPGPPDLYSPDLGAAPFPEAFWEASPCA-G . . :... .: : :.: :: .. :: .. . : CCDS60 --SSDSVVHYNQMATENVMDI----GLTNEKPNPELSYSGSFQPAPGNKTVTYLGKFAFD 40 50 60 70 80 90 170 180 190 200 210 pF1KB9 APSQCLYEPQLSPPDVKPG-LRAPPASPALDA----VSAFKGPYAPWELLSVGAP--GNC .::. . .: .. : : .:::: ::.. .: . : . : . . : .:: CCDS60 SPSNWCQDNIISL--MSAGILGVPPASGALSTQTSTASMVQPPQGDVEAMYPALPPYSNC 100 110 120 130 140 150 220 230 240 250 260 270 pF1KB9 GSQGDYQAAPEARFPVIGTKIEDLLSISCPAELPAVPANRLYPSGAYDAFPLAPGDLGEG : : . : . :. . . ::. .: :.: . :.:.: CCDS60 G---DLYSEPVSFHDPQGNPGLAYSPQDYQSAKPALDSN-LFPMIPDYNLYHHPNDMGSI 160 170 180 190 200 280 290 300 310 320 330 pF1KB9 AEGLPGLLTPPSGEGGSSGDGGEFLASTQPQLSPLGLRSAAAADFPKPLVADIPGSSGVA : : .: . . . : ..:: .: : . :: ... CCDS60 PEHKPF-------------QGMDPIRVNPPPITPLETIKA----FKDKQIH--PGFGSLP 210 220 230 240 340 350 360 370 380 390 pF1KB9 APPVPPPPPTPFPQAKARRKGRRGGKCSTRCFCPRPHAKAFACPVESCVRSFARSDELNR ::. : : :. : .: . :::: ::.:.: : :.:::::.: CCDS60 QPPLTLKPIRP------RKYPNRPSKTPLH---ERPHA----CPAEGCDRRFSRSDELTR 250 260 270 280 290 400 410 420 430 440 450 pF1KB9 HLRIHTGHKPFQCRICLRNFSRSDHLTTHVRTHTGEKPFACDVCGRRFARSDEKKRHSKV ::::::::::::::::.:.::::::::::.:::::::::::. :::.::::::.:::.:. CCDS60 HLRIHTGHKPFQCRICMRSFSRSDHLTTHIRTHTGEKPFACEFCGRKFARSDERKRHAKI 300 310 320 330 340 350 460 470 480 pF1KB9 HLKQKARAEERLKGLGFYSLGLSFASL ::::: . :. CCDS60 HLKQKEKKAEKGGAPSASSAPPVSLAPVVTTCA 360 370 380 486 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 18:35:41 2016 done: Fri Nov 4 18:35:41 2016 Total Scan time: 4.220 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]