FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7045, 476 aa 1>>>pF1KB7045 476 - 476 aa - 476 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 11.5172+/-0.000991; mu= -8.1016+/- 0.059 mean_var=452.2533+/-94.784, 0's: 0 Z-trim(117.3): 804 B-trim: 0 in 0/53 Lambda= 0.060309 statistics sampled from 17109 (18009) to 17109 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.819), E-opt: 0.2 (0.553), width: 16 Scan time: 4.240 The best scores are: opt bits E(32554) CCDS7267.1 EGR2 gene_id:1959|Hs108|chr10 ( 476) 3331 303.8 2.6e-82 CCDS44409.1 EGR2 gene_id:1959|Hs108|chr10 ( 426) 3007 275.6 7.2e-74 CCDS4206.1 EGR1 gene_id:1958|Hs108|chr5 ( 543) 823 85.7 1.4e-16 CCDS56528.1 EGR3 gene_id:1960|Hs108|chr8 ( 349) 768 80.7 2.8e-15 CCDS6033.1 EGR3 gene_id:1960|Hs108|chr8 ( 387) 768 80.7 3e-15 >>CCDS7267.1 EGR2 gene_id:1959|Hs108|chr10 (476 aa) initn: 3331 init1: 3331 opt: 3331 Z-score: 1591.4 bits: 303.8 E(32554): 2.6e-82 Smith-Waterman score: 3331; 100.0% identity (100.0% similar) in 476 aa overlap (1-476:1-476) 10 20 30 40 50 60 pF1KB7 MMTAKAVDKIPVTLSGFVHQLSDNIYPVEDLAATSVTIFPNAELGGPFDQMNGVAGDGMI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 MMTAKAVDKIPVTLSGFVHQLSDNIYPVEDLAATSVTIFPNAELGGPFDQMNGVAGDGMI 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 NIDMTGEKRSLDLPYPSSFAPVSAPRNQTFTYMGKFSIDPQYPGASCYPEGIINIVSAGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 NIDMTGEKRSLDLPYPSSFAPVSAPRNQTFTYMGKFSIDPQYPGASCYPEGIINIVSAGI 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 LQGVTSPASTTASSSVTSASPNPLATGPLGVCTMSQTQPDLDHLYSPPPPPPPYSGCAGD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 LQGVTSPASTTASSSVTSASPNPLATGPLGVCTMSQTQPDLDHLYSPPPPPPPYSGCAGD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 LYQDPSAFLSAATTSTSSSLAYPPPPSYPSPKPATDPGLFPMIPDYPGFFPSQCQRDLHG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 LYQDPSAFLSAATTSTSSSLAYPPPPSYPSPKPATDPGLFPMIPDYPGFFPSQCQRDLHG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 TAGPDRKPFPCPLDTLRVPPPLTPLSTIRNFTLGGPSAGVTGPGASGGSEGPRLPGSSSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 TAGPDRKPFPCPLDTLRVPPPLTPLSTIRNFTLGGPSAGVTGPGASGGSEGPRLPGSSSA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 AAAAAAAAAYNPHHLPLRPILRPRKYPNRPSKTPVHERPYPCPAEGCDRRFSRSDELTRH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 AAAAAAAAAYNPHHLPLRPILRPRKYPNRPSKTPVHERPYPCPAEGCDRRFSRSDELTRH 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB7 IRIHTGHKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACDYCGRKFARSDERKRHTKIH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 IRIHTGHKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACDYCGRKFARSDERKRHTKIH 370 380 390 400 410 420 430 440 450 460 470 pF1KB7 LRQKERKSSAPSASVPAPSTASCSGGVQPGGTLCSSNSSSLGGGPLAPCSSRTRTP :::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 LRQKERKSSAPSASVPAPSTASCSGGVQPGGTLCSSNSSSLGGGPLAPCSSRTRTP 430 440 450 460 470 >>CCDS44409.1 EGR2 gene_id:1959|Hs108|chr10 (426 aa) initn: 3007 init1: 3007 opt: 3007 Z-score: 1439.6 bits: 275.6 E(32554): 7.2e-74 Smith-Waterman score: 3007; 100.0% identity (100.0% similar) in 426 aa overlap (51-476:1-426) 30 40 50 60 70 80 pF1KB7 LSDNIYPVEDLAATSVTIFPNAELGGPFDQMNGVAGDGMINIDMTGEKRSLDLPYPSSFA :::::::::::::::::::::::::::::: CCDS44 MNGVAGDGMINIDMTGEKRSLDLPYPSSFA 10 20 30 90 100 110 120 130 140 pF1KB7 PVSAPRNQTFTYMGKFSIDPQYPGASCYPEGIINIVSAGILQGVTSPASTTASSSVTSAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 PVSAPRNQTFTYMGKFSIDPQYPGASCYPEGIINIVSAGILQGVTSPASTTASSSVTSAS 40 50 60 70 80 90 150 160 170 180 190 200 pF1KB7 PNPLATGPLGVCTMSQTQPDLDHLYSPPPPPPPYSGCAGDLYQDPSAFLSAATTSTSSSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 PNPLATGPLGVCTMSQTQPDLDHLYSPPPPPPPYSGCAGDLYQDPSAFLSAATTSTSSSL 100 110 120 130 140 150 210 220 230 240 250 260 pF1KB7 AYPPPPSYPSPKPATDPGLFPMIPDYPGFFPSQCQRDLHGTAGPDRKPFPCPLDTLRVPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 AYPPPPSYPSPKPATDPGLFPMIPDYPGFFPSQCQRDLHGTAGPDRKPFPCPLDTLRVPP 160 170 180 190 200 210 270 280 290 300 310 320 pF1KB7 PLTPLSTIRNFTLGGPSAGVTGPGASGGSEGPRLPGSSSAAAAAAAAAAYNPHHLPLRPI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 PLTPLSTIRNFTLGGPSAGVTGPGASGGSEGPRLPGSSSAAAAAAAAAAYNPHHLPLRPI 220 230 240 250 260 270 330 340 350 360 370 380 pF1KB7 LRPRKYPNRPSKTPVHERPYPCPAEGCDRRFSRSDELTRHIRIHTGHKPFQCRICMRNFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 LRPRKYPNRPSKTPVHERPYPCPAEGCDRRFSRSDELTRHIRIHTGHKPFQCRICMRNFS 280 290 300 310 320 330 390 400 410 420 430 440 pF1KB7 RSDHLTTHIRTHTGEKPFACDYCGRKFARSDERKRHTKIHLRQKERKSSAPSASVPAPST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 RSDHLTTHIRTHTGEKPFACDYCGRKFARSDERKRHTKIHLRQKERKSSAPSASVPAPST 340 350 360 370 380 390 450 460 470 pF1KB7 ASCSGGVQPGGTLCSSNSSSLGGGPLAPCSSRTRTP :::::::::::::::::::::::::::::::::::: CCDS44 ASCSGGVQPGGTLCSSNSSSLGGGPLAPCSSRTRTP 400 410 420 >>CCDS4206.1 EGR1 gene_id:1958|Hs108|chr5 (543 aa) initn: 896 init1: 708 opt: 823 Z-score: 411.3 bits: 85.7 E(32554): 1.4e-16 Smith-Waterman score: 1019; 43.1% identity (66.7% similar) in 448 aa overlap (32-476:80-469) 10 20 30 40 50 60 pF1KB7 MTAKAVDKIPVTLSGFVHQLSDNIYPVEDLAATSVTIFPNAELG-GPFDQMNGVAGDGMI ...: :. :.:. : :.... ..... CCDS42 GAAGAPEGSGSNSSSSSSGGGGGGGGGSNSSSSSSTFNPQADTGEQPYEHL---TAESFP 50 60 70 80 90 100 70 80 90 100 110 pF1KB7 NIDMTGEKRSLDLPYPSSFAPVSAPRNQTFTYMGKFSIDPQ-YPGASCYPEGIINIVSAG .:....:: .. :::. . : .:: :.::..: : . .:: ....:: : CCDS42 DISLNNEKVLVETSYPSQ-----TTRLPPITYTGRFSLEPAPNSGNTLWPEPLFSLVS-G 110 120 130 140 150 160 120 130 140 150 160 170 pF1KB7 ILQGVTSPASTTASSSVTSASPNPLATGPLGVCTMSQTQPDLDHLYSPPPP-PPPYSGCA ... .. :::.... : ...: . . ::. :.. .. : . .:: : : : . CCDS42 LVSMTNPPASSSSAPSPAASSASASQSPPLS-CAVPSN--DSSPIYSAAPTFPTPNT--- 170 180 190 200 210 180 190 200 210 220 230 pF1KB7 GDLYQDPSAFLSAATTSTSSSLAYPPPPSYPSPKPATDPGLFPMIPDYPGFFPSQCQRDL :.. .:.. .: :....: :::: .::. : . . :::::: .::.: : :: CCDS42 -DIFPEPQS--QAFPGSAGTALQYPPP-AYPAAKGGFQ---VPMIPDY--LFPQQ-QGDL 220 230 240 250 260 240 250 260 270 280 290 pF1KB7 HGTAGPDRKPFPCPLDTLRVPPPLTPLSTIRNFTLGGPSAGVTGPGASGGSEGPRLPGSS : . ::.::: :.. : :::::::. :. ...::. . CCDS42 -GLGTPDQKPFQ-GLESRTQQPSLTPLSTIKAFA------------TQSGSQDLK----- 270 280 290 300 300 310 320 330 340 350 pF1KB7 SAAAAAAAAAAYNPHHLPLRPILRPRKYPNRPSKTPVHERPYPCPAEGCDRRFSRSDELT : ..:. . . .: : ::::::::::: ::::: ::.:.:::::::::::: CCDS42 ------ALNTSYQSQLI--KPS-RMRKYPNRPSKTPPHERPYACPVESCDRRFSRSDELT 310 320 330 340 350 360 370 380 390 400 410 pF1KB7 RHIRIHTGHKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACDYCGRKFARSDERKRHTK ::::::::.:::::::::::::::::::::::::::::::::: :::::::::::::::: CCDS42 RHIRIHTGQKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACDICGRKFARSDERKRHTK 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB7 IHLRQKERKSSAPSASVPAPSTASCSGGVQPGGTLCSSNSSSLGGGPLAPCSSRTRTP ::::::..:.. :: : :.:. : . :. . : : . : .: .. .: CCDS42 IHLRQKDKKADK---SVVA-SSATSSLSSYPSPVATSYPSPVTTSYP-SPATTSYPSPVP 420 430 440 450 460 470 CCDS42 TSFSSPGSSTYPSPVHSGFPSPSVATTYSSVPPAFPAQVSSFPSSAVTNSFSASTGLSDM 480 490 500 510 520 530 >>CCDS56528.1 EGR3 gene_id:1960|Hs108|chr8 (349 aa) initn: 1136 init1: 731 opt: 768 Z-score: 387.9 bits: 80.7 E(32554): 2.8e-15 Smith-Waterman score: 1115; 51.3% identity (68.8% similar) in 398 aa overlap (57-444:14-349) 30 40 50 60 70 80 pF1KB7 PVEDLAATSVTIFPNAELGGPFDQMNGVAGDGMINIDMTGEKRSLDLPYPSSFAPVSAPR .....: .:.:: . .: : .:: : :: CCDS56 MEPCAAWSPRGGRENVMDIGLTNEKPNPELSYSGSFQP--APG 10 20 30 40 90 100 110 120 130 140 pF1KB7 NQTFTYMGKFSIDPQYPGASCYPEGIINIVSAGILQGVTSPASTTASSSVTSASPNPLAT :.: ::.:::..: :. : ..::...::::: :: ::: . :.....:: .. CCDS56 NKTVTYLGKFAFDS--PSNWCQ-DNIISLMSAGIL-GVP-PASGALSTQTSTAS---MVQ 50 60 70 80 90 150 160 170 180 190 200 pF1KB7 GPLGVCTMSQTQPDLDHLYSPPPPPPPYSGCAGDLYQDPSAFLSAATTSTSSSLAYPPPP : : :.. .: : ::::.: ::::..: .: . . . .::: : CCDS56 PPQG---------DVEAMY---PALPPYSNC-GDLYSEPVSFHD---PQGNPGLAYSPQ- 100 110 120 130 210 220 230 240 250 260 pF1KB7 SYPSPKPATDPGLFPMIPDYPGFF-PSQCQRDLHGTAGPDRKPFPCPLDTLRV-PPPLTP .: : ::: : .:::::::: . :. :. :. :..::: .: .:: :::.:: CCDS56 DYQSAKPALDSNLFPMIPDYNLYHHPN----DM-GSI-PEHKPFQ-GMDPIRVNPPPITP 140 150 160 170 180 270 280 290 300 310 320 pF1KB7 LSTIRNFTLGGPSAGVTGPGASGGSEGPRLPGSSSAAAAAAAAAAYNPHHLPLRPILRPR : ::. : . :: :: :. : : :.:: ::: CCDS56 LETIKAF-----KDKQIHPGF--GSL-PQPP-------------------LTLKPI-RPR 190 200 210 220 330 340 350 360 370 380 pF1KB7 KYPNRPSKTPVHERPYPCPAEGCDRRFSRSDELTRHIRIHTGHKPFQCRICMRNFSRSDH ::::::::::.::::. :::::::::::::::::::.::::::::::::::::.:::::: CCDS56 KYPNRPSKTPLHERPHACPAEGCDRRFSRSDELTRHLRIHTGHKPFQCRICMRSFSRSDH 230 240 250 260 270 280 390 400 410 420 430 pF1KB7 LTTHIRTHTGEKPFACDYCGRKFARSDERKRHTKIHLRQKERKS---SAPSAS-VP---- ::::::::::::::::..::::::::::::::.::::.:::.:. .::::: .: CCDS56 LTTHIRTHTGEKPFACEFCGRKFARSDERKRHAKIHLKQKEKKAEKGGAPSASSAPPVSL 290 300 310 320 330 340 440 450 460 470 pF1KB7 APSTASCSGGVQPGGTLCSSNSSSLGGGPLAPCSSRTRTP :: ...:. CCDS56 APVVTTCA >>CCDS6033.1 EGR3 gene_id:1960|Hs108|chr8 (387 aa) initn: 1228 init1: 731 opt: 768 Z-score: 387.3 bits: 80.7 E(32554): 3e-15 Smith-Waterman score: 1208; 48.9% identity (69.0% similar) in 452 aa overlap (2-444:1-387) 10 20 30 40 50 60 pF1KB7 MMTAKAVDKIPVTLSGFVHQLSDNIYPVEDLAATSVTIFPNAELGGPFDQMNGVAGDGMI ::.: ..:.:::.:....:: ::.:: : .....: .. . ..: .: .... CCDS60 MTGKLAEKLPVTMSSLLNQLPDNLYPEE--IPSALNLFSGS--SDSVVHYNQMATENVM 10 20 30 40 50 70 80 90 100 110 120 pF1KB7 NIDMTGEKRSLDLPYPSSFAPVSAPRNQTFTYMGKFSIDPQYPGASCYPEGIINIVSAGI .: .:.:: . .: : .:: : :: :.: ::.:::..: :. : ..::...:::: CCDS60 DIGLTNEKPNPELSYSGSFQP--APGNKTVTYLGKFAFDS--PSNWCQ-DNIISLMSAGI 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB7 LQGVTSPASTTASSSVTSASPNPLATGPLGVCTMSQTQPDLDHLYSPPPPPPPYSGCAGD : :: ::: . :.....:: .. : : :.. .: : ::::.: :: CCDS60 L-GVP-PASGALSTQTSTAS---MVQPPQG---------DVEAMY---PALPPYSNC-GD 120 130 140 150 190 200 210 220 230 240 pF1KB7 LYQDPSAFLSAATTSTSSSLAYPPPPSYPSPKPATDPGLFPMIPDYPGFFPSQCQRDLHG ::..: .: . . . .::: : .: : ::: : .:::::::: . . :. : CCDS60 LYSEPVSFHDP---QGNPGLAYSPQ-DYQSAKPALDSNLFPMIPDYNLY---HHPNDM-G 160 170 180 190 200 250 260 270 280 290 pF1KB7 TAGPDRKPFPCPLDTLRV-PPPLTPLSTIRNFTLGGPSAGVTGPGASGGSEGPRLPGSSS . :..::: .: .:: :::.::: ::. : . :: :: :. : CCDS60 SI-PEHKPFQ-GMDPIRVNPPPITPLETIKAF-----KDKQIHPGF--GSL-PQPP---- 210 220 230 240 250 300 310 320 330 340 350 pF1KB7 AAAAAAAAAAYNPHHLPLRPILRPRKYPNRPSKTPVHERPYPCPAEGCDRRFSRSDELTR : :.:: :::::::::::::.::::. :::::::::::::::::: CCDS60 ---------------LTLKPI-RPRKYPNRPSKTPLHERPHACPAEGCDRRFSRSDELTR 260 270 280 290 360 370 380 390 400 410 pF1KB7 HIRIHTGHKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACDYCGRKFARSDERKRHTKI :.::::::::::::::::.::::::::::::::::::::::..::::::::::::::.:: CCDS60 HLRIHTGHKPFQCRICMRSFSRSDHLTTHIRTHTGEKPFACEFCGRKFARSDERKRHAKI 300 310 320 330 340 350 420 430 440 450 460 470 pF1KB7 HLRQKERKS---SAPSAS-VP----APSTASCSGGVQPGGTLCSSNSSSLGGGPLAPCSS ::.:::.:. .::::: .: :: ...:. CCDS60 HLKQKEKKAEKGGAPSASSAPPVSLAPVVTTCA 360 370 380 pF1KB7 RTRTP 476 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 04:13:08 2016 done: Fri Nov 4 04:13:09 2016 Total Scan time: 4.240 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]