FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2684, 217 aa
1>>>pF1KE2684 217 - 217 aa - 217 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.3096+/-0.000659; mu= 13.6794+/- 0.040
mean_var=60.9908+/-12.058, 0's: 0 Z-trim(109.9): 15 B-trim: 0 in 0/53
Lambda= 0.164226
statistics sampled from 11177 (11192) to 11177 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.721), E-opt: 0.2 (0.344), width: 16
Scan time: 1.610
The best scores are: opt bits E(32554)
CCDS34031.1 EIF4E gene_id:1977|Hs108|chr4 ( 217) 1492 361.4 2.5e-100
CCDS47109.1 EIF4E gene_id:1977|Hs108|chr4 ( 237) 1454 352.4 1.4e-97
CCDS82940.1 EIF4E gene_id:1977|Hs108|chr4 ( 245) 1454 352.4 1.4e-97
CCDS47345.1 EIF4E1B gene_id:253314|Hs108|chr5 ( 242) 997 244.1 5.5e-65
CCDS54779.1 EIF4E gene_id:1977|Hs108|chr4 ( 248) 935 229.4 1.5e-60
CCDS63159.1 EIF4E2 gene_id:9470|Hs108|chr2 ( 234) 441 112.4 2.4e-25
CCDS2496.1 EIF4E2 gene_id:9470|Hs108|chr2 ( 245) 440 112.2 3e-25
CCDS63158.1 EIF4E2 gene_id:9470|Hs108|chr2 ( 236) 433 110.5 9.1e-25
CCDS74671.1 EIF4E2 gene_id:9470|Hs108|chr2 ( 189) 371 95.8 2e-20
CCDS82579.1 EIF4E2 gene_id:9470|Hs108|chr2 ( 200) 370 95.5 2.5e-20
CCDS46867.1 EIF4E3 gene_id:317649|Hs108|chr3 ( 224) 280 74.2 7.1e-14
>>CCDS34031.1 EIF4E gene_id:1977|Hs108|chr4 (217 aa)
initn: 1492 init1: 1492 opt: 1492 Z-score: 1914.7 bits: 361.4 E(32554): 2.5e-100
Smith-Waterman score: 1492; 99.5% identity (100.0% similar) in 217 aa overlap (1-217:1-217)
10 20 30 40 50 60
pF1KE2 MATVEPETTPTPNPPTTEEEKTESNQEVANPEHYIKHPLQNRWALWFFKNDKSKTWQANL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 MATVEPETTPTPNPPTTEEEKTESNQEVANPEHYIKHPLQNRWALWFFKNDKSKTWQANL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 RLISKFDTVEDFWALYNHIQLSSNLMPGCDYSLFKDGIEPMWEDEKNKRGGRWLITLNKQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 RLISKFDTVEDFWALYNHIQLSSNLMPGCDYSLFKDGIEPMWEDEKNKRGGRWLITLNKQ
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 QRRSDLNRFWLETLLCLIGESFDDYSDDVCGAVVNVRAKGDKIAIWTTECENREAVTHIG
::::::.:::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 QRRSDLDRFWLETLLCLIGESFDDYSDDVCGAVVNVRAKGDKIAIWTTECENREAVTHIG
130 140 150 160 170 180
190 200 210
pF1KE2 RVYKERLGLPPKIVIGYQSHADTATKSGSTTKNRFVV
:::::::::::::::::::::::::::::::::::::
CCDS34 RVYKERLGLPPKIVIGYQSHADTATKSGSTTKNRFVV
190 200 210
>>CCDS47109.1 EIF4E gene_id:1977|Hs108|chr4 (237 aa)
initn: 1454 init1: 1454 opt: 1454 Z-score: 1865.4 bits: 352.4 E(32554): 1.4e-97
Smith-Waterman score: 1454; 99.5% identity (100.0% similar) in 211 aa overlap (7-217:27-237)
10 20 30 40
pF1KE2 MATVEPETTPTPNPPTTEEEKTESNQEVANPEHYIKHPLQ
::::::::::::::::::::::::::::::::::
CCDS47 MLDLTSRGQVGTSRRMAEAACSAHFLETTPTPNPPTTEEEKTESNQEVANPEHYIKHPLQ
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE2 NRWALWFFKNDKSKTWQANLRLISKFDTVEDFWALYNHIQLSSNLMPGCDYSLFKDGIEP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 NRWALWFFKNDKSKTWQANLRLISKFDTVEDFWALYNHIQLSSNLMPGCDYSLFKDGIEP
70 80 90 100 110 120
110 120 130 140 150 160
pF1KE2 MWEDEKNKRGGRWLITLNKQQRRSDLNRFWLETLLCLIGESFDDYSDDVCGAVVNVRAKG
::::::::::::::::::::::::::.:::::::::::::::::::::::::::::::::
CCDS47 MWEDEKNKRGGRWLITLNKQQRRSDLDRFWLETLLCLIGESFDDYSDDVCGAVVNVRAKG
130 140 150 160 170 180
170 180 190 200 210
pF1KE2 DKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSHADTATKSGSTTKNRFVV
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 DKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSHADTATKSGSTTKNRFVV
190 200 210 220 230
>>CCDS82940.1 EIF4E gene_id:1977|Hs108|chr4 (245 aa)
initn: 1454 init1: 1454 opt: 1454 Z-score: 1865.2 bits: 352.4 E(32554): 1.4e-97
Smith-Waterman score: 1454; 99.5% identity (100.0% similar) in 211 aa overlap (7-217:35-245)
10 20 30
pF1KE2 MATVEPETTPTPNPPTTEEEKTESNQEVANPEHYIK
::::::::::::::::::::::::::::::
CCDS82 QNKKERKKMRAEDGENDAIKKQAESLRESQETTPTPNPPTTEEEKTESNQEVANPEHYIK
10 20 30 40 50 60
40 50 60 70 80 90
pF1KE2 HPLQNRWALWFFKNDKSKTWQANLRLISKFDTVEDFWALYNHIQLSSNLMPGCDYSLFKD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 HPLQNRWALWFFKNDKSKTWQANLRLISKFDTVEDFWALYNHIQLSSNLMPGCDYSLFKD
70 80 90 100 110 120
100 110 120 130 140 150
pF1KE2 GIEPMWEDEKNKRGGRWLITLNKQQRRSDLNRFWLETLLCLIGESFDDYSDDVCGAVVNV
::::::::::::::::::::::::::::::.:::::::::::::::::::::::::::::
CCDS82 GIEPMWEDEKNKRGGRWLITLNKQQRRSDLDRFWLETLLCLIGESFDDYSDDVCGAVVNV
130 140 150 160 170 180
160 170 180 190 200 210
pF1KE2 RAKGDKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSHADTATKSGSTTKNRFV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 RAKGDKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSHADTATKSGSTTKNRFV
190 200 210 220 230 240
pF1KE2 V
:
CCDS82 V
>>CCDS47345.1 EIF4E1B gene_id:253314|Hs108|chr5 (242 aa)
initn: 1008 init1: 990 opt: 997 Z-score: 1280.1 bits: 244.1 E(32554): 5.5e-65
Smith-Waterman score: 997; 65.1% identity (85.6% similar) in 215 aa overlap (6-217:30-242)
10 20 30
pF1KE2 MATVEPETTPTPNPPTTEEEKTESNQEVANPEHYIK
: .:: : : . ... ....: . .:
CCDS47 MLAVEVSEAEGGIREWEEEEKEEEAAERTPTGEKSPNSPRTLL-SLRGKARTGGPME-VK
10 20 30 40 50
40 50 60 70 80 90
pF1KE2 ---HPLQNRWALWFFKNDKSKTWQANLRLISKFDTVEDFWALYNHIQLSSNLMPGCDYSL
:::::::::::::::.:..:: ::.:..: ::::::::::.::::.:.: ::::.:
CCDS47 LELHPLQNRWALWFFKNDRSRAWQDNLHLVTKVDTVEDFWALYSHIQLASKLSSGCDYAL
60 70 80 90 100 110
100 110 120 130 140 150
pF1KE2 FKDGIEPMWEDEKNKRGGRWLITLNKQQRRSDLNRFWLETLLCLIGESFDDYSDDVCGAV
:::::.::::: .::::::::..: ::::. .:.:.:::::::::::::...: .:::::
CCDS47 FKDGIQPMWEDSRNKRGGRWLVSLAKQQRHIELDRLWLETLLCLIGESFEEHSREVCGAV
120 130 140 150 160 170
160 170 180 190 200 210
pF1KE2 VNVRAKGDKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSHADTATKSGSTTKN
::.:.::::::.:: : ::. .: :.:::::::::: :: .::::.::::::::.: .::
CCDS47 VNIRTKGDKIAVWTREAENQAGVLHVGRVYKERLGLSPKTIIGYQAHADTATKSNSLAKN
180 190 200 210 220 230
pF1KE2 RFVV
.:::
CCDS47 KFVV
240
>>CCDS54779.1 EIF4E gene_id:1977|Hs108|chr4 (248 aa)
initn: 1478 init1: 935 opt: 935 Z-score: 1200.6 bits: 229.4 E(32554): 1.5e-60
Smith-Waterman score: 1420; 87.1% identity (87.5% similar) in 248 aa overlap (1-217:1-248)
10 20 30 40 50 60
pF1KE2 MATVEPETTPTPNPPTTEEEKTESNQEVANPEHYIKHPLQNRWALWFFKNDKSKTWQANL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 MATVEPETTPTPNPPTTEEEKTESNQEVANPEHYIKHPLQNRWALWFFKNDKSKTWQANL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 RLISKFDTVEDFWALYNHIQLSSNLMPGCDYSLFKDGIEPMWEDEKNKRGGRWLITLNKQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 RLISKFDTVEDFWALYNHIQLSSNLMPGCDYSLFKDGIEPMWEDEKNKRGGRWLITLNKQ
70 80 90 100 110 120
130 140
pF1KE2 QRRSDLNRFWLET-------------------------------LLCLIGESFDDYSDDV
::::::.:::::: ::::::::::::::::
CCDS54 QRRSDLDRFWLETRWDLAMLPRLVSNFWPQVILPLQPPKVLELQLLCLIGESFDDYSDDV
130 140 150 160 170 180
150 160 170 180 190 200
pF1KE2 CGAVVNVRAKGDKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSHADTATKSGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 CGAVVNVRAKGDKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSHADTATKSGS
190 200 210 220 230 240
210
pF1KE2 TTKNRFVV
::::::::
CCDS54 TTKNRFVV
>>CCDS63159.1 EIF4E2 gene_id:9470|Hs108|chr2 (234 aa)
initn: 368 init1: 203 opt: 441 Z-score: 568.4 bits: 112.4 E(32554): 2.4e-25
Smith-Waterman score: 443; 33.8% identity (67.6% similar) in 207 aa overlap (18-213:29-229)
10 20 30 40
pF1KE2 MATVEPETTPTPNPPTTEEEKTE--SNQEVANPEHYI----KHPLQNRW
:.:::: .:: .. . . .:::: .
CCDS63 MNNKFDALKDDDSGDHDQNEENSTQKDGEKEKTERDKNQSSSKRKAVVPGPAEHPLQYNY
10 20 30 40 50 60
50 60 70 80 90
pF1KE2 ALWFFKND-----KSKTWQANLRLISKFDTVEDFWALYNHIQLSSNLMPGCDYSLFKDGI
..:. . .:.... :.. :. : .::.:: .:.:. ..: :. :::.::
CCDS63 TFWYSRRTPGRPTSSQSYEQNIKQIGTFASVEQFWRFYSHMVRPGDLTGHSDFHLFKEGI
70 80 90 100 110 120
100 110 120 130 140 150
pF1KE2 EPMWEDEKNKRGGRWLITLNKQQRRSDLNRFWLETLLCLIGESFDDYSDDVCGAVVNVRA
.:::::. :: ::.:.: : :.. .: : . .: ..::.: ....:::::.::
CCDS63 KPMWEDDANKNGGKWIIRL----RKGLASRCWENLILAMLGEQFM-VGEEICGAVVSVRF
130 140 150 160 170
160 170 180 190 200 210
pF1KE2 KGDKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSHADTATKSGSTTKNRFVV
. : :.::. .. ....: . .. :.:::. .. :..:.:. :..:. .:
CCDS63 QEDIISIWNKTASDQATTARIRDTLRRVLNLPPNTIMEYKTHTDSI-KDNSSFRNTKITL
180 190 200 210 220 230
>>CCDS2496.1 EIF4E2 gene_id:9470|Hs108|chr2 (245 aa)
initn: 364 init1: 203 opt: 440 Z-score: 566.8 bits: 112.2 E(32554): 3e-25
Smith-Waterman score: 442; 32.9% identity (65.7% similar) in 210 aa overlap (18-216:29-233)
10 20 30 40
pF1KE2 MATVEPETTPTPNPPTTEEEKTE--SNQEVANPEHYI----KHPLQNRW
:.:::: .:: .. . . .:::: .
CCDS24 MNNKFDALKDDDSGDHDQNEENSTQKDGEKEKTERDKNQSSSKRKAVVPGPAEHPLQYNY
10 20 30 40 50 60
50 60 70 80 90
pF1KE2 ALWFFKND-----KSKTWQANLRLISKFDTVEDFWALYNHIQLSSNLMPGCDYSLFKDGI
..:. . .:.... :.. :. : .::.:: .:.:. ..: :. :::.::
CCDS24 TFWYSRRTPGRPTSSQSYEQNIKQIGTFASVEQFWRFYSHMVRPGDLTGHSDFHLFKEGI
70 80 90 100 110 120
100 110 120 130 140 150
pF1KE2 EPMWEDEKNKRGGRWLITLNKQQRRSDLNRFWLETLLCLIGESFDDYSDDVCGAVVNVRA
.:::::. :: ::.:.: : :.. .: : . .: ..::.: ....:::::.::
CCDS24 KPMWEDDANKNGGKWIIRL----RKGLASRCWENLILAMLGEQFM-VGEEICGAVVSVRF
130 140 150 160 170
160 170 180 190 200 210
pF1KE2 KGDKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSHADTATKSGSTTKNRFVV
. : :.::. .. ....: . .. :.:::. .. :..:.:. : .:..
CCDS24 QEDIISIWNKTASDQATTARIRDTLRRVLNLPPNTIMEYKTHTDSIKMPGRLGPQRLLFQ
180 190 200 210 220 230
CCDS24 NLWKPRLNVP
240
>>CCDS63158.1 EIF4E2 gene_id:9470|Hs108|chr2 (236 aa)
initn: 364 init1: 203 opt: 433 Z-score: 558.1 bits: 110.5 E(32554): 9.1e-25
Smith-Waterman score: 435; 34.0% identity (67.5% similar) in 197 aa overlap (18-203:29-220)
10 20 30 40
pF1KE2 MATVEPETTPTPNPPTTEEEKTE--SNQEVANPEHYI----KHPLQNRW
:.:::: .:: .. . . .:::: .
CCDS63 MNNKFDALKDDDSGDHDQNEENSTQKDGEKEKTERDKNQSSSKRKAVVPGPAEHPLQYNY
10 20 30 40 50 60
50 60 70 80 90
pF1KE2 ALWFFKND-----KSKTWQANLRLISKFDTVEDFWALYNHIQLSSNLMPGCDYSLFKDGI
..:. . .:.... :.. :. : .::.:: .:.:. ..: :. :::.::
CCDS63 TFWYSRRTPGRPTSSQSYEQNIKQIGTFASVEQFWRFYSHMVRPGDLTGHSDFHLFKEGI
70 80 90 100 110 120
100 110 120 130 140 150
pF1KE2 EPMWEDEKNKRGGRWLITLNKQQRRSDLNRFWLETLLCLIGESFDDYSDDVCGAVVNVRA
.:::::. :: ::.:.: : :.. .: : . .: ..::.: ....:::::.::
CCDS63 KPMWEDDANKNGGKWIIRL----RKGLASRCWENLILAMLGEQFM-VGEEICGAVVSVRF
130 140 150 160 170
160 170 180 190 200 210
pF1KE2 KGDKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSHADTATKSGSTTKNRFVV
. : :.::. .. ....: . .. :.:::. .. :..:.:.
CCDS63 QEDIISIWNKTASDQATTARIRDTLRRVLNLPPNTIMEYKTHTDSIKAWEEFHGLVNSSG
180 190 200 210 220 230
CCDS63 R
>>CCDS74671.1 EIF4E2 gene_id:9470|Hs108|chr2 (189 aa)
initn: 370 init1: 203 opt: 371 Z-score: 480.2 bits: 95.8 E(32554): 2e-20
Smith-Waterman score: 371; 36.2% identity (68.7% similar) in 163 aa overlap (51-213:29-184)
30 40 50 60 70 80
pF1KE2 KTESNQEVANPEHYIKHPLQNRWALWFFKNDKSKTWQANLRLISKFDTVEDFWALYNHIQ
.: :: . . . :: ::.:: .:.:.
CCDS74 MNNKFDALKDDDSGDHDQNEENSTQKDGEKEKTERDKNQSSSK-RKVEQFWRFYSHMV
10 20 30 40 50
90 100 110 120 130 140
pF1KE2 LSSNLMPGCDYSLFKDGIEPMWEDEKNKRGGRWLITLNKQQRRSDLNRFWLETLLCLIGE
..: :. :::.::.:::::. :: ::.:.: : :.. .: : . .: ..::
CCDS74 RPGDLTGHSDFHLFKEGIKPMWEDDANKNGGKWIIRL----RKGLASRCWENLILAMLGE
60 70 80 90 100 110
150 160 170 180 190 200
pF1KE2 SFDDYSDDVCGAVVNVRAKGDKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSH
.: ....:::::.:: . : :.::. .. ....: . .. :.:::. .. :..:
CCDS74 QFM-VGEEICGAVVSVRFQEDIISIWNKTASDQATTARIRDTLRRVLNLPPNTIMEYKTH
120 130 140 150 160 170
210
pF1KE2 ADTATKSGSTTKNRFVV
.:. :..:. .:
CCDS74 TDSI-KDNSSFRNTKITL
180
>>CCDS82579.1 EIF4E2 gene_id:9470|Hs108|chr2 (200 aa)
initn: 348 init1: 203 opt: 370 Z-score: 478.6 bits: 95.5 E(32554): 2.5e-20
Smith-Waterman score: 370; 34.9% identity (66.3% similar) in 166 aa overlap (51-216:29-188)
30 40 50 60 70 80
pF1KE2 KTESNQEVANPEHYIKHPLQNRWALWFFKNDKSKTWQANLRLISKFDTVEDFWALYNHIQ
.: :: . . . :: ::.:: .:.:.
CCDS82 MNNKFDALKDDDSGDHDQNEENSTQKDGEKEKTERDKNQSSSK-RKVEQFWRFYSHMV
10 20 30 40 50
90 100 110 120 130 140
pF1KE2 LSSNLMPGCDYSLFKDGIEPMWEDEKNKRGGRWLITLNKQQRRSDLNRFWLETLLCLIGE
..: :. :::.::.:::::. :: ::.:.: : :.. .: : . .: ..::
CCDS82 RPGDLTGHSDFHLFKEGIKPMWEDDANKNGGKWIIRL----RKGLASRCWENLILAMLGE
60 70 80 90 100 110
150 160 170 180 190 200
pF1KE2 SFDDYSDDVCGAVVNVRAKGDKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSH
.: ....:::::.:: . : :.::. .. ....: . .. :.:::. .. :..:
CCDS82 QFM-VGEEICGAVVSVRFQEDIISIWNKTASDQATTARIRDTLRRVLNLPPNTIMEYKTH
120 130 140 150 160 170
210
pF1KE2 ADTATKSGSTTKNRFVV
.:. : .:..
CCDS82 TDSIKMPGRLGPQRLLFQNLWKPRLNVP
180 190 200
217 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Apr 21 11:09:01 2017 done: Fri Apr 21 11:09:01 2017
Total Scan time: 1.610 Total Display time: 0.000
Function used was FASTA [36.3.4 Apr, 2011]