FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE0907, 217 aa 1>>>pF1KE0907 217 - 217 aa - 217 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.3719+/-0.000649; mu= 13.2916+/- 0.040 mean_var=60.4442+/-11.924, 0's: 0 Z-trim(109.9): 18 B-trim: 0 in 0/53 Lambda= 0.164967 statistics sampled from 11210 (11225) to 11210 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.724), E-opt: 0.2 (0.345), width: 16 Scan time: 2.090 The best scores are: opt bits E(32554) CCDS34031.1 EIF4E gene_id:1977|Hs108|chr4 ( 217) 1498 364.4 3.2e-101 CCDS47109.1 EIF4E gene_id:1977|Hs108|chr4 ( 237) 1460 355.3 1.8e-98 CCDS82940.1 EIF4E gene_id:1977|Hs108|chr4 ( 245) 1460 355.3 1.9e-98 CCDS47345.1 EIF4E1B gene_id:253314|Hs108|chr5 ( 242) 1003 246.6 1e-65 CCDS54779.1 EIF4E gene_id:1977|Hs108|chr4 ( 248) 941 231.8 2.9e-61 CCDS63159.1 EIF4E2 gene_id:9470|Hs108|chr2 ( 234) 440 112.6 2.1e-25 CCDS2496.1 EIF4E2 gene_id:9470|Hs108|chr2 ( 245) 439 112.4 2.6e-25 CCDS63158.1 EIF4E2 gene_id:9470|Hs108|chr2 ( 236) 432 110.7 8e-25 CCDS74671.1 EIF4E2 gene_id:9470|Hs108|chr2 ( 189) 370 95.9 1.8e-20 CCDS82579.1 EIF4E2 gene_id:9470|Hs108|chr2 ( 200) 369 95.7 2.3e-20 CCDS46867.1 EIF4E3 gene_id:317649|Hs108|chr3 ( 224) 280 74.5 5.9e-14 >>CCDS34031.1 EIF4E gene_id:1977|Hs108|chr4 (217 aa) initn: 1498 init1: 1498 opt: 1498 Z-score: 1930.8 bits: 364.4 E(32554): 3.2e-101 Smith-Waterman score: 1498; 100.0% identity (100.0% similar) in 217 aa overlap (1-217:1-217) 10 20 30 40 50 60 pF1KE0 MATVEPETTPTPNPPTTEEEKTESNQEVANPEHYIKHPLQNRWALWFFKNDKSKTWQANL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 MATVEPETTPTPNPPTTEEEKTESNQEVANPEHYIKHPLQNRWALWFFKNDKSKTWQANL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 RLISKFDTVEDFWALYNHIQLSSNLMPGCDYSLFKDGIEPMWEDEKNKRGGRWLITLNKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 RLISKFDTVEDFWALYNHIQLSSNLMPGCDYSLFKDGIEPMWEDEKNKRGGRWLITLNKQ 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 QRRSDLDRFWLETLLCLIGESFDDYSDDVCGAVVNVRAKGDKIAIWTTECENREAVTHIG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 QRRSDLDRFWLETLLCLIGESFDDYSDDVCGAVVNVRAKGDKIAIWTTECENREAVTHIG 130 140 150 160 170 180 190 200 210 pF1KE0 RVYKERLGLPPKIVIGYQSHADTATKSGSTTKNRFVV ::::::::::::::::::::::::::::::::::::: CCDS34 RVYKERLGLPPKIVIGYQSHADTATKSGSTTKNRFVV 190 200 210 >>CCDS47109.1 EIF4E gene_id:1977|Hs108|chr4 (237 aa) initn: 1460 init1: 1460 opt: 1460 Z-score: 1881.3 bits: 355.3 E(32554): 1.8e-98 Smith-Waterman score: 1460; 100.0% identity (100.0% similar) in 211 aa overlap (7-217:27-237) 10 20 30 40 pF1KE0 MATVEPETTPTPNPPTTEEEKTESNQEVANPEHYIKHPLQ :::::::::::::::::::::::::::::::::: CCDS47 MLDLTSRGQVGTSRRMAEAACSAHFLETTPTPNPPTTEEEKTESNQEVANPEHYIKHPLQ 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE0 NRWALWFFKNDKSKTWQANLRLISKFDTVEDFWALYNHIQLSSNLMPGCDYSLFKDGIEP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 NRWALWFFKNDKSKTWQANLRLISKFDTVEDFWALYNHIQLSSNLMPGCDYSLFKDGIEP 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE0 MWEDEKNKRGGRWLITLNKQQRRSDLDRFWLETLLCLIGESFDDYSDDVCGAVVNVRAKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 MWEDEKNKRGGRWLITLNKQQRRSDLDRFWLETLLCLIGESFDDYSDDVCGAVVNVRAKG 130 140 150 160 170 180 170 180 190 200 210 pF1KE0 DKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSHADTATKSGSTTKNRFVV ::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 DKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSHADTATKSGSTTKNRFVV 190 200 210 220 230 >>CCDS82940.1 EIF4E gene_id:1977|Hs108|chr4 (245 aa) initn: 1460 init1: 1460 opt: 1460 Z-score: 1881.1 bits: 355.3 E(32554): 1.9e-98 Smith-Waterman score: 1460; 100.0% identity (100.0% similar) in 211 aa overlap (7-217:35-245) 10 20 30 pF1KE0 MATVEPETTPTPNPPTTEEEKTESNQEVANPEHYIK :::::::::::::::::::::::::::::: CCDS82 QNKKERKKMRAEDGENDAIKKQAESLRESQETTPTPNPPTTEEEKTESNQEVANPEHYIK 10 20 30 40 50 60 40 50 60 70 80 90 pF1KE0 HPLQNRWALWFFKNDKSKTWQANLRLISKFDTVEDFWALYNHIQLSSNLMPGCDYSLFKD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 HPLQNRWALWFFKNDKSKTWQANLRLISKFDTVEDFWALYNHIQLSSNLMPGCDYSLFKD 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE0 GIEPMWEDEKNKRGGRWLITLNKQQRRSDLDRFWLETLLCLIGESFDDYSDDVCGAVVNV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 GIEPMWEDEKNKRGGRWLITLNKQQRRSDLDRFWLETLLCLIGESFDDYSDDVCGAVVNV 130 140 150 160 170 180 160 170 180 190 200 210 pF1KE0 RAKGDKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSHADTATKSGSTTKNRFV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 RAKGDKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSHADTATKSGSTTKNRFV 190 200 210 220 230 240 pF1KE0 V : CCDS82 V >>CCDS47345.1 EIF4E1B gene_id:253314|Hs108|chr5 (242 aa) initn: 1014 init1: 996 opt: 1003 Z-score: 1293.4 bits: 246.6 E(32554): 1e-65 Smith-Waterman score: 1003; 65.6% identity (85.6% similar) in 215 aa overlap (6-217:30-242) 10 20 30 pF1KE0 MATVEPETTPTPNPPTTEEEKTESNQEVANPEHYIK : .:: : : . ... ....: . .: CCDS47 MLAVEVSEAEGGIREWEEEEKEEEAAERTPTGEKSPNSPRTLL-SLRGKARTGGPME-VK 10 20 30 40 50 40 50 60 70 80 90 pF1KE0 ---HPLQNRWALWFFKNDKSKTWQANLRLISKFDTVEDFWALYNHIQLSSNLMPGCDYSL :::::::::::::::.:..:: ::.:..: ::::::::::.::::.:.: ::::.: CCDS47 LELHPLQNRWALWFFKNDRSRAWQDNLHLVTKVDTVEDFWALYSHIQLASKLSSGCDYAL 60 70 80 90 100 110 100 110 120 130 140 150 pF1KE0 FKDGIEPMWEDEKNKRGGRWLITLNKQQRRSDLDRFWLETLLCLIGESFDDYSDDVCGAV :::::.::::: .::::::::..: ::::. .:::.:::::::::::::...: .::::: CCDS47 FKDGIQPMWEDSRNKRGGRWLVSLAKQQRHIELDRLWLETLLCLIGESFEEHSREVCGAV 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE0 VNVRAKGDKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSHADTATKSGSTTKN ::.:.::::::.:: : ::. .: :.:::::::::: :: .::::.::::::::.: .:: CCDS47 VNIRTKGDKIAVWTREAENQAGVLHVGRVYKERLGLSPKTIIGYQAHADTATKSNSLAKN 180 190 200 210 220 230 pF1KE0 RFVV .::: CCDS47 KFVV 240 >>CCDS54779.1 EIF4E gene_id:1977|Hs108|chr4 (248 aa) initn: 1484 init1: 941 opt: 941 Z-score: 1213.5 bits: 231.8 E(32554): 2.9e-61 Smith-Waterman score: 1426; 87.5% identity (87.5% similar) in 248 aa overlap (1-217:1-248) 10 20 30 40 50 60 pF1KE0 MATVEPETTPTPNPPTTEEEKTESNQEVANPEHYIKHPLQNRWALWFFKNDKSKTWQANL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 MATVEPETTPTPNPPTTEEEKTESNQEVANPEHYIKHPLQNRWALWFFKNDKSKTWQANL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 RLISKFDTVEDFWALYNHIQLSSNLMPGCDYSLFKDGIEPMWEDEKNKRGGRWLITLNKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 RLISKFDTVEDFWALYNHIQLSSNLMPGCDYSLFKDGIEPMWEDEKNKRGGRWLITLNKQ 70 80 90 100 110 120 130 140 pF1KE0 QRRSDLDRFWLET-------------------------------LLCLIGESFDDYSDDV ::::::::::::: :::::::::::::::: CCDS54 QRRSDLDRFWLETRWDLAMLPRLVSNFWPQVILPLQPPKVLELQLLCLIGESFDDYSDDV 130 140 150 160 170 180 150 160 170 180 190 200 pF1KE0 CGAVVNVRAKGDKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSHADTATKSGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 CGAVVNVRAKGDKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSHADTATKSGS 190 200 210 220 230 240 210 pF1KE0 TTKNRFVV :::::::: CCDS54 TTKNRFVV >>CCDS63159.1 EIF4E2 gene_id:9470|Hs108|chr2 (234 aa) initn: 368 init1: 203 opt: 440 Z-score: 569.5 bits: 112.6 E(32554): 2.1e-25 Smith-Waterman score: 442; 33.8% identity (67.6% similar) in 207 aa overlap (18-213:29-229) 10 20 30 40 pF1KE0 MATVEPETTPTPNPPTTEEEKTE--SNQEVANPEHYI----KHPLQNRW :.:::: .:: .. . . .:::: . CCDS63 MNNKFDALKDDDSGDHDQNEENSTQKDGEKEKTERDKNQSSSKRKAVVPGPAEHPLQYNY 10 20 30 40 50 60 50 60 70 80 90 pF1KE0 ALWFFKND-----KSKTWQANLRLISKFDTVEDFWALYNHIQLSSNLMPGCDYSLFKDGI ..:. . .:.... :.. :. : .::.:: .:.:. ..: :. :::.:: CCDS63 TFWYSRRTPGRPTSSQSYEQNIKQIGTFASVEQFWRFYSHMVRPGDLTGHSDFHLFKEGI 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE0 EPMWEDEKNKRGGRWLITLNKQQRRSDLDRFWLETLLCLIGESFDDYSDDVCGAVVNVRA .:::::. :: ::.:.: : :.. .: : . .: ..::.: ....:::::.:: CCDS63 KPMWEDDANKNGGKWIIRL----RKGLASRCWENLILAMLGEQFM-VGEEICGAVVSVRF 130 140 150 160 170 160 170 180 190 200 210 pF1KE0 KGDKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSHADTATKSGSTTKNRFVV . : :.::. .. ....: . .. :.:::. .. :..:.:. :..:. .: CCDS63 QEDIISIWNKTASDQATTARIRDTLRRVLNLPPNTIMEYKTHTDSI-KDNSSFRNTKITL 180 190 200 210 220 230 >>CCDS2496.1 EIF4E2 gene_id:9470|Hs108|chr2 (245 aa) initn: 364 init1: 203 opt: 439 Z-score: 567.9 bits: 112.4 E(32554): 2.6e-25 Smith-Waterman score: 441; 32.9% identity (65.7% similar) in 210 aa overlap (18-216:29-233) 10 20 30 40 pF1KE0 MATVEPETTPTPNPPTTEEEKTE--SNQEVANPEHYI----KHPLQNRW :.:::: .:: .. . . .:::: . CCDS24 MNNKFDALKDDDSGDHDQNEENSTQKDGEKEKTERDKNQSSSKRKAVVPGPAEHPLQYNY 10 20 30 40 50 60 50 60 70 80 90 pF1KE0 ALWFFKND-----KSKTWQANLRLISKFDTVEDFWALYNHIQLSSNLMPGCDYSLFKDGI ..:. . .:.... :.. :. : .::.:: .:.:. ..: :. :::.:: CCDS24 TFWYSRRTPGRPTSSQSYEQNIKQIGTFASVEQFWRFYSHMVRPGDLTGHSDFHLFKEGI 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE0 EPMWEDEKNKRGGRWLITLNKQQRRSDLDRFWLETLLCLIGESFDDYSDDVCGAVVNVRA .:::::. :: ::.:.: : :.. .: : . .: ..::.: ....:::::.:: CCDS24 KPMWEDDANKNGGKWIIRL----RKGLASRCWENLILAMLGEQFM-VGEEICGAVVSVRF 130 140 150 160 170 160 170 180 190 200 210 pF1KE0 KGDKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSHADTATKSGSTTKNRFVV . : :.::. .. ....: . .. :.:::. .. :..:.:. : .:.. CCDS24 QEDIISIWNKTASDQATTARIRDTLRRVLNLPPNTIMEYKTHTDSIKMPGRLGPQRLLFQ 180 190 200 210 220 230 CCDS24 NLWKPRLNVP 240 >>CCDS63158.1 EIF4E2 gene_id:9470|Hs108|chr2 (236 aa) initn: 364 init1: 203 opt: 432 Z-score: 559.1 bits: 110.7 E(32554): 8e-25 Smith-Waterman score: 434; 34.0% identity (67.5% similar) in 197 aa overlap (18-203:29-220) 10 20 30 40 pF1KE0 MATVEPETTPTPNPPTTEEEKTE--SNQEVANPEHYI----KHPLQNRW :.:::: .:: .. . . .:::: . CCDS63 MNNKFDALKDDDSGDHDQNEENSTQKDGEKEKTERDKNQSSSKRKAVVPGPAEHPLQYNY 10 20 30 40 50 60 50 60 70 80 90 pF1KE0 ALWFFKND-----KSKTWQANLRLISKFDTVEDFWALYNHIQLSSNLMPGCDYSLFKDGI ..:. . .:.... :.. :. : .::.:: .:.:. ..: :. :::.:: CCDS63 TFWYSRRTPGRPTSSQSYEQNIKQIGTFASVEQFWRFYSHMVRPGDLTGHSDFHLFKEGI 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE0 EPMWEDEKNKRGGRWLITLNKQQRRSDLDRFWLETLLCLIGESFDDYSDDVCGAVVNVRA .:::::. :: ::.:.: : :.. .: : . .: ..::.: ....:::::.:: CCDS63 KPMWEDDANKNGGKWIIRL----RKGLASRCWENLILAMLGEQFM-VGEEICGAVVSVRF 130 140 150 160 170 160 170 180 190 200 210 pF1KE0 KGDKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSHADTATKSGSTTKNRFVV . : :.::. .. ....: . .. :.:::. .. :..:.:. CCDS63 QEDIISIWNKTASDQATTARIRDTLRRVLNLPPNTIMEYKTHTDSIKAWEEFHGLVNSSG 180 190 200 210 220 230 CCDS63 R >>CCDS74671.1 EIF4E2 gene_id:9470|Hs108|chr2 (189 aa) initn: 370 init1: 203 opt: 370 Z-score: 480.9 bits: 95.9 E(32554): 1.8e-20 Smith-Waterman score: 370; 36.2% identity (68.7% similar) in 163 aa overlap (51-213:29-184) 30 40 50 60 70 80 pF1KE0 KTESNQEVANPEHYIKHPLQNRWALWFFKNDKSKTWQANLRLISKFDTVEDFWALYNHIQ .: :: . . . :: ::.:: .:.:. CCDS74 MNNKFDALKDDDSGDHDQNEENSTQKDGEKEKTERDKNQSSSK-RKVEQFWRFYSHMV 10 20 30 40 50 90 100 110 120 130 140 pF1KE0 LSSNLMPGCDYSLFKDGIEPMWEDEKNKRGGRWLITLNKQQRRSDLDRFWLETLLCLIGE ..: :. :::.::.:::::. :: ::.:.: : :.. .: : . .: ..:: CCDS74 RPGDLTGHSDFHLFKEGIKPMWEDDANKNGGKWIIRL----RKGLASRCWENLILAMLGE 60 70 80 90 100 110 150 160 170 180 190 200 pF1KE0 SFDDYSDDVCGAVVNVRAKGDKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSH .: ....:::::.:: . : :.::. .. ....: . .. :.:::. .. :..: CCDS74 QFM-VGEEICGAVVSVRFQEDIISIWNKTASDQATTARIRDTLRRVLNLPPNTIMEYKTH 120 130 140 150 160 170 210 pF1KE0 ADTATKSGSTTKNRFVV .:. :..:. .: CCDS74 TDSI-KDNSSFRNTKITL 180 >>CCDS82579.1 EIF4E2 gene_id:9470|Hs108|chr2 (200 aa) initn: 348 init1: 203 opt: 369 Z-score: 479.2 bits: 95.7 E(32554): 2.3e-20 Smith-Waterman score: 369; 34.9% identity (66.3% similar) in 166 aa overlap (51-216:29-188) 30 40 50 60 70 80 pF1KE0 KTESNQEVANPEHYIKHPLQNRWALWFFKNDKSKTWQANLRLISKFDTVEDFWALYNHIQ .: :: . . . :: ::.:: .:.:. CCDS82 MNNKFDALKDDDSGDHDQNEENSTQKDGEKEKTERDKNQSSSK-RKVEQFWRFYSHMV 10 20 30 40 50 90 100 110 120 130 140 pF1KE0 LSSNLMPGCDYSLFKDGIEPMWEDEKNKRGGRWLITLNKQQRRSDLDRFWLETLLCLIGE ..: :. :::.::.:::::. :: ::.:.: : :.. .: : . .: ..:: CCDS82 RPGDLTGHSDFHLFKEGIKPMWEDDANKNGGKWIIRL----RKGLASRCWENLILAMLGE 60 70 80 90 100 110 150 160 170 180 190 200 pF1KE0 SFDDYSDDVCGAVVNVRAKGDKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSH .: ....:::::.:: . : :.::. .. ....: . .. :.:::. .. :..: CCDS82 QFM-VGEEICGAVVSVRFQEDIISIWNKTASDQATTARIRDTLRRVLNLPPNTIMEYKTH 120 130 140 150 160 170 210 pF1KE0 ADTATKSGSTTKNRFVV .:. : .:.. CCDS82 TDSIKMPGRLGPQRLLFQNLWKPRLNVP 180 190 200 217 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 04:26:18 2016 done: Sat Nov 5 04:26:18 2016 Total Scan time: 2.090 Total Display time: 0.020 Function used was FASTA [36.3.4 Apr, 2011]