FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7163, 388 aa 1>>>pF1KB7163 388 - 388 aa - 388 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.7564+/-0.00111; mu= 13.8524+/- 0.066 mean_var=58.7126+/-11.341, 0's: 0 Z-trim(101.3): 39 B-trim: 0 in 0/50 Lambda= 0.167382 statistics sampled from 6439 (6456) to 6439 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.566), E-opt: 0.2 (0.198), width: 16 Scan time: 1.910 The best scores are: opt bits E(32554) CCDS97.1 ENO1 gene_id:2023|Hs108|chr1 ( 434) 2224 545.8 2.7e-155 CCDS11062.1 ENO3 gene_id:2027|Hs108|chr17 ( 434) 1895 466.3 2.3e-131 CCDS8570.1 ENO2 gene_id:2026|Hs108|chr12 ( 434) 1891 465.4 4.4e-131 CCDS54070.1 ENO3 gene_id:2027|Hs108|chr17 ( 391) 1421 351.9 5.8e-97 >>CCDS97.1 ENO1 gene_id:2023|Hs108|chr1 (434 aa) initn: 2224 init1: 2224 opt: 2224 Z-score: 2901.4 bits: 545.8 E(32554): 2.7e-155 Smith-Waterman score: 2224; 88.7% identity (95.9% similar) in 388 aa overlap (1-388:1-388) 10 20 30 40 50 60 pF1KB7 MSILKIHARELFDSRGNPTVEVDLFTSEGLFRAAVPSGASTGIYEVLELQDNDKTRYMGK ::::::::::.::::::::::::::::.:::::::::::::::::.:::.:::::::::: CCDS97 MSILKIHAREIFDSRGNPTVEVDLFTSKGLFRAAVPSGASTGIYEALELRDNDKTRYMGK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 GVSKPVEPINKTIAPVLVSKKLNVTEQEKIDKLMIEMDGTENKSKFGANAILGVSLAACK :::: :: :::::::.:::::::::::::::::::::::::::::::::::::::::.:: CCDS97 GVSKAVEHINKTIAPALVSKKLNVTEQEKIDKLMIEMDGTENKSKFGANAILGVSLAVCK 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 ASAVEKGVPLYHHIADLSGNSKVILPVPVFNVINGSSHAVTKLAMQEFMVLPVGAANFRE :.:::::::::.:::::.:::.::::::.::::::.::: .::::::::.:::::::::: CCDS97 AGAVEKGVPLYRHIADLAGNSEVILPVPAFNVINGGSHAGNKLAMQEFMILPVGAANFRE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 AMPIGAEVYHSLKNVIKEKYGKDATGVGDGGAFAPNILENKEGLELLKTAIGKAGYTDKV :: :::::::.::::::::::::::.::: :.:::::::::::::::::::::::::::: CCDS97 AMRIGAEVYHNLKNVIKEKYGKDATNVGDEGGFAPNILENKEGLELLKTAIGKAGYTDKV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 IVSMDVEASEFFRSGKYDLEFKFLDDPTRYISPDCLADLYKSFIKNYPVVSTEDPFDQDD ...::: ::::::::::::.:: :::.:::::: ::::::::::.::::: :::::::: CCDS97 VIGMDVAASEFFRSGKYDLDFKSPDDPSRYISPDQLADLYKSFIKDYPVVSIEDPFDQDD 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 WGAWQKFTASAGIQVVEDDLRVTNPKRTASAVNEKKCNCLLLKVNQIRSVTESLQACKLA :::::::::::::::: ::: :::::: :.:::::.::::::::::: :::::::::::: CCDS97 WGAWQKFTASAGIQVVGDDLTVTNPKRIAKAVNEKSCNCLLLKVNQIGSVTESLQACKLA 310 320 330 340 350 360 370 380 pF1KB7 QANGWCVMVPHHSGETENTFITDLVVGL ::::: ::: :.:::::.:::.:::::: CCDS97 QANGWGVMVSHRSGETEDTFIADLVVGLCTGQIKTGAPCRSERLAKYNQLLRIEEELGSK 370 380 390 400 410 420 >>CCDS11062.1 ENO3 gene_id:2027|Hs108|chr17 (434 aa) initn: 1895 init1: 1895 opt: 1895 Z-score: 2472.0 bits: 466.3 E(32554): 2.3e-131 Smith-Waterman score: 1895; 74.0% identity (91.5% similar) in 388 aa overlap (1-388:1-388) 10 20 30 40 50 60 pF1KB7 MSILKIHARELFDSRGNPTVEVDLFTSEGLFRAAVPSGASTGIYEVLELQDNDKTRYMGK :.. :: :::..:::::::::::: :..: :::::::::::::::.:::.:.:: ::.:: CCDS11 MAMQKIFAREILDSRGNPTVEVDLHTAKGRFRAAVPSGASTGIYEALELRDGDKGRYLGK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 GVSKPVEPINKTIAPVLVSKKLNVTEQEKIDKLMIEMDGTENKSKFGANAILGVSLAACK :: : :: ::.:..:.:..:::.:..:::.::.:::.::::::::::::::::::::.:: CCDS11 GVLKAVENINNTLGPALLQKKLSVVDQEKVDKFMIELDGTENKSKFGANAILGVSLAVCK 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 ASAVEKGVPLYHHIADLSGNSKVILPVPVFNVINGSSHAVTKLAMQEFMVLPVGAANFRE :.:.:::::::.:::::.:: .:::::.::::::.::: .::::::::.:::::..:.: CCDS11 AGAAEKGVPLYRHIADLAGNPDLILPVPAFNVINGGSHAGNKLAMQEFMILPVGASSFKE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 AMPIGAEVYHSLKNVIKEKYGKDATGVGDGGAFAPNILENKEGLELLKTAIGKAGYTDKV :: ::::::: ::.::: :::::::.::: :.::::::::.:.:::::::: ::: ::: CCDS11 AMRIGAEVYHHLKGVIKAKYGKDATNVGDEGGFAPNILENNEALELLKTAIQAAGYPDKV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 IVSMDVEASEFFRSGKYDLEFKFLDDPTRYISPDCLADLYKSFIKNYPVVSTEDPFDQDD ...::: ::::.:.:::::.:: :::.:.:. . :..::::::::::::: :::::::: CCDS11 VIGMDVAASEFYRNGKYDLDFKSPDDPARHITGEKLGELYKSFIKNYPVVSIEDPFDQDD 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 WGAWQKFTASAGIQVVEDDLRVTNPKRTASAVNEKKCNCLLLKVNQIRSVTESLQACKLA :..: .: ....::.: ::: :::::: :.::..: ::::::::::: :::::.:::::: CCDS11 WATWTSFLSGVNIQIVGDDLTVTNPKRIAQAVEKKACNCLLLKVNQIGSVTESIQACKLA 310 320 330 340 350 360 370 380 pF1KB7 QANGWCVMVPHHSGETENTFITDLVVGL :.::: ::: :.:::::.:::.:::::: CCDS11 QSNGWGVMVSHRSGETEDTFIADLVVGLCTGQIKTGAPCRSERLAKYNQLMRIEEALGDK 370 380 390 400 410 420 >>CCDS8570.1 ENO2 gene_id:2026|Hs108|chr12 (434 aa) initn: 1891 init1: 1891 opt: 1891 Z-score: 2466.8 bits: 465.4 E(32554): 4.4e-131 Smith-Waterman score: 1891; 73.2% identity (91.5% similar) in 388 aa overlap (1-388:1-388) 10 20 30 40 50 60 pF1KB7 MSILKIHARELFDSRGNPTVEVDLFTSEGLFRAAVPSGASTGIYEVLELQDNDKTRYMGK ::: :: :::..::::::::::::.:..:::::::::::::::::.:::.:.:: ::.:: CCDS85 MSIEKIWAREILDSRGNPTVEVDLYTAKGLFRAAVPSGASTGIYEALELRDGDKQRYLGK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 GVSKPVEPINKTIAPVLVSKKLNVTEQEKIDKLMIEMDGTENKSKFGANAILGVSLAACK :: : :. ::.::::.:.:. :.:.::::.:.::.:.::::::::::::::::::::.:: CCDS85 GVLKAVDHINSTIAPALISSGLSVVEQEKLDNLMLELDGTENKSKFGANAILGVSLAVCK 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 ASAVEKGVPLYHHIADLSGNSKVILPVPVFNVINGSSHAVTKLAMQEFMVLPVGAANFRE :.:.:. .:::.:::.:.::: .:::::.::::::.::: .::::::::.::::: .::. CCDS85 AGAAERELPLYRHIAQLAGNSDLILPVPAFNVINGGSHAGNKLAMQEFMILPVGAESFRD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 AMPIGAEVYHSLKNVIKEKYGKDATGVGDGGAFAPNILENKEGLELLKTAIGKAGYTDKV :: .::::::.::.:::.:::::::.::: :.::::::::.:.:::.: :: :::::.:. CCDS85 AMRLGAEVYHTLKGVIKDKYGKDATNVGDEGGFAPNILENSEALELVKEAIDKAGYTEKI 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 IVSMDVEASEFFRSGKYDLEFKFLDDPTRYISPDCLADLYKSFIKNYPVVSTEDPFDQDD ...::: ::::.:.:::::.:: ::.:::. : :. ::..:...::::: :::::::: CCDS85 VIGMDVAASEFYRDGKYDLDFKSPTDPSRYITGDQLGALYQDFVRDYPVVSIEDPFDQDD 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 WGAWQKFTASAGIQVVEDDLRVTNPKRTASAVNEKKCNCLLLKVNQIRSVTESLQACKLA :.::.::::..:::.: ::: :::::: ::.:: ::::::::::: ::::..:::::: CCDS85 WAAWSKFTANVGIQIVGDDLTVTNPKRIERAVEEKACNCLLLKVNQIGSVTEAIQACKLA 310 320 330 340 350 360 370 380 pF1KB7 QANGWCVMVPHHSGETENTFITDLVVGL : ::: ::: :.:::::.:::.:::::: CCDS85 QENGWGVMVSHRSGETEDTFIADLVVGLCTGQIKTGAPCRSERLAKYNQLMRIEEELGDE 370 380 390 400 410 420 >>CCDS54070.1 ENO3 gene_id:2027|Hs108|chr17 (391 aa) initn: 1421 init1: 1421 opt: 1421 Z-score: 1854.2 bits: 351.9 E(32554): 5.8e-97 Smith-Waterman score: 1612; 66.5% identity (81.2% similar) in 388 aa overlap (1-388:1-345) 10 20 30 40 50 60 pF1KB7 MSILKIHARELFDSRGNPTVEVDLFTSEGLFRAAVPSGASTGIYEVLELQDNDKTRYMGK :.. :: :::..:::::::::::: :..: :::::::::::::::.:::.:.:: ::.:: CCDS54 MAMQKIFAREILDSRGNPTVEVDLHTAKGRFRAAVPSGASTGIYEALELRDGDKGRYLGK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 GVSKPVEPINKTIAPVLVSKKLNVTEQEKIDKLMIEMDGTENKSKFGANAILGVSLAACK .:::::::::::::.:: CCDS54 -------------------------------------------AKFGANAILGVSLAVCK 70 130 140 150 160 170 180 pF1KB7 ASAVEKGVPLYHHIADLSGNSKVILPVPVFNVINGSSHAVTKLAMQEFMVLPVGAANFRE :.:.:::::::.:::::.:: .:::::.::::::.::: .::::::::.:::::..:.: CCDS54 AGAAEKGVPLYRHIADLAGNPDLILPVPAFNVINGGSHAGNKLAMQEFMILPVGASSFKE 80 90 100 110 120 130 190 200 210 220 230 240 pF1KB7 AMPIGAEVYHSLKNVIKEKYGKDATGVGDGGAFAPNILENKEGLELLKTAIGKAGYTDKV :: ::::::: ::.::: :::::::.::: :.::::::::.:.:::::::: ::: ::: CCDS54 AMRIGAEVYHHLKGVIKAKYGKDATNVGDEGGFAPNILENNEALELLKTAIQAAGYPDKV 140 150 160 170 180 190 250 260 270 280 290 300 pF1KB7 IVSMDVEASEFFRSGKYDLEFKFLDDPTRYISPDCLADLYKSFIKNYPVVSTEDPFDQDD ...::: ::::.:.:::::.:: :::.:.:. . :..::::::::::::: :::::::: CCDS54 VIGMDVAASEFYRNGKYDLDFKSPDDPARHITGEKLGELYKSFIKNYPVVSIEDPFDQDD 200 210 220 230 240 250 310 320 330 340 350 360 pF1KB7 WGAWQKFTASAGIQVVEDDLRVTNPKRTASAVNEKKCNCLLLKVNQIRSVTESLQACKLA :..: .: ....::.: ::: :::::: :.::..: ::::::::::: :::::.:::::: CCDS54 WATWTSFLSGVNIQIVGDDLTVTNPKRIAQAVEKKACNCLLLKVNQIGSVTESIQACKLA 260 270 280 290 300 310 370 380 pF1KB7 QANGWCVMVPHHSGETENTFITDLVVGL :.::: ::: :.:::::.:::.:::::: CCDS54 QSNGWGVMVSHRSGETEDTFIADLVVGLCTGQIKTGAPCRSERLAKYNQLMRIEEALGDK 320 330 340 350 360 370 388 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 00:55:01 2016 done: Sat Nov 5 00:55:01 2016 Total Scan time: 1.910 Total Display time: 0.000 Function used was FASTA [36.3.4 Apr, 2011]