FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB0441, 444 aa
1>>>pF1KB0441 444 - 444 aa - 444 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.2519+/-0.000952; mu= 17.3110+/- 0.057
mean_var=59.1379+/-11.704, 0's: 0 Z-trim(103.9): 24 B-trim: 0 in 0/47
Lambda= 0.166779
statistics sampled from 7643 (7650) to 7643 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.604), E-opt: 0.2 (0.235), width: 16
Scan time: 2.940
The best scores are: opt bits E(32554)
CCDS11197.1 SHMT1 gene_id:6470|Hs108|chr17 ( 444) 2950 718.4 3.4e-207
CCDS11196.1 SHMT1 gene_id:6470|Hs108|chr17 ( 483) 1846 452.8 3.4e-127
CCDS53805.1 SHMT2 gene_id:6472|Hs108|chr12 ( 483) 1256 310.9 1.8e-84
CCDS8934.1 SHMT2 gene_id:6472|Hs108|chr12 ( 504) 1256 310.9 1.9e-84
CCDS62112.1 SHMT1 gene_id:6470|Hs108|chr17 ( 345) 1117 277.4 1.6e-74
CCDS55837.1 SHMT2 gene_id:6472|Hs108|chr12 ( 494) 804 202.1 1e-51
>>CCDS11197.1 SHMT1 gene_id:6470|Hs108|chr17 (444 aa)
initn: 2950 init1: 2950 opt: 2950 Z-score: 3833.2 bits: 718.4 E(32554): 3.4e-207
Smith-Waterman score: 2950; 100.0% identity (100.0% similar) in 444 aa overlap (1-444:1-444)
10 20 30 40 50 60
pF1KB0 MTMPVNGAHKDADLWSSHDKMLAQPLKDSDVEVYNIIKKESNRQRVGLELIASENFASRA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 MTMPVNGAHKDADLWSSHDKMLAQPLKDSDVEVYNIIKKESNRQRVGLELIASENFASRA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB0 VLEALGSCLNNKYSEGYPGQRYYGGTEFIDELETLCQKRALQAYKLDPQCWGVNVQPYSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 VLEALGSCLNNKYSEGYPGQRYYGGTEFIDELETLCQKRALQAYKLDPQCWGVNVQPYSG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB0 SPANFAVYTALVEPHGRIMGLDLPDGGHLTHGFMTDKKKISATSIFFESMPYKVNPDTGY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SPANFAVYTALVEPHGRIMGLDLPDGGHLTHGFMTDKKKISATSIFFESMPYKVNPDTGY
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB0 INYDQLEENARLFHPKLIIAGTSCYSRNLEYARLRKIADENGAYLMADMAHISGLVAAGV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 INYDQLEENARLFHPKLIIAGTSCYSRNLEYARLRKIADENGAYLMADMAHISGLVAAGV
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB0 VPSPFEHCHVVTTTTHKTLRGCRAGMIFYRKGVAVALKQAMTLEFKVYQHQVVANCRALS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 VPSPFEHCHVVTTTTHKTLRGCRAGMIFYRKGVAVALKQAMTLEFKVYQHQVVANCRALS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB0 EALTELGYKIVTGGSDNHLILVDLRSKGTDGGRAEKVLEACSIACNKNTCPGDRSALRPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 EALTELGYKIVTGGSDNHLILVDLRSKGTDGGRAEKVLEACSIACNKNTCPGDRSALRPS
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB0 GLRLGTPALTSRGLLEKDFQKVAHFIHRGIELTLQIQSDTGVRATLKEFKERLAGDKYQA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 GLRLGTPALTSRGLLEKDFQKVAHFIHRGIELTLQIQSDTGVRATLKEFKERLAGDKYQA
370 380 390 400 410 420
430 440
pF1KB0 AVQALREEVESFASLFPLPGLPDF
::::::::::::::::::::::::
CCDS11 AVQALREEVESFASLFPLPGLPDF
430 440
>>CCDS11196.1 SHMT1 gene_id:6470|Hs108|chr17 (483 aa)
initn: 1846 init1: 1846 opt: 1846 Z-score: 2397.1 bits: 452.8 E(32554): 3.4e-127
Smith-Waterman score: 2808; 91.8% identity (91.8% similar) in 476 aa overlap (1-437:1-476)
10 20 30 40 50 60
pF1KB0 MTMPVNGAHKDADLWSSHDKMLAQPLKDSDVEVYNIIKKESNRQRVGLELIASENFASRA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 MTMPVNGAHKDADLWSSHDKMLAQPLKDSDVEVYNIIKKESNRQRVGLELIASENFASRA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB0 VLEALGSCLNNKYSEGYPGQRYYGGTEFIDELETLCQKRALQAYKLDPQCWGVNVQPYSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 VLEALGSCLNNKYSEGYPGQRYYGGTEFIDELETLCQKRALQAYKLDPQCWGVNVQPYSG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB0 SPANFAVYTALVEPHGRIMGLDLPDGGHLTHGFMTDKKKISATSIFFESMPYKVNPDTGY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SPANFAVYTALVEPHGRIMGLDLPDGGHLTHGFMTDKKKISATSIFFESMPYKVNPDTGY
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB0 INYDQLEENARLFHPKLIIAGTSCYSRNLEYARLRKIADENGAYLMADMAHISGLVAAGV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 INYDQLEENARLFHPKLIIAGTSCYSRNLEYARLRKIADENGAYLMADMAHISGLVAAGV
190 200 210 220 230 240
250 260 270
pF1KB0 VPSPFEHCHVVTTTTHKTLRGCRAGMIFYRKGV---------------------------
:::::::::::::::::::::::::::::::::
CCDS11 VPSPFEHCHVVTTTTHKTLRGCRAGMIFYRKGVKSVDPKTGKEILYNLESLINSAVFPGL
250 260 270 280 290 300
280 290 300 310 320
pF1KB0 ------------AVALKQAMTLEFKVYQHQVVANCRALSEALTELGYKIVTGGSDNHLIL
::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 QGGPHNHAIAGVAVALKQAMTLEFKVYQHQVVANCRALSEALTELGYKIVTGGSDNHLIL
310 320 330 340 350 360
330 340 350 360 370 380
pF1KB0 VDLRSKGTDGGRAEKVLEACSIACNKNTCPGDRSALRPSGLRLGTPALTSRGLLEKDFQK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 VDLRSKGTDGGRAEKVLEACSIACNKNTCPGDRSALRPSGLRLGTPALTSRGLLEKDFQK
370 380 390 400 410 420
390 400 410 420 430 440
pF1KB0 VAHFIHRGIELTLQIQSDTGVRATLKEFKERLAGDKYQAAVQALREEVESFASLFPLPGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 VAHFIHRGIELTLQIQSDTGVRATLKEFKERLAGDKYQAAVQALREEVESFASLFPLPGL
430 440 450 460 470 480
pF1KB0 PDF
CCDS11 PDF
>>CCDS53805.1 SHMT2 gene_id:6472|Hs108|chr12 (483 aa)
initn: 1816 init1: 1256 opt: 1256 Z-score: 1629.8 bits: 310.9 E(32554): 1.8e-84
Smith-Waterman score: 1742; 60.1% identity (77.6% similar) in 456 aa overlap (24-439:26-478)
10 20 30 40 50
pF1KB0 MTMPVNGAHKDADLWSSHDKMLAQPLKDSDVEVYNIIKKESNRQRVGLELIASENFAS
. :.::: :.......:..:: :::::::::: :
CCDS53 MAIRAQHSNAAQTQTGEANRGWTGQESLSDSDPEMWELLQREKDRQCRGLELIASENFCS
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB0 RAVLEALGSCLNNKYSEGYPGQRYYGGTEFIDELETLCQKRALQAYKLDPQCWGVNVQPY
::.::::::::::::::::::.:::::.: .::.: :::.:::.:. ::: ::::::::
CCDS53 RAALEALGSCLNNKYSEGYPGKRYYGGAEVVDEIELLCQRRALEAFDLDPAQWGVNVQPY
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB0 SGSPANFAVYTALVEPHGRIMGLDLPDGGHLTHGFMTDKKKISATSIFFESMPYKVNPDT
::::::.::::::..:: ::::::::::::::::.:.: :.::::::::::::::.:: :
CCDS53 SGSPANLAVYTALLQPHDRIMGLDLPDGGHLTHGYMSDVKRISATSIFFESMPYKLNPKT
130 140 150 160 170 180
180 190 200 210 220 230
pF1KB0 GYINYDQLEENARLFHPKLIIAGTSCYSRNLEYARLRKIADENGAYLMADMAHISGLVAA
: :.:.:: .::::.:.::::::: :.: ..:::.:.. :: :.:.::::::::::::
CCDS53 GLIDYNQLALTARLFRPRLIIAGTSAYARLIDYARMREVCDEVKAHLLADMAHISGLVAA
190 200 210 220 230 240
240 250 260 270
pF1KB0 GVVPSPFEHCHVVTTTTHKTLRGCRAGMIFYRKGV-------------------------
:.::::.: .::::::::::: :.:.:::::::
CCDS53 KVIPSPFKHADIVTTTTHKTLRGARSGLIFYRKGVKAVDPKTGREIPYTFEDRINFAVFP
250 260 270 280 290 300
280 290 300 310
pF1KB0 --------------AVALKQAMTLEFKVYQHQVVANCRALSEALTELGYKIVTGGSDNHL
::::::: : :. :. ::. : ::...:: : ::..:.::.::::
CCDS53 SLQGGPHNHAIAAVAVALKQACTPMFREYSLQVLKNARAMADALLERGYSLVSGGTDNHL
310 320 330 340 350 360
320 330 340 350 360 370
pF1KB0 ILVDLRSKGTDGGRAEKVLEACSIACNKNTCPGDRSALRPSGLRLGTPALTSRGLLEKDF
.::::: :: ::.:::.::: ::. :::::::::::. :.:::::.:::::: . : ::
CCDS53 VLVDLRPKGLDGARAERVLELVSITANKNTCPGDRSAITPGGLRLGAPALTSRQFREDDF
370 380 390 400 410 420
380 390 400 410 420 430
pF1KB0 QKVAHFIHRGIELTLQIQSDTGVRATLKEFKERLAGDKYQAAVQA-LREEVESFASLFPL
..:. :: .:... :...: : : :..:: : :. . : ::..::.:: ::.
CCDS53 RRVVDFIDEGVNIGLEVKSKT---AKLQDFKSFLLKDSETSQRLANLRQRVEQFARAFPM
430 440 450 460 470
440
pF1KB0 PGLPDF
:
CCDS53 PGFDEH
480
>>CCDS8934.1 SHMT2 gene_id:6472|Hs108|chr12 (504 aa)
initn: 1816 init1: 1256 opt: 1256 Z-score: 1629.5 bits: 310.9 E(32554): 1.9e-84
Smith-Waterman score: 1742; 60.1% identity (77.6% similar) in 456 aa overlap (24-439:47-499)
10 20 30 40 50
pF1KB0 MTMPVNGAHKDADLWSSHDKMLAQPLKDSDVEVYNIIKKESNRQRVGLELIAS
. :.::: :.......:..:: :::::::
CCDS89 GQLVRMAIRAQHSNAAQTQTGEANRGWTGQESLSDSDPEMWELLQREKDRQCRGLELIAS
20 30 40 50 60 70
60 70 80 90 100 110
pF1KB0 ENFASRAVLEALGSCLNNKYSEGYPGQRYYGGTEFIDELETLCQKRALQAYKLDPQCWGV
::: :::.::::::::::::::::::.:::::.: .::.: :::.:::.:. ::: :::
CCDS89 ENFCSRAALEALGSCLNNKYSEGYPGKRYYGGAEVVDEIELLCQRRALEAFDLDPAQWGV
80 90 100 110 120 130
120 130 140 150 160 170
pF1KB0 NVQPYSGSPANFAVYTALVEPHGRIMGLDLPDGGHLTHGFMTDKKKISATSIFFESMPYK
:::::::::::.::::::..:: ::::::::::::::::.:.: :.::::::::::::::
CCDS89 NVQPYSGSPANLAVYTALLQPHDRIMGLDLPDGGHLTHGYMSDVKRISATSIFFESMPYK
140 150 160 170 180 190
180 190 200 210 220 230
pF1KB0 VNPDTGYINYDQLEENARLFHPKLIIAGTSCYSRNLEYARLRKIADENGAYLMADMAHIS
.:: :: :.:.:: .::::.:.::::::: :.: ..:::.:.. :: :.:.:::::::
CCDS89 LNPKTGLIDYNQLALTARLFRPRLIIAGTSAYARLIDYARMREVCDEVKAHLLADMAHIS
200 210 220 230 240 250
240 250 260 270
pF1KB0 GLVAAGVVPSPFEHCHVVTTTTHKTLRGCRAGMIFYRKGV--------------------
::::: :.::::.: .::::::::::: :.:.:::::::
CCDS89 GLVAAKVIPSPFKHADIVTTTTHKTLRGARSGLIFYRKGVKAVDPKTGREIPYTFEDRIN
260 270 280 290 300 310
280 290 300 310
pF1KB0 -------------------AVALKQAMTLEFKVYQHQVVANCRALSEALTELGYKIVTGG
::::::: : :. :. ::. : ::...:: : ::..:.::
CCDS89 FAVFPSLQGGPHNHAIAAVAVALKQACTPMFREYSLQVLKNARAMADALLERGYSLVSGG
320 330 340 350 360 370
320 330 340 350 360 370
pF1KB0 SDNHLILVDLRSKGTDGGRAEKVLEACSIACNKNTCPGDRSALRPSGLRLGTPALTSRGL
.::::.::::: :: ::.:::.::: ::. :::::::::::. :.:::::.:::::: .
CCDS89 TDNHLVLVDLRPKGLDGARAERVLELVSITANKNTCPGDRSAITPGGLRLGAPALTSRQF
380 390 400 410 420 430
380 390 400 410 420 430
pF1KB0 LEKDFQKVAHFIHRGIELTLQIQSDTGVRATLKEFKERLAGDKYQAAVQA-LREEVESFA
: ::..:. :: .:... :...: : : :..:: : :. . : ::..::.::
CCDS89 REDDFRRVVDFIDEGVNIGLEVKSKT---AKLQDFKSFLLKDSETSQRLANLRQRVEQFA
440 450 460 470 480 490
440
pF1KB0 SLFPLPGLPDF
::.:
CCDS89 RAFPMPGFDEH
500
>>CCDS62112.1 SHMT1 gene_id:6470|Hs108|chr17 (345 aa)
initn: 1117 init1: 1117 opt: 1117 Z-score: 1451.4 bits: 277.4 E(32554): 1.6e-74
Smith-Waterman score: 1928; 88.7% identity (88.7% similar) in 345 aa overlap (139-444:1-345)
110 120 130 140 150 160
pF1KB0 QCWGVNVQPYSGSPANFAVYTALVEPHGRIMGLDLPDGGHLTHGFMTDKKKISATSIFFE
::::::::::::::::::::::::::::::
CCDS62 MGLDLPDGGHLTHGFMTDKKKISATSIFFE
10 20 30
170 180 190 200 210 220
pF1KB0 SMPYKVNPDTGYINYDQLEENARLFHPKLIIAGTSCYSRNLEYARLRKIADENGAYLMAD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 SMPYKVNPDTGYINYDQLEENARLFHPKLIIAGTSCYSRNLEYARLRKIADENGAYLMAD
40 50 60 70 80 90
230 240 250 260 270
pF1KB0 MAHISGLVAAGVVPSPFEHCHVVTTTTHKTLRGCRAGMIFYRKGV---------------
:::::::::::::::::::::::::::::::::::::::::::::
CCDS62 MAHISGLVAAGVVPSPFEHCHVVTTTTHKTLRGCRAGMIFYRKGVKSVDPKTGKEILYNL
100 110 120 130 140 150
280 290 300
pF1KB0 ------------------------AVALKQAMTLEFKVYQHQVVANCRALSEALTELGYK
::::::::::::::::::::::::::::::::::::
CCDS62 ESLINSAVFPGLQGGPHNHAIAGVAVALKQAMTLEFKVYQHQVVANCRALSEALTELGYK
160 170 180 190 200 210
310 320 330 340 350 360
pF1KB0 IVTGGSDNHLILVDLRSKGTDGGRAEKVLEACSIACNKNTCPGDRSALRPSGLRLGTPAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 IVTGGSDNHLILVDLRSKGTDGGRAEKVLEACSIACNKNTCPGDRSALRPSGLRLGTPAL
220 230 240 250 260 270
370 380 390 400 410 420
pF1KB0 TSRGLLEKDFQKVAHFIHRGIELTLQIQSDTGVRATLKEFKERLAGDKYQAAVQALREEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 TSRGLLEKDFQKVAHFIHRGIELTLQIQSDTGVRATLKEFKERLAGDKYQAAVQALREEV
280 290 300 310 320 330
430 440
pF1KB0 ESFASLFPLPGLPDF
:::::::::::::::
CCDS62 ESFASLFPLPGLPDF
340
>>CCDS55837.1 SHMT2 gene_id:6472|Hs108|chr12 (494 aa)
initn: 1751 init1: 798 opt: 804 Z-score: 1041.9 bits: 202.1 E(32554): 1e-51
Smith-Waterman score: 1677; 58.5% identity (75.9% similar) in 460 aa overlap (24-443:47-493)
10 20 30 40 50
pF1KB0 MTMPVNGAHKDADLWSSHDKMLAQPLKDSDVEVYNIIKKESNRQRVGLELIAS
. :.::: :.......:..:: :::::::
CCDS55 GQLVRMAIRAQHSNAAQTQTGEANRGWTGQESLSDSDPEMWELLQREKDRQCRGLELIAS
20 30 40 50 60 70
60 70 80 90 100 110
pF1KB0 ENFASRAVLEALGSCLNNKYSEGYPGQRYYGGTEFIDELETLCQKRALQAYKLDPQCWGV
::: :::.::::::::::::::::::.:::::.: .::.: :::.:::.:. ::: :::
CCDS55 ENFCSRAALEALGSCLNNKYSEGYPGKRYYGGAEVVDEIELLCQRRALEAFDLDPAQWGV
80 90 100 110 120 130
120 130 140 150 160 170
pF1KB0 NVQPYSGSPANFAVYTALVEPHGRIMGLDLPDGGHLTHGFMTDKKKISATSIFFESMPYK
:::::::::::.::::::..:: ::::::::::::::::.:.: :.::::::::::::::
CCDS55 NVQPYSGSPANLAVYTALLQPHDRIMGLDLPDGGHLTHGYMSDVKRISATSIFFESMPYK
140 150 160 170 180 190
180 190 200 210 220 230
pF1KB0 VNPDTGYINYDQLEENARLFHPKLIIAGTSCYSRNLEYARLRKIADENGAYLMADMAHIS
.: : .::::.:.::::::: :.: ..:::.:.. :: :.:.:::::::
CCDS55 LN----------LALTARLFRPRLIIAGTSAYARLIDYARMREVCDEVKAHLLADMAHIS
200 210 220 230 240
240 250 260 270
pF1KB0 GLVAAGVVPSPFEHCHVVTTTTHKTLRGCRAGMIFYRKGV--------------------
::::: :.::::.: .::::::::::: :.:.:::::::
CCDS55 GLVAAKVIPSPFKHADIVTTTTHKTLRGARSGLIFYRKGVKAVDPKTGREIPYTFEDRIN
250 260 270 280 290 300
280 290 300 310
pF1KB0 -------------------AVALKQAMTLEFKVYQHQVVANCRALSEALTELGYKIVTGG
::::::: : :. :. ::. : ::...:: : ::..:.::
CCDS55 FAVFPSLQGGPHNHAIAAVAVALKQACTPMFREYSLQVLKNARAMADALLERGYSLVSGG
310 320 330 340 350 360
320 330 340 350 360 370
pF1KB0 SDNHLILVDLRSKGTDGGRAEKVLEACSIACNKNTCPGDRSALRPSGLRLGTPALTSRGL
.::::.::::: :: ::.:::.::: ::. :::::::::::. :.:::::.:::::: .
CCDS55 TDNHLVLVDLRPKGLDGARAERVLELVSITANKNTCPGDRSAITPGGLRLGAPALTSRQF
370 380 390 400 410 420
380 390 400 410 420 430
pF1KB0 LEKDFQKVAHFIHRGIELTLQIQSDTGVRATLKEFKERLAGDKYQAAVQA-LREEVESFA
: ::..:. :: .:... :...: : : :..:: : :. . : ::..::.::
CCDS55 REDDFRRVVDFIDEGVNIGLEVKSKT---AKLQDFKSFLLKDSETSQRLANLRQRVEQFA
430 440 450 460 470 480
440
pF1KB0 SLFPLPGLPDF
::.::. .
CCDS55 RAFPMPGFDEH
490
444 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 16:52:37 2016 done: Sat Nov 5 16:52:38 2016
Total Scan time: 2.940 Total Display time: 0.030
Function used was FASTA [36.3.4 Apr, 2011]