FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB5057, 533 aa
1>>>pF1KB5057 533 - 533 aa - 533 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.9095+/-0.000948; mu= 14.7538+/- 0.056
mean_var=66.3969+/-13.455, 0's: 0 Z-trim(104.9): 21 B-trim: 275 in 1/49
Lambda= 0.157398
statistics sampled from 8149 (8158) to 8149 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.622), E-opt: 0.2 (0.251), width: 16
Scan time: 3.430
The best scores are: opt bits E(32554)
CCDS904.1 PHGDH gene_id:26227|Hs108|chr1 ( 533) 3482 799.9 0
CCDS43203.1 CTBP1 gene_id:1487|Hs108|chr4 ( 429) 482 118.6 1.5e-26
CCDS3348.1 CTBP1 gene_id:1487|Hs108|chr4 ( 440) 482 118.6 1.5e-26
CCDS6609.1 GRHPR gene_id:9380|Hs108|chr9 ( 328) 467 115.2 1.2e-25
CCDS7643.1 CTBP2 gene_id:1488|Hs108|chr10 ( 445) 467 115.2 1.6e-25
CCDS7644.1 CTBP2 gene_id:1488|Hs108|chr10 ( 985) 467 115.3 3.4e-25
>>CCDS904.1 PHGDH gene_id:26227|Hs108|chr1 (533 aa)
initn: 3482 init1: 3482 opt: 3482 Z-score: 4270.4 bits: 799.9 E(32554): 0
Smith-Waterman score: 3482; 100.0% identity (100.0% similar) in 533 aa overlap (1-533:1-533)
10 20 30 40 50 60
pF1KB5 MAFANLRKVLISDSLDPCCRKILQDGGLQVVEKQNLSKEELIAELQDCEGLIVRSATKVT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS90 MAFANLRKVLISDSLDPCCRKILQDGGLQVVEKQNLSKEELIAELQDCEGLIVRSATKVT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB5 ADVINAAEKLQVVGRAGTGVDNVDLEAATRKGILVMNTPNGNSLSAAELTCGMIMCLARQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS90 ADVINAAEKLQVVGRAGTGVDNVDLEAATRKGILVMNTPNGNSLSAAELTCGMIMCLARQ
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB5 IPQATASMKDGKWERKKFMGTELNGKTLGILGLGRIGREVATRMQSFGMKTIGYDPIISP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS90 IPQATASMKDGKWERKKFMGTELNGKTLGILGLGRIGREVATRMQSFGMKTIGYDPIISP
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB5 EVSASFGVQQLPLEEIWPLCDFITVHTPLLPSTTGLLNDNTFAQCKKGVRVVNCARGGIV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS90 EVSASFGVQQLPLEEIWPLCDFITVHTPLLPSTTGLLNDNTFAQCKKGVRVVNCARGGIV
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB5 DEGALLRALQSGQCAGAALDVFTEEPPRDRALVDHENVISCPHLGASTKEAQSRCGEEIA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS90 DEGALLRALQSGQCAGAALDVFTEEPPRDRALVDHENVISCPHLGASTKEAQSRCGEEIA
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB5 VQFVDMVKGKSLTGVVNAQALTSAFSPHTKPWIGLAEALGTLMRAWAGSPKGTIQVITQG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS90 VQFVDMVKGKSLTGVVNAQALTSAFSPHTKPWIGLAEALGTLMRAWAGSPKGTIQVITQG
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB5 TSLKNAGNCLSPAVIVGLLKEASKQADVNLVNAKLLVKEAGLNVTTSHSPAAPGEQGFGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS90 TSLKNAGNCLSPAVIVGLLKEASKQADVNLVNAKLLVKEAGLNVTTSHSPAAPGEQGFGE
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB5 CLLAVALAGAPYQAVGLVQGTTPVLQGLNGAVFRPEVPLRRDLPLLLFRTQTSDPAMLPT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS90 CLLAVALAGAPYQAVGLVQGTTPVLQGLNGAVFRPEVPLRRDLPLLLFRTQTSDPAMLPT
430 440 450 460 470 480
490 500 510 520 530
pF1KB5 MIGLLAEAGVRLLSYQTSLVSDGETWHVMGISSLLPSLEAWKQHVTEAFQFHF
:::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS90 MIGLLAEAGVRLLSYQTSLVSDGETWHVMGISSLLPSLEAWKQHVTEAFQFHF
490 500 510 520 530
>>CCDS43203.1 CTBP1 gene_id:1487|Hs108|chr4 (429 aa)
initn: 302 init1: 169 opt: 482 Z-score: 590.2 bits: 118.6 E(32554): 1.5e-26
Smith-Waterman score: 482; 31.7% identity (58.3% similar) in 331 aa overlap (45-360:56-381)
20 30 40 50 60 70
pF1KB5 LDPCCRKILQDGGLQVVEKQNLSKEELIAELQDCEGLIVRSATKVTADVINAAEKLQVVG
:.. : .. . .: . .. . :...
CCDS43 DCTVEMPILKDVATVAFCDAQSTQEIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIV
30 40 50 60 70 80
80 90 100 110 120 130
pF1KB5 RAGTGVDNVDLEAATRKGILVMNTPNGNSLSAAELTCGMIMCLARQIPQATASMKDG---
: :.: ::.:...: :: : :.: .. .:. : :. : :. ....:
CCDS43 RIGSGFDNIDIKSAGDLGIAVCNVPAASVEETADSTLCHILNLYRRATWLHQALREGTRV
90 100 110 120 130 140
140 150 160 170 180
pF1KB5 -KWERKKFMGT---ELNGKTLGILGLGRIGREVATRMQSFGMKTIGYDPIISPEVSASFG
. :. . ... .. :.::::.::::.:. :: : ..::.... ::: .: : ..:
CCDS43 QSVEQIREVASGAARIRGETLGIIGLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALG
150 160 170 180 190 200
190 200 210 220 230 240
pF1KB5 VQQLP-LEEIWPLCDFITVHTPLLPSTTGLLNDNTFAQCKKGVRVVNCARGGIVDEGALL
.:.. :... : .:.: : . :.:: : : ..:. .:: ::::.::: ::
CCDS43 LQRVSTLQDLLFHSDCVTLHCGLNEHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALA
210 220 230 240 250 260
250 260 270 280 290 300
pF1KB5 RALQSGQCAGAALDVFTEEPPR--DRALVDHENVISCPHLGASTKEAQSRCGEEIAVQFV
.::. :. :::::: :: . : : :.: :: . ...:. . :: : ..
CCDS43 QALKEGRIRGAALDVHESEPFSFSQGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIR
270 280 290 300 310 320
310 320 330 340 350
pF1KB5 DMVKGK---SLTGVVNAQALTSAFSPHTKPWIGLAEAL--GTLMRAWAGSPKGTIQVITQ
. :. :: . :: . ::.: : : .. :. : : : :.. :
CCDS43 RAITGRIPDSLKNCVNKDHLTAA--TH---WASMDPAVVHPELNGAAYRYPPGVVGVAPT
330 340 350 360 370 380
360 370 380 390 400 410
pF1KB5 GTSLKNAGNCLSPAVIVGLLKEASKQADVNLVNAKLLVKEAGLNVTTSHSPAAPGEQGFG
:
CCDS43 GIPAAVEGIVPSAMSLSHGLPPVAHPPHAPSPGQTVKPEADRDHASDQL
390 400 410 420
>>CCDS3348.1 CTBP1 gene_id:1487|Hs108|chr4 (440 aa)
initn: 302 init1: 169 opt: 482 Z-score: 590.1 bits: 118.6 E(32554): 1.5e-26
Smith-Waterman score: 482; 31.7% identity (58.3% similar) in 331 aa overlap (45-360:67-392)
20 30 40 50 60 70
pF1KB5 LDPCCRKILQDGGLQVVEKQNLSKEELIAELQDCEGLIVRSATKVTADVINAAEKLQVVG
:.. : .. . .: . .. . :...
CCDS33 DCTVEMPILKDVATVAFCDAQSTQEIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIV
40 50 60 70 80 90
80 90 100 110 120 130
pF1KB5 RAGTGVDNVDLEAATRKGILVMNTPNGNSLSAAELTCGMIMCLARQIPQATASMKDG---
: :.: ::.:...: :: : :.: .. .:. : :. : :. ....:
CCDS33 RIGSGFDNIDIKSAGDLGIAVCNVPAASVEETADSTLCHILNLYRRATWLHQALREGTRV
100 110 120 130 140 150
140 150 160 170 180
pF1KB5 -KWERKKFMGT---ELNGKTLGILGLGRIGREVATRMQSFGMKTIGYDPIISPEVSASFG
. :. . ... .. :.::::.::::.:. :: : ..::.... ::: .: : ..:
CCDS33 QSVEQIREVASGAARIRGETLGIIGLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALG
160 170 180 190 200 210
190 200 210 220 230 240
pF1KB5 VQQLP-LEEIWPLCDFITVHTPLLPSTTGLLNDNTFAQCKKGVRVVNCARGGIVDEGALL
.:.. :... : .:.: : . :.:: : : ..:. .:: ::::.::: ::
CCDS33 LQRVSTLQDLLFHSDCVTLHCGLNEHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALA
220 230 240 250 260 270
250 260 270 280 290 300
pF1KB5 RALQSGQCAGAALDVFTEEPPR--DRALVDHENVISCPHLGASTKEAQSRCGEEIAVQFV
.::. :. :::::: :: . : : :.: :: . ...:. . :: : ..
CCDS33 QALKEGRIRGAALDVHESEPFSFSQGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIR
280 290 300 310 320 330
310 320 330 340 350
pF1KB5 DMVKGK---SLTGVVNAQALTSAFSPHTKPWIGLAEAL--GTLMRAWAGSPKGTIQVITQ
. :. :: . :: . ::.: : : .. :. : : : :.. :
CCDS33 RAITGRIPDSLKNCVNKDHLTAA--TH---WASMDPAVVHPELNGAAYRYPPGVVGVAPT
340 350 360 370 380 390
360 370 380 390 400 410
pF1KB5 GTSLKNAGNCLSPAVIVGLLKEASKQADVNLVNAKLLVKEAGLNVTTSHSPAAPGEQGFG
:
CCDS33 GIPAAVEGIVPSAMSLSHGLPPVAHPPHAPSPGQTVKPEADRDHASDQL
400 410 420 430 440
>>CCDS6609.1 GRHPR gene_id:9380|Hs108|chr9 (328 aa)
initn: 333 init1: 191 opt: 467 Z-score: 573.8 bits: 115.2 E(32554): 1.2e-25
Smith-Waterman score: 470; 29.2% identity (60.2% similar) in 319 aa overlap (6-312:6-322)
10 20 30 40 50
pF1KB5 MAFANLRKVLISDSLDPCCRKILQDGGLQVVEKQN----LSKEELIAELQDCEGLIVRSA
: ::... . : : .. ::. . . .:: . .::. .
CCDS66 MRPVRLMKVFVTRRIPAEGRVALARAADCEVEQWDSDEPIPAKELERGVAGAHGLLCLLS
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB5 TKVTADVINAA-EKLQVVGRAGTGVDNVDLEAATRKGILVMNTPNGNSLSAAELTCGMIM
.: ...:: .:.:.. ..:.:.. :. ..:: : ::. . ..:::. ....
CCDS66 DHVDKRILDAAGANLKVISTMSVGIDHLALDEIKKRGIRVGYTPDVLTDTTAELAVSLLL
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB5 CLARQIPQATASMKDGKWERKKFM---GTELNGKTLGILGLGRIGREVATRMQSFGMKTI
:..:.: .:.: : : . : :. .:.::.::::::. .: :.. ::.. .
CCDS66 TTCRRLPEAIEEVKNGGWTSWKPLWLCGYGLTQSTVGIIGLGRIGQAIARRLKPFGVQRF
130 140 150 160 170 180
180 190 200 210 220
pF1KB5 ---GYDPIISPEVSASFGVQQLPLEEIWPLCDFITVHTPLLPSTTGLLNDNTFAQCKKGV
: .: :: .: : .. . :. :::.: : :.: :: : . : . :. .
CCDS66 LYTGRQP--RPEEAAEFQAEFVSTPELAAQSDFIVVACSLTPATEGLCNKDFFQKMKETA
190 200 210 220 230
230 240 250 260 270 280
pF1KB5 RVVNCARGGIVDEGALLRALQSGQCAGAALDVFTEEP-PRDRALVDHENVISCPHLGAST
.: .:: .:.. : .:: ::. :.:.::: . :: : .. :. .: . ::.:..:
CCDS66 VFINISRGDVVNQDDLYQALASGKIAAAGLDVTSPEPLPTNHPLLTLKNCVILPHIGSAT
240 250 260 270 280 290
290 300 310 320 330 340
pF1KB5 KEAQSRCGEEIAVQFVDMVKGKSLTGVVNAQALTSAFSPHTKPWIGLAEALGTLMRAWAG
..... . : ... ..:. .
CCDS66 HRTRNTMSLLAANNLLAGLRGEPMPSELKL
300 310 320
>>CCDS7643.1 CTBP2 gene_id:1488|Hs108|chr10 (445 aa)
initn: 350 init1: 170 opt: 467 Z-score: 571.6 bits: 115.2 E(32554): 1.6e-25
Smith-Waterman score: 467; 30.8% identity (57.4% similar) in 331 aa overlap (45-360:73-398)
20 30 40 50 60 70
pF1KB5 LDPCCRKILQDGGLQVVEKQNLSKEELIAELQDCEGLIVRSATKVTADVINAAEKLQVVG
:.. : .. . .: . .. . :.:.
CCDS76 DCTVEMPILKDLATVAFCDAQSTQEIHEKVLNEAVGAMMYHTITLTREDLEKFKALRVIV
50 60 70 80 90 100
80 90 100 110 120 130
pF1KB5 RAGTGVDNVDLEAATRKGILVMNTPNGNSLSAAELTCGMIMCLARQIPQATASMKDG---
: :.: ::::..:: . :: : : :.. .:. : :. : :. ....:
CCDS76 RIGSGYDNVDIKAAGELGIAVCNIPSAAVEETADSTICHILNLYRRNTWLYQALREGTRV
110 120 130 140 150 160
140 150 160 170 180
pF1KB5 -KWERKKFMGT---ELNGKTLGILGLGRIGREVATRMQSFGMKTIGYDPIISPEVSASFG
. :. . ... .. :.:::..:.:: :. ::.: ..::...: ::: .. . :.:
CCDS76 QSVEQIREVASGAARIRGETLGLIGFGRTGQAVAVRAKAFGFSVIFYDPYLQDGIERSLG
170 180 190 200 210 220
190 200 210 220 230 240
pF1KB5 VQQL-PLEEIWPLCDFITVHTPLLPSTTGLLNDNTFAQCKKGVRVVNCARGGIVDEGALL
::.. :... : ...: : . :.:: :. : ..:. .:: ::::.::: ::
CCDS76 VQRVYTLQDLLYQSDCVSLHCNLNEHNHHLINDFTIKQMRQGAFLVNAARGGLVDEKALA
230 240 250 260 270 280
250 260 270 280 290 300
pF1KB5 RALQSGQCAGAALDVFTEEPPR--DRALVDHENVISCPHLGASTKEAQSRCGEEIAVQFV
.::. :. :::::: :: . : : :.: :: . ...:. . : :...
CCDS76 QALKEGRIRGAALDVHESEPFSFAQGPLKDAPNLICTPHTAWYSEQASLEMREAAATEIR
290 300 310 320 330 340
310 320 330 340 350
pF1KB5 DMVKGK---SLTGVVNAQALTSAFSPHTKPW--IGLAEALGTLMRAWAGSPKGTIQVITQ
. :. :: . :: . ... . :: : : : : : . :
CCDS76 RAITGRIPESLRNCVNKEFFVT-----SAPWSVIDQQAIHPELNGATYRYPPGIVGVAPG
350 360 370 380 390
360 370 380 390 400 410
pF1KB5 GTSLKNAGNCLSPAVIVGLLKEASKQADVNLVNAKLLVKEAGLNVTTSHSPAAPGEQGFG
:
CCDS76 GLPAAMEGIIPGGIPVTHNLPTVAHPSQAPSPNQPTKHGDNREHPNEQ
400 410 420 430 440
>>CCDS7644.1 CTBP2 gene_id:1488|Hs108|chr10 (985 aa)
initn: 350 init1: 170 opt: 467 Z-score: 565.8 bits: 115.3 E(32554): 3.4e-25
Smith-Waterman score: 467; 30.8% identity (57.4% similar) in 331 aa overlap (45-360:613-938)
20 30 40 50 60 70
pF1KB5 LDPCCRKILQDGGLQVVEKQNLSKEELIAELQDCEGLIVRSATKVTADVINAAEKLQVVG
:.. : .. . .: . .. . :.:.
CCDS76 DCTVEMPILKDLATVAFCDAQSTQEIHEKVLNEAVGAMMYHTITLTREDLEKFKALRVIV
590 600 610 620 630 640
80 90 100 110 120 130
pF1KB5 RAGTGVDNVDLEAATRKGILVMNTPNGNSLSAAELTCGMIMCLARQIPQATASMKDG---
: :.: ::::..:: . :: : : :.. .:. : :. : :. ....:
CCDS76 RIGSGYDNVDIKAAGELGIAVCNIPSAAVEETADSTICHILNLYRRNTWLYQALREGTRV
650 660 670 680 690 700
140 150 160 170 180
pF1KB5 -KWERKKFMGT---ELNGKTLGILGLGRIGREVATRMQSFGMKTIGYDPIISPEVSASFG
. :. . ... .. :.:::..:.:: :. ::.: ..::...: ::: .. . :.:
CCDS76 QSVEQIREVASGAARIRGETLGLIGFGRTGQAVAVRAKAFGFSVIFYDPYLQDGIERSLG
710 720 730 740 750 760
190 200 210 220 230 240
pF1KB5 VQQL-PLEEIWPLCDFITVHTPLLPSTTGLLNDNTFAQCKKGVRVVNCARGGIVDEGALL
::.. :... : ...: : . :.:: :. : ..:. .:: ::::.::: ::
CCDS76 VQRVYTLQDLLYQSDCVSLHCNLNEHNHHLINDFTIKQMRQGAFLVNAARGGLVDEKALA
770 780 790 800 810 820
250 260 270 280 290 300
pF1KB5 RALQSGQCAGAALDVFTEEPPR--DRALVDHENVISCPHLGASTKEAQSRCGEEIAVQFV
.::. :. :::::: :: . : : :.: :: . ...:. . : :...
CCDS76 QALKEGRIRGAALDVHESEPFSFAQGPLKDAPNLICTPHTAWYSEQASLEMREAAATEIR
830 840 850 860 870 880
310 320 330 340 350
pF1KB5 DMVKGK---SLTGVVNAQALTSAFSPHTKPW--IGLAEALGTLMRAWAGSPKGTIQVITQ
. :. :: . :: . ... . :: : : : : : . :
CCDS76 RAITGRIPESLRNCVNKEFFVT-----SAPWSVIDQQAIHPELNGATYRYPPGIVGVAPG
890 900 910 920 930
360 370 380 390 400 410
pF1KB5 GTSLKNAGNCLSPAVIVGLLKEASKQADVNLVNAKLLVKEAGLNVTTSHSPAAPGEQGFG
:
CCDS76 GLPAAMEGIIPGGIPVTHNLPTVAHPSQAPSPNQPTKHGDNREHPNEQ
940 950 960 970 980
533 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 06:17:45 2016 done: Sat Nov 5 06:17:46 2016
Total Scan time: 3.430 Total Display time: 0.050
Function used was FASTA [36.3.4 Apr, 2011]