FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB7987, 441 aa
1>>>pF1KB7987 441 - 441 aa - 441 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.3887+/-0.000892; mu= 8.1367+/- 0.054
mean_var=116.2658+/-23.908, 0's: 0 Z-trim(109.6): 13 B-trim: 107 in 1/50
Lambda= 0.118946
statistics sampled from 11017 (11023) to 11017 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.701), E-opt: 0.2 (0.339), width: 16
Scan time: 3.250
The best scores are: opt bits E(32554)
CCDS3348.1 CTBP1 gene_id:1487|Hs108|chr4 ( 440) 2922 512.3 3.9e-145
CCDS43203.1 CTBP1 gene_id:1487|Hs108|chr4 ( 429) 2836 497.5 1.1e-140
CCDS7643.1 CTBP2 gene_id:1488|Hs108|chr10 ( 445) 2405 423.6 2e-118
CCDS7644.1 CTBP2 gene_id:1488|Hs108|chr10 ( 985) 2397 422.3 1e-117
CCDS904.1 PHGDH gene_id:26227|Hs108|chr1 ( 533) 484 93.9 4e-19
CCDS6609.1 GRHPR gene_id:9380|Hs108|chr9 ( 328) 318 65.4 9.9e-11
>>CCDS3348.1 CTBP1 gene_id:1487|Hs108|chr4 (440 aa)
initn: 2506 init1: 2506 opt: 2922 Z-score: 2719.1 bits: 512.3 E(32554): 3.9e-145
Smith-Waterman score: 2922; 99.8% identity (99.8% similar) in 441 aa overlap (1-441:1-440)
10 20 30 40 50 60
pF1KB7 MGSSHLLNKGLPLGVRPPIMNGPLHPRPLVALLDGRDCTVEMPILKDVATVAFCDAQSTQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 MGSSHLLNKGLPLGVRPPIMNGPLHPRPLVALLDGRDCTVEMPILKDVATVAFCDAQSTQ
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 EIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIVRIGSGFDNIDIKSAGDLGIAVCNV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 EIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIVRIGSGFDNIDIKSAGDLGIAVCNV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 PAASVEETADSTLCHILNLYRRATWLHQALREGTRVQSVEQIREVASGAARIRGETLGII
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 PAASVEETADSTLCHILNLYRRATWLHQALREGTRVQSVEQIREVASGAARIRGETLGII
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 GLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALGLQRVSTLQDLLFHSDCVTLHCGLN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 GLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALGLQRVSTLQDLLFHSDCVTLHCGLN
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB7 EHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALAQALKEGRIRGAALDVHESEPFSFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 EHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALAQALKEGRIRGAALDVHESEPFSFS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB7 QGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIRRAITGRIPDSLKNCVNKDHLTAAT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 QGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIRRAITGRIPDSLKNCVNKDHLTAAT
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB7 HWASMDPAVVHPELNGAAYSRYPPGVVGVAPTGIPAAVEGIVPSAMSLSHGLPPVAHPPH
::::::::::::::::::: ::::::::::::::::::::::::::::::::::::::::
CCDS33 HWASMDPAVVHPELNGAAY-RYPPGVVGVAPTGIPAAVEGIVPSAMSLSHGLPPVAHPPH
370 380 390 400 410
430 440
pF1KB7 APSPGQTVKPEADRDHASDQL
:::::::::::::::::::::
CCDS33 APSPGQTVKPEADRDHASDQL
420 430 440
>>CCDS43203.1 CTBP1 gene_id:1487|Hs108|chr4 (429 aa)
initn: 2420 init1: 2420 opt: 2836 Z-score: 2639.5 bits: 497.5 E(32554): 1.1e-140
Smith-Waterman score: 2836; 99.8% identity (99.8% similar) in 428 aa overlap (14-441:3-429)
10 20 30 40 50 60
pF1KB7 MGSSHLLNKGLPLGVRPPIMNGPLHPRPLVALLDGRDCTVEMPILKDVATVAFCDAQSTQ
:::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 MSGVRPPIMNGPLHPRPLVALLDGRDCTVEMPILKDVATVAFCDAQSTQ
10 20 30 40
70 80 90 100 110 120
pF1KB7 EIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIVRIGSGFDNIDIKSAGDLGIAVCNV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 EIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIVRIGSGFDNIDIKSAGDLGIAVCNV
50 60 70 80 90 100
130 140 150 160 170 180
pF1KB7 PAASVEETADSTLCHILNLYRRATWLHQALREGTRVQSVEQIREVASGAARIRGETLGII
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 PAASVEETADSTLCHILNLYRRATWLHQALREGTRVQSVEQIREVASGAARIRGETLGII
110 120 130 140 150 160
190 200 210 220 230 240
pF1KB7 GLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALGLQRVSTLQDLLFHSDCVTLHCGLN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 GLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALGLQRVSTLQDLLFHSDCVTLHCGLN
170 180 190 200 210 220
250 260 270 280 290 300
pF1KB7 EHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALAQALKEGRIRGAALDVHESEPFSFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 EHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALAQALKEGRIRGAALDVHESEPFSFS
230 240 250 260 270 280
310 320 330 340 350 360
pF1KB7 QGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIRRAITGRIPDSLKNCVNKDHLTAAT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 QGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIRRAITGRIPDSLKNCVNKDHLTAAT
290 300 310 320 330 340
370 380 390 400 410 420
pF1KB7 HWASMDPAVVHPELNGAAYSRYPPGVVGVAPTGIPAAVEGIVPSAMSLSHGLPPVAHPPH
::::::::::::::::::: ::::::::::::::::::::::::::::::::::::::::
CCDS43 HWASMDPAVVHPELNGAAY-RYPPGVVGVAPTGIPAAVEGIVPSAMSLSHGLPPVAHPPH
350 360 370 380 390 400
430 440
pF1KB7 APSPGQTVKPEADRDHASDQL
:::::::::::::::::::::
CCDS43 APSPGQTVKPEADRDHASDQL
410 420
>>CCDS7643.1 CTBP2 gene_id:1488|Hs108|chr10 (445 aa)
initn: 2391 init1: 2140 opt: 2405 Z-score: 2239.5 bits: 423.6 E(32554): 2e-118
Smith-Waterman score: 2405; 80.8% identity (95.3% similar) in 427 aa overlap (14-440:20-445)
10 20 30 40 50
pF1KB7 MGSSHLLNKGLPLGVRPPIMNGPLHPRPLVALLDGRDCTVEMPILKDVATVAFC
:.:: :::::::::::::::::::::::::::::.::::::
CCDS76 MALVDKHKVKRQRLDRICEGIRPQIMNGPLHPRPLVALLDGRDCTVEMPILKDLATVAFC
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB7 DAQSTQEIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIVRIGSGFDNIDIKSAGDLG
:::::::::::::::::::.:::::::::::::::::::.:::::::.::.:::.::.::
CCDS76 DAQSTQEIHEKVLNEAVGAMMYHTITLTREDLEKFKALRVIVRIGSGYDNVDIKAAGELG
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB7 IAVCNVPAASVEETADSTLCHILNLYRRATWLHQALREGTRVQSVEQIREVASGAARIRG
:::::.:.:.::::::::.::::::::: :::.:::::::::::::::::::::::::::
CCDS76 IAVCNIPSAAVEETADSTICHILNLYRRNTWLYQALREGTRVQSVEQIREVASGAARIRG
130 140 150 160 170 180
180 190 200 210 220 230
pF1KB7 ETLGIIGLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALGLQRVSTLQDLLFHSDCVT
::::.::.::.:::::.:::::::.:.::::::.::.::.::.::: ::::::..::::.
CCDS76 ETLGLIGFGRTGQAVAVRAKAFGFSVIFYDPYLQDGIERSLGVQRVYTLQDLLYQSDCVS
190 200 210 220 230 240
240 250 260 270 280 290
pF1KB7 LHCGLNEHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALAQALKEGRIRGAALDVHES
:::.:::::::::::::.:::::::::::.::::::::::::::::::::::::::::::
CCDS76 LHCNLNEHNHHLINDFTIKQMRQGAFLVNAARGGLVDEKALAQALKEGRIRGAALDVHES
250 260 270 280 290 300
300 310 320 330 340 350
pF1KB7 EPFSFSQGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIRRAITGRIPDSLKNCVNKD
:::::.:::::::::::::::.::::::::.:::: :: :::::::::::.::.:::::.
CCDS76 EPFSFAQGPLKDAPNLICTPHTAWYSEQASLEMREAAATEIRRAITGRIPESLRNCVNKE
310 320 330 340 350 360
360 370 380 390 400 410
pF1KB7 HLTAATHWASMDPAVVHPELNGAAYSRYPPGVVGVAPTGIPAAVEGIVPSAMSLSHGLPP
..... :. .: ..:::::::.: :::::.::::: :.:::.:::.:... ..:.::
CCDS76 FFVTSAPWSVIDQQAIHPELNGATY-RYPPGIVGVAPGGLPAAMEGIIPGGIPVTHNLPT
370 380 390 400 410
420 430 440
pF1KB7 VAHPPHAPSPGQTVKPEADRDHASDQL
:::: .::::.: .: .:.: ..:
CCDS76 VAHPSQAPSPNQPTKHGDNREHPNEQ
420 430 440
>>CCDS7644.1 CTBP2 gene_id:1488|Hs108|chr10 (985 aa)
initn: 2398 init1: 2140 opt: 2397 Z-score: 2226.7 bits: 422.3 E(32554): 1e-117
Smith-Waterman score: 2397; 80.8% identity (95.3% similar) in 426 aa overlap (15-440:561-985)
10 20 30 40
pF1KB7 MGSSHLLNKGLPLGVRPPIMNGPLHPRPLVALLDGRDCTVEMPI
.:: ::::::::::::::::::::::::::
CCDS76 LHTPHSPYQKVARRTGAPIIVSTMLAPEPSIRPQIMNGPLHPRPLVALLDGRDCTVEMPI
540 550 560 570 580 590
50 60 70 80 90 100
pF1KB7 LKDVATVAFCDAQSTQEIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIVRIGSGFDN
:::.:::::::::::::::::::::::::.:::::::::::::::::::.:::::::.::
CCDS76 LKDLATVAFCDAQSTQEIHEKVLNEAVGAMMYHTITLTREDLEKFKALRVIVRIGSGYDN
600 610 620 630 640 650
110 120 130 140 150 160
pF1KB7 IDIKSAGDLGIAVCNVPAASVEETADSTLCHILNLYRRATWLHQALREGTRVQSVEQIRE
.:::.::.:::::::.:.:.::::::::.::::::::: :::.:::::::::::::::::
CCDS76 VDIKAAGELGIAVCNIPSAAVEETADSTICHILNLYRRNTWLYQALREGTRVQSVEQIRE
660 670 680 690 700 710
170 180 190 200 210 220
pF1KB7 VASGAARIRGETLGIIGLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALGLQRVSTLQ
::::::::::::::.::.::.:::::.:::::::.:.::::::.::.::.::.::: :::
CCDS76 VASGAARIRGETLGLIGFGRTGQAVAVRAKAFGFSVIFYDPYLQDGIERSLGVQRVYTLQ
720 730 740 750 760 770
230 240 250 260 270 280
pF1KB7 DLLFHSDCVTLHCGLNEHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALAQALKEGRI
:::..::::.:::.:::::::::::::.:::::::::::.::::::::::::::::::::
CCDS76 DLLYQSDCVSLHCNLNEHNHHLINDFTIKQMRQGAFLVNAARGGLVDEKALAQALKEGRI
780 790 800 810 820 830
290 300 310 320 330 340
pF1KB7 RGAALDVHESEPFSFSQGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIRRAITGRIP
:::::::::::::::.:::::::::::::::.::::::::.:::: :: :::::::::::
CCDS76 RGAALDVHESEPFSFAQGPLKDAPNLICTPHTAWYSEQASLEMREAAATEIRRAITGRIP
840 850 860 870 880 890
350 360 370 380 390 400
pF1KB7 DSLKNCVNKDHLTAATHWASMDPAVVHPELNGAAYSRYPPGVVGVAPTGIPAAVEGIVPS
.::.:::::. ..... :. .: ..:::::::.: :::::.::::: :.:::.:::.:.
CCDS76 ESLRNCVNKEFFVTSAPWSVIDQQAIHPELNGATY-RYPPGIVGVAPGGLPAAMEGIIPG
900 910 920 930 940
410 420 430 440
pF1KB7 AMSLSHGLPPVAHPPHAPSPGQTVKPEADRDHASDQL
.. ..:.:: :::: .::::.: .: .:.: ..:
CCDS76 GIPVTHNLPTVAHPSQAPSPNQPTKHGDNREHPNEQ
950 960 970 980
>>CCDS904.1 PHGDH gene_id:26227|Hs108|chr1 (533 aa)
initn: 302 init1: 169 opt: 484 Z-score: 456.7 bits: 93.9 E(32554): 4e-19
Smith-Waterman score: 484; 31.5% identity (58.5% similar) in 330 aa overlap (67-393:45-360)
40 50 60 70 80 90
pF1KB7 DCTVEMPILKDVATVAFCDAQSTQEIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIV
:.. : .. . .: . .. . :...
CCDS90 LDPCCRKILQDGGLQVVEKQNLSKEELIAELQDCEGLIVRSATKVTADVINAAEKLQVVG
20 30 40 50 60 70
100 110 120 130 140 150
pF1KB7 RIGSGFDNIDIKSAGDLGIAVCNVPAASVEETADSTLCHILNLYRRATWLHQALREGTRV
: :.: ::.:...: :: : :.: .. .:. : :. : :. ....:
CCDS90 RAGTGVDNVDLEAATRKGILVMNTPNGNSLSAAELTCGMIMCLARQIPQATASMKDG---
80 90 100 110 120 130
160 170 180 190 200 210
pF1KB7 QSVEQIREVASGAARIRGETLGIIGLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALG
. :. . ... .. :.::::.::::.:. :: : ..::.... ::: .: : ..:
CCDS90 -KWERKKFMGT---ELNGKTLGILGLGRIGREVATRMQSFGMKTIGYDPIISPEVSASFG
140 150 160 170 180
220 230 240 250 260 270
pF1KB7 LQRVSTLQDLLFHSDCVTLHCGLNEHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALA
.:.. :... : .:.: : . :.:: : : ..:. .:: ::::.::: ::
CCDS90 VQQLP-LEEIWPLCDFITVHTPLLPSTTGLLNDNTFAQCKKGVRVVNCARGGIVDEGALL
190 200 210 220 230 240
280 290 300 310 320 330
pF1KB7 QALKEGRIRGAALDVHESEPFSFSQGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIR
.::. :. :::::: :: . : : :.: :: . ...:. . :: : ..
CCDS90 RALQSGQCAGAALDVFTEEPPR--DRALVDHENVISCPHLGASTKEAQSRCGEEIAVQFV
250 260 270 280 290 300
340 350 360 370 380 390
pF1KB7 RAITGRIPDSLKNCVNKDHLTAATHWASMDPAVVHPELNGA---AYSRYPPGVVGVAPTG
. :. :: . :: . ::.: : . : :. :.. : :.. : :
CCDS90 DMVKGK---SLTGVVNAQALTSAFS-PHTKPWIGLAEALGTLMRAWAGSPKGTIQVITQG
310 320 330 340 350 360
400 410 420 430 440
pF1KB7 IPAAVEGIVPSAMSLSHGLPPVAHPPHAPSPGQTVKPEADRDHASDQL
CCDS90 TSLKNAGNCLSPAVIVGLLKEASKQADVNLVNAKLLVKEAGLNVTTSHSPAAPGEQGFGE
370 380 390 400 410 420
>>CCDS6609.1 GRHPR gene_id:9380|Hs108|chr9 (328 aa)
initn: 346 init1: 246 opt: 318 Z-score: 306.1 bits: 65.4 E(32554): 9.9e-11
Smith-Waterman score: 318; 27.7% identity (55.3% similar) in 311 aa overlap (48-348:23-327)
20 30 40 50 60 70
pF1KB7 PIMNGPLHPRPLVALLDGRDCTVEMPILKDVATVAFCDAQ---STQEIHEKVLNEAV---
.: .: :... : . : : :...:
CCDS66 MRPVRLMKVFVTRRIPAEGRVALARAADCEVEQWDSDEPIPAKELERGVAGA
10 20 30 40 50
80 90 100 110 120
pF1KB7 -GALMYHTITLTREDLEKFKA-LRIIVRIGSGFDNIDIKSAGDLGIAVCNVPAASVEETA
: : . . .. :. : :..: .. :.:.. . :: : .: . .. ::
CCDS66 HGLLCLLSDHVDKRILDAAGANLKVISTMSVGIDHLALDEIKKRGIRVGYTPDVLTDTTA
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB7 DSTLCHILNLYRRATWLHQALREGTRVQSVEQIREVASGAARIRGETLGIIGLGRVGQAV
. .. .:. :: . ...: . : . . . : . :.:::::::.:::.
CCDS66 ELAVSLLLTTCRRLPEAIEEVKNGGWT-SWKPLWLCGYG---LTQSTVGIIGLGRIGQAI
120 130 140 150 160
190 200 210 220 230 240
pF1KB7 ALRAKAFGFNVLFYDPYLSDGVERALGLQRVSTLQDLLFHSDCVTLHCGLNEHNHHLIN-
: : : :: . ..: : : . . .: .:: ... :.:. .. : :
CCDS66 ARRLKPFGVQRFLYTGRQPRPEEAAEFQAEFVSTPELAAQSDFIVVACSLTPATEGLCNK
170 180 190 200 210 220
250 260 270 280 290 300
pF1KB7 DFTVKQMRQGAFLVNTARGGLVDEKALAQALKEGRIRGAALDVHESEPFSFSQGPLKDAP
:: ..:.. : ..: .:: .:.. : ::: :.: .:.::: ::. .. ::
CCDS66 DF-FQKMKETAVFINISRGDVVNQDDLYQALASGKIAAAGLDVTSPEPLP-TNHPLLTLK
230 240 250 260 270 280
310 320 330 340 350 360
pF1KB7 NLICTPHAAWYSEQASIEMREEAAREIRRAITGR-IPDSLKNCVNKDHLTAATHWASMDP
: . :: . .... : :: .. .. :. .:. ::
CCDS66 NCVILPHIGSATHRTRNTMSLLAANNLLAGLRGEPMPSELKL
290 300 310 320
370 380 390 400 410 420
pF1KB7 AVVHPELNGAAYSRYPPGVVGVAPTGIPAAVEGIVPSAMSLSHGLPPVAHPPHAPSPGQT
441 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 14:52:03 2016 done: Sat Nov 5 14:52:04 2016
Total Scan time: 3.250 Total Display time: 0.040
Function used was FASTA [36.3.4 Apr, 2011]