FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB3372, 445 aa
1>>>pF1KB3372 445 - 445 aa - 445 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.8834+/-0.000969; mu= 10.1974+/- 0.058
mean_var=96.9947+/-19.395, 0's: 0 Z-trim(106.8): 20 B-trim: 0 in 0/51
Lambda= 0.130227
statistics sampled from 9169 (9177) to 9169 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.654), E-opt: 0.2 (0.282), width: 16
Scan time: 2.270
The best scores are: opt bits E(32554)
CCDS7643.1 CTBP2 gene_id:1488|Hs108|chr10 ( 445) 2973 569.0 3.3e-162
CCDS7644.1 CTBP2 gene_id:1488|Hs108|chr10 ( 985) 2837 543.6 3.3e-154
CCDS43203.1 CTBP1 gene_id:1487|Hs108|chr4 ( 429) 2417 464.5 8.9e-131
CCDS3348.1 CTBP1 gene_id:1487|Hs108|chr4 ( 440) 2417 464.6 9.1e-131
CCDS904.1 PHGDH gene_id:26227|Hs108|chr1 ( 533) 467 98.2 2.1e-20
CCDS6609.1 GRHPR gene_id:9380|Hs108|chr9 ( 328) 314 69.4 6.1e-12
>>CCDS7643.1 CTBP2 gene_id:1488|Hs108|chr10 (445 aa)
initn: 2973 init1: 2973 opt: 2973 Z-score: 3025.6 bits: 569.0 E(32554): 3.3e-162
Smith-Waterman score: 2973; 100.0% identity (100.0% similar) in 445 aa overlap (1-445:1-445)
10 20 30 40 50 60
pF1KB3 MALVDKHKVKRQRLDRICEGIRPQIMNGPLHPRPLVALLDGRDCTVEMPILKDLATVAFC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 MALVDKHKVKRQRLDRICEGIRPQIMNGPLHPRPLVALLDGRDCTVEMPILKDLATVAFC
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB3 DAQSTQEIHEKVLNEAVGAMMYHTITLTREDLEKFKALRVIVRIGSGYDNVDIKAAGELG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 DAQSTQEIHEKVLNEAVGAMMYHTITLTREDLEKFKALRVIVRIGSGYDNVDIKAAGELG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB3 IAVCNIPSAAVEETADSTICHILNLYRRNTWLYQALREGTRVQSVEQIREVASGAARIRG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 IAVCNIPSAAVEETADSTICHILNLYRRNTWLYQALREGTRVQSVEQIREVASGAARIRG
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB3 ETLGLIGFGRTGQAVAVRAKAFGFSVIFYDPYLQDGIERSLGVQRVYTLQDLLYQSDCVS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 ETLGLIGFGRTGQAVAVRAKAFGFSVIFYDPYLQDGIERSLGVQRVYTLQDLLYQSDCVS
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB3 LHCNLNEHNHHLINDFTIKQMRQGAFLVNAARGGLVDEKALAQALKEGRIRGAALDVHES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 LHCNLNEHNHHLINDFTIKQMRQGAFLVNAARGGLVDEKALAQALKEGRIRGAALDVHES
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB3 EPFSFAQGPLKDAPNLICTPHTAWYSEQASLEMREAAATEIRRAITGRIPESLRNCVNKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 EPFSFAQGPLKDAPNLICTPHTAWYSEQASLEMREAAATEIRRAITGRIPESLRNCVNKE
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB3 FFVTSAPWSVIDQQAIHPELNGATYRYPPGIVGVAPGGLPAAMEGIIPGGIPVTHNLPTV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 FFVTSAPWSVIDQQAIHPELNGATYRYPPGIVGVAPGGLPAAMEGIIPGGIPVTHNLPTV
370 380 390 400 410 420
430 440
pF1KB3 AHPSQAPSPNQPTKHGDNREHPNEQ
:::::::::::::::::::::::::
CCDS76 AHPSQAPSPNQPTKHGDNREHPNEQ
430 440
>>CCDS7644.1 CTBP2 gene_id:1488|Hs108|chr10 (985 aa)
initn: 2837 init1: 2837 opt: 2837 Z-score: 2882.0 bits: 543.6 E(32554): 3.3e-154
Smith-Waterman score: 2837; 100.0% identity (100.0% similar) in 425 aa overlap (21-445:561-985)
10 20 30 40 50
pF1KB3 MALVDKHKVKRQRLDRICEGIRPQIMNGPLHPRPLVALLDGRDCTVEMPI
::::::::::::::::::::::::::::::
CCDS76 LHTPHSPYQKVARRTGAPIIVSTMLAPEPSIRPQIMNGPLHPRPLVALLDGRDCTVEMPI
540 550 560 570 580 590
60 70 80 90 100 110
pF1KB3 LKDLATVAFCDAQSTQEIHEKVLNEAVGAMMYHTITLTREDLEKFKALRVIVRIGSGYDN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 LKDLATVAFCDAQSTQEIHEKVLNEAVGAMMYHTITLTREDLEKFKALRVIVRIGSGYDN
600 610 620 630 640 650
120 130 140 150 160 170
pF1KB3 VDIKAAGELGIAVCNIPSAAVEETADSTICHILNLYRRNTWLYQALREGTRVQSVEQIRE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 VDIKAAGELGIAVCNIPSAAVEETADSTICHILNLYRRNTWLYQALREGTRVQSVEQIRE
660 670 680 690 700 710
180 190 200 210 220 230
pF1KB3 VASGAARIRGETLGLIGFGRTGQAVAVRAKAFGFSVIFYDPYLQDGIERSLGVQRVYTLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 VASGAARIRGETLGLIGFGRTGQAVAVRAKAFGFSVIFYDPYLQDGIERSLGVQRVYTLQ
720 730 740 750 760 770
240 250 260 270 280 290
pF1KB3 DLLYQSDCVSLHCNLNEHNHHLINDFTIKQMRQGAFLVNAARGGLVDEKALAQALKEGRI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 DLLYQSDCVSLHCNLNEHNHHLINDFTIKQMRQGAFLVNAARGGLVDEKALAQALKEGRI
780 790 800 810 820 830
300 310 320 330 340 350
pF1KB3 RGAALDVHESEPFSFAQGPLKDAPNLICTPHTAWYSEQASLEMREAAATEIRRAITGRIP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 RGAALDVHESEPFSFAQGPLKDAPNLICTPHTAWYSEQASLEMREAAATEIRRAITGRIP
840 850 860 870 880 890
360 370 380 390 400 410
pF1KB3 ESLRNCVNKEFFVTSAPWSVIDQQAIHPELNGATYRYPPGIVGVAPGGLPAAMEGIIPGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 ESLRNCVNKEFFVTSAPWSVIDQQAIHPELNGATYRYPPGIVGVAPGGLPAAMEGIIPGG
900 910 920 930 940 950
420 430 440
pF1KB3 IPVTHNLPTVAHPSQAPSPNQPTKHGDNREHPNEQ
:::::::::::::::::::::::::::::::::::
CCDS76 IPVTHNLPTVAHPSQAPSPNQPTKHGDNREHPNEQ
960 970 980
>>CCDS43203.1 CTBP1 gene_id:1487|Hs108|chr4 (429 aa)
initn: 2405 init1: 2382 opt: 2417 Z-score: 2461.3 bits: 464.5 E(32554): 8.9e-131
Smith-Waterman score: 2417; 81.0% identity (95.5% similar) in 426 aa overlap (20-445:3-428)
10 20 30 40 50 60
pF1KB3 MALVDKHKVKRQRLDRICEGIRPQIMNGPLHPRPLVALLDGRDCTVEMPILKDLATVAFC
:.:: :::::::::::::::::::::::::::::.::::::
CCDS43 MSGVRPPIMNGPLHPRPLVALLDGRDCTVEMPILKDVATVAFC
10 20 30 40
70 80 90 100 110 120
pF1KB3 DAQSTQEIHEKVLNEAVGAMMYHTITLTREDLEKFKALRVIVRIGSGYDNVDIKAAGELG
:::::::::::::::::::.:::::::::::::::::::.:::::::.::.:::.::.::
CCDS43 DAQSTQEIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIVRIGSGFDNIDIKSAGDLG
50 60 70 80 90 100
130 140 150 160 170 180
pF1KB3 IAVCNIPSAAVEETADSTICHILNLYRRNTWLYQALREGTRVQSVEQIREVASGAARIRG
:::::.:.:.::::::::.::::::::: :::.:::::::::::::::::::::::::::
CCDS43 IAVCNVPAASVEETADSTLCHILNLYRRATWLHQALREGTRVQSVEQIREVASGAARIRG
110 120 130 140 150 160
190 200 210 220 230 240
pF1KB3 ETLGLIGFGRTGQAVAVRAKAFGFSVIFYDPYLQDGIERSLGVQRVYTLQDLLYQSDCVS
::::.::.::.:::::.:::::::.:.::::::.::.::.::.::: ::::::..::::.
CCDS43 ETLGIIGLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALGLQRVSTLQDLLFHSDCVT
170 180 190 200 210 220
250 260 270 280 290 300
pF1KB3 LHCNLNEHNHHLINDFTIKQMRQGAFLVNAARGGLVDEKALAQALKEGRIRGAALDVHES
:::.:::::::::::::.:::::::::::.::::::::::::::::::::::::::::::
CCDS43 LHCGLNEHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALAQALKEGRIRGAALDVHES
230 240 250 260 270 280
310 320 330 340 350 360
pF1KB3 EPFSFAQGPLKDAPNLICTPHTAWYSEQASLEMREAAATEIRRAITGRIPESLRNCVNKE
:::::.:::::::::::::::.::::::::.:::: :: :::::::::::.::.:::::.
CCDS43 EPFSFSQGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIRRAITGRIPDSLKNCVNKD
290 300 310 320 330 340
370 380 390 400 410 420
pF1KB3 FFVTSAPWSVIDQQAIHPELNGATYRYPPGIVGVAPGGLPAAMEGIIPGGIPVTHNLPTV
..... :. .: ..:::::::.::::::.::::: :.:::.:::.:... ..:.:: :
CCDS43 HLTAATHWASMDPAVVHPELNGAAYRYPPGVVGVAPTGIPAAVEGIVPSAMSLSHGLPPV
350 360 370 380 390 400
430 440
pF1KB3 AHPSQAPSPNQPTKHGDNREHPNEQ
::: .::::.: .: .:.: ..:
CCDS43 AHPPHAPSPGQTVKPEADRDHASDQL
410 420
>>CCDS3348.1 CTBP1 gene_id:1487|Hs108|chr4 (440 aa)
initn: 2405 init1: 2382 opt: 2417 Z-score: 2461.1 bits: 464.6 E(32554): 9.1e-131
Smith-Waterman score: 2417; 81.0% identity (95.5% similar) in 426 aa overlap (20-445:14-439)
10 20 30 40 50 60
pF1KB3 MALVDKHKVKRQRLDRICEGIRPQIMNGPLHPRPLVALLDGRDCTVEMPILKDLATVAFC
:.:: :::::::::::::::::::::::::::::.::::::
CCDS33 MGSSHLLNKGLPLGVRPPIMNGPLHPRPLVALLDGRDCTVEMPILKDVATVAFC
10 20 30 40 50
70 80 90 100 110 120
pF1KB3 DAQSTQEIHEKVLNEAVGAMMYHTITLTREDLEKFKALRVIVRIGSGYDNVDIKAAGELG
:::::::::::::::::::.:::::::::::::::::::.:::::::.::.:::.::.::
CCDS33 DAQSTQEIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIVRIGSGFDNIDIKSAGDLG
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB3 IAVCNIPSAAVEETADSTICHILNLYRRNTWLYQALREGTRVQSVEQIREVASGAARIRG
:::::.:.:.::::::::.::::::::: :::.:::::::::::::::::::::::::::
CCDS33 IAVCNVPAASVEETADSTLCHILNLYRRATWLHQALREGTRVQSVEQIREVASGAARIRG
120 130 140 150 160 170
190 200 210 220 230 240
pF1KB3 ETLGLIGFGRTGQAVAVRAKAFGFSVIFYDPYLQDGIERSLGVQRVYTLQDLLYQSDCVS
::::.::.::.:::::.:::::::.:.::::::.::.::.::.::: ::::::..::::.
CCDS33 ETLGIIGLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALGLQRVSTLQDLLFHSDCVT
180 190 200 210 220 230
250 260 270 280 290 300
pF1KB3 LHCNLNEHNHHLINDFTIKQMRQGAFLVNAARGGLVDEKALAQALKEGRIRGAALDVHES
:::.:::::::::::::.:::::::::::.::::::::::::::::::::::::::::::
CCDS33 LHCGLNEHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALAQALKEGRIRGAALDVHES
240 250 260 270 280 290
310 320 330 340 350 360
pF1KB3 EPFSFAQGPLKDAPNLICTPHTAWYSEQASLEMREAAATEIRRAITGRIPESLRNCVNKE
:::::.:::::::::::::::.::::::::.:::: :: :::::::::::.::.:::::.
CCDS33 EPFSFSQGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIRRAITGRIPDSLKNCVNKD
300 310 320 330 340 350
370 380 390 400 410 420
pF1KB3 FFVTSAPWSVIDQQAIHPELNGATYRYPPGIVGVAPGGLPAAMEGIIPGGIPVTHNLPTV
..... :. .: ..:::::::.::::::.::::: :.:::.:::.:... ..:.:: :
CCDS33 HLTAATHWASMDPAVVHPELNGAAYRYPPGVVGVAPTGIPAAVEGIVPSAMSLSHGLPPV
360 370 380 390 400 410
430 440
pF1KB3 AHPSQAPSPNQPTKHGDNREHPNEQ
::: .::::.: .: .:.: ..:
CCDS33 AHPPHAPSPGQTVKPEADRDHASDQL
420 430 440
>>CCDS904.1 PHGDH gene_id:26227|Hs108|chr1 (533 aa)
initn: 350 init1: 170 opt: 467 Z-score: 479.8 bits: 98.2 E(32554): 2.1e-20
Smith-Waterman score: 467; 30.8% identity (57.4% similar) in 331 aa overlap (73-398:45-360)
50 60 70 80 90 100
pF1KB3 DCTVEMPILKDLATVAFCDAQSTQEIHEKVLNEAVGAMMYHTITLTREDLEKFKALRVIV
:.. : .. . .: . .. . :.:.
CCDS90 LDPCCRKILQDGGLQVVEKQNLSKEELIAELQDCEGLIVRSATKVTADVINAAEKLQVVG
20 30 40 50 60 70
110 120 130 140 150 160
pF1KB3 RIGSGYDNVDIKAAGELGIAVCNIPSAAVEETADSTICHILNLYRRNTWLYQALREGTRV
: :.: ::::..:: . :: : : :.. .:. : :. : :. ....:
CCDS90 RAGTGVDNVDLEAATRKGILVMNTPNGNSLSAAELTCGMIMCLARQIPQATASMKDG---
80 90 100 110 120 130
170 180 190 200 210 220
pF1KB3 QSVEQIREVASGAARIRGETLGLIGFGRTGQAVAVRAKAFGFSVIFYDPYLQDGIERSLG
. :. . ... .. :.:::..:.:: :. ::.: ..::...: ::: .. . :.:
CCDS90 -KWERKKFMGT---ELNGKTLGILGLGRIGREVATRMQSFGMKTIGYDPIISPEVSASFG
140 150 160 170 180
230 240 250 260 270 280
pF1KB3 VQRVYTLQDLLYQSDCVSLHCNLNEHNHHLINDFTIKQMRQGAFLVNAARGGLVDEKALA
::.. :... : ...: : . :.:: :. : ..:. .:: ::::.::: ::
CCDS90 VQQL-PLEEIWPLCDFITVHTPLLPSTTGLLNDNTFAQCKKGVRVVNCARGGIVDEGALL
190 200 210 220 230 240
290 300 310 320 330 340
pF1KB3 QALKEGRIRGAALDVHESEPFSFAQGPLKDAPNLICTPHTAWYSEQASLEMREAAATEIR
.::. :. :::::: :: . : : :.: :: . ...:. . : :...
CCDS90 RALQSGQCAGAALDVFTEEPPR--DRALVDHENVISCPHLGASTKEAQSRCGEEIAVQFV
250 260 270 280 290 300
350 360 370 380 390
pF1KB3 RAITGRIPESLRNCVNKEFFVT-----SAPWSVIDQQAIHPELNGATYRYPPGIVGVAPG
. :. :: . :: . ... . :: : : : : : . :
CCDS90 DMVKGK---SLTGVVNAQALTSAFSPHTKPW--IGLAEALGTLMRAWAGSPKGTIQVITQ
310 320 330 340 350
400 410 420 430 440
pF1KB3 GLPAAMEGIIPGGIPVTHNLPTVAHPSQAPSPNQPTKHGDNREHPNEQ
:
CCDS90 GTSLKNAGNCLSPAVIVGLLKEASKQADVNLVNAKLLVKEAGLNVTTSHSPAAPGEQGFG
360 370 380 390 400 410
>>CCDS6609.1 GRHPR gene_id:9380|Hs108|chr9 (328 aa)
initn: 284 init1: 235 opt: 314 Z-score: 327.9 bits: 69.4 E(32554): 6.1e-12
Smith-Waterman score: 314; 27.8% identity (55.9% similar) in 313 aa overlap (54-354:23-327)
30 40 50 60 70 80
pF1KB3 QIMNGPLHPRPLVALLDGRDCTVEMPILKDLATVAFCDAQ---STQEIHEKVLNEAVGAM
:: .: :... : . : : :...: :
CCDS66 MRPVRLMKVFVTRRIPAEGRVALARAADCEVEQWDSDEPIPAKELERGV-AG
10 20 30 40 50
90 100 110 120 130
pF1KB3 MYHTITLTREDLEK--FKA----LRVIVRIGSGYDNVDIKAAGELGIAVCNIPSAAVEET
. . : . ..: . : :.:: .. : :.. . . :: : :.. .. :
CCDS66 AHGLLCLLSDHVDKRILDAAGANLKVISTMSVGIDHLALDEIKKRGIRVGYTPDVLTDTT
60 70 80 90 100 110
140 150 160 170 180 190
pF1KB3 ADSTICHILNLYRRNTWLYQALREGTRVQSVEQIREVASGAARIRGETLGLIGFGRTGQA
:. .. .:. :: . ...: . : . . . : . :.:.::.:: :::
CCDS66 AELAVSLLLTTCRRLPEAIEEVKNGGWT-SWKPLWLCGYG---LTQSTVGIIGLGRIGQA
120 130 140 150 160
200 210 220 230 240 250
pF1KB3 VAVRAKAFGFSVIFYDPYLQDGIERSLGVQRVY-TLQDLLYQSDCVSLHCNLNEHNHHLI
.: : : :: . ..: : :.. : . . .: ::: . . :.:. .. :
CCDS66 IARRLKPFGVQRFLYTGR-QPRPEEAAEFQAEFVSTPELAAQSDFIVVACSLTPATEGLC
170 180 190 200 210 220
260 270 280 290 300 310
pF1KB3 N-DFTIKQMRQGAFLVNAARGGLVDEKALAQALKEGRIRGAALDVHESEPFSFAQGPLKD
: :: ...:.. : ..: .:: .:.. : ::: :.: .:.::: ::. .. ::
CCDS66 NKDF-FQKMKETAVFINISRGDVVNQDDLYQALASGKIAAAGLDVTSPEPLP-TNHPLLT
230 240 250 260 270 280
320 330 340 350 360 370
pF1KB3 APNLICTPHTAWYSEQASLEMREAAATEIRRAITGR-IPESLRNCVNKEFFVTSAPWSVI
: . :: . .... : ::... .. :. .: :.
CCDS66 LKNCVILPHIGSATHRTRNTMSLLAANNLLAGLRGEPMPSELKL
290 300 310 320
380 390 400 410 420 430
pF1KB3 DQQAIHPELNGATYRYPPGIVGVAPGGLPAAMEGIIPGGIPVTHNLPTVAHPSQAPSPNQ
445 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 02:14:51 2016 done: Fri Nov 4 02:14:52 2016
Total Scan time: 2.270 Total Display time: 0.010
Function used was FASTA [36.3.4 Apr, 2011]