FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7987, 441 aa 1>>>pF1KB7987 441 - 441 aa - 441 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.3887+/-0.000892; mu= 8.1367+/- 0.054 mean_var=116.2658+/-23.908, 0's: 0 Z-trim(109.6): 13 B-trim: 107 in 1/50 Lambda= 0.118946 statistics sampled from 11017 (11023) to 11017 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.701), E-opt: 0.2 (0.339), width: 16 Scan time: 3.250 The best scores are: opt bits E(32554) CCDS3348.1 CTBP1 gene_id:1487|Hs108|chr4 ( 440) 2922 512.3 3.9e-145 CCDS43203.1 CTBP1 gene_id:1487|Hs108|chr4 ( 429) 2836 497.5 1.1e-140 CCDS7643.1 CTBP2 gene_id:1488|Hs108|chr10 ( 445) 2405 423.6 2e-118 CCDS7644.1 CTBP2 gene_id:1488|Hs108|chr10 ( 985) 2397 422.3 1e-117 CCDS904.1 PHGDH gene_id:26227|Hs108|chr1 ( 533) 484 93.9 4e-19 CCDS6609.1 GRHPR gene_id:9380|Hs108|chr9 ( 328) 318 65.4 9.9e-11 >>CCDS3348.1 CTBP1 gene_id:1487|Hs108|chr4 (440 aa) initn: 2506 init1: 2506 opt: 2922 Z-score: 2719.1 bits: 512.3 E(32554): 3.9e-145 Smith-Waterman score: 2922; 99.8% identity (99.8% similar) in 441 aa overlap (1-441:1-440) 10 20 30 40 50 60 pF1KB7 MGSSHLLNKGLPLGVRPPIMNGPLHPRPLVALLDGRDCTVEMPILKDVATVAFCDAQSTQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MGSSHLLNKGLPLGVRPPIMNGPLHPRPLVALLDGRDCTVEMPILKDVATVAFCDAQSTQ 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 EIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIVRIGSGFDNIDIKSAGDLGIAVCNV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 EIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIVRIGSGFDNIDIKSAGDLGIAVCNV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 PAASVEETADSTLCHILNLYRRATWLHQALREGTRVQSVEQIREVASGAARIRGETLGII :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 PAASVEETADSTLCHILNLYRRATWLHQALREGTRVQSVEQIREVASGAARIRGETLGII 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 GLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALGLQRVSTLQDLLFHSDCVTLHCGLN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 GLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALGLQRVSTLQDLLFHSDCVTLHCGLN 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 EHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALAQALKEGRIRGAALDVHESEPFSFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 EHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALAQALKEGRIRGAALDVHESEPFSFS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 QGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIRRAITGRIPDSLKNCVNKDHLTAAT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 QGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIRRAITGRIPDSLKNCVNKDHLTAAT 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB7 HWASMDPAVVHPELNGAAYSRYPPGVVGVAPTGIPAAVEGIVPSAMSLSHGLPPVAHPPH ::::::::::::::::::: :::::::::::::::::::::::::::::::::::::::: CCDS33 HWASMDPAVVHPELNGAAY-RYPPGVVGVAPTGIPAAVEGIVPSAMSLSHGLPPVAHPPH 370 380 390 400 410 430 440 pF1KB7 APSPGQTVKPEADRDHASDQL ::::::::::::::::::::: CCDS33 APSPGQTVKPEADRDHASDQL 420 430 440 >>CCDS43203.1 CTBP1 gene_id:1487|Hs108|chr4 (429 aa) initn: 2420 init1: 2420 opt: 2836 Z-score: 2639.5 bits: 497.5 E(32554): 1.1e-140 Smith-Waterman score: 2836; 99.8% identity (99.8% similar) in 428 aa overlap (14-441:3-429) 10 20 30 40 50 60 pF1KB7 MGSSHLLNKGLPLGVRPPIMNGPLHPRPLVALLDGRDCTVEMPILKDVATVAFCDAQSTQ ::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 MSGVRPPIMNGPLHPRPLVALLDGRDCTVEMPILKDVATVAFCDAQSTQ 10 20 30 40 70 80 90 100 110 120 pF1KB7 EIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIVRIGSGFDNIDIKSAGDLGIAVCNV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 EIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIVRIGSGFDNIDIKSAGDLGIAVCNV 50 60 70 80 90 100 130 140 150 160 170 180 pF1KB7 PAASVEETADSTLCHILNLYRRATWLHQALREGTRVQSVEQIREVASGAARIRGETLGII :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 PAASVEETADSTLCHILNLYRRATWLHQALREGTRVQSVEQIREVASGAARIRGETLGII 110 120 130 140 150 160 190 200 210 220 230 240 pF1KB7 GLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALGLQRVSTLQDLLFHSDCVTLHCGLN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 GLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALGLQRVSTLQDLLFHSDCVTLHCGLN 170 180 190 200 210 220 250 260 270 280 290 300 pF1KB7 EHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALAQALKEGRIRGAALDVHESEPFSFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 EHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALAQALKEGRIRGAALDVHESEPFSFS 230 240 250 260 270 280 310 320 330 340 350 360 pF1KB7 QGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIRRAITGRIPDSLKNCVNKDHLTAAT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 QGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIRRAITGRIPDSLKNCVNKDHLTAAT 290 300 310 320 330 340 370 380 390 400 410 420 pF1KB7 HWASMDPAVVHPELNGAAYSRYPPGVVGVAPTGIPAAVEGIVPSAMSLSHGLPPVAHPPH ::::::::::::::::::: :::::::::::::::::::::::::::::::::::::::: CCDS43 HWASMDPAVVHPELNGAAY-RYPPGVVGVAPTGIPAAVEGIVPSAMSLSHGLPPVAHPPH 350 360 370 380 390 400 430 440 pF1KB7 APSPGQTVKPEADRDHASDQL ::::::::::::::::::::: CCDS43 APSPGQTVKPEADRDHASDQL 410 420 >>CCDS7643.1 CTBP2 gene_id:1488|Hs108|chr10 (445 aa) initn: 2391 init1: 2140 opt: 2405 Z-score: 2239.5 bits: 423.6 E(32554): 2e-118 Smith-Waterman score: 2405; 80.8% identity (95.3% similar) in 427 aa overlap (14-440:20-445) 10 20 30 40 50 pF1KB7 MGSSHLLNKGLPLGVRPPIMNGPLHPRPLVALLDGRDCTVEMPILKDVATVAFC :.:: :::::::::::::::::::::::::::::.:::::: CCDS76 MALVDKHKVKRQRLDRICEGIRPQIMNGPLHPRPLVALLDGRDCTVEMPILKDLATVAFC 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB7 DAQSTQEIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIVRIGSGFDNIDIKSAGDLG :::::::::::::::::::.:::::::::::::::::::.:::::::.::.:::.::.:: CCDS76 DAQSTQEIHEKVLNEAVGAMMYHTITLTREDLEKFKALRVIVRIGSGYDNVDIKAAGELG 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB7 IAVCNVPAASVEETADSTLCHILNLYRRATWLHQALREGTRVQSVEQIREVASGAARIRG :::::.:.:.::::::::.::::::::: :::.::::::::::::::::::::::::::: CCDS76 IAVCNIPSAAVEETADSTICHILNLYRRNTWLYQALREGTRVQSVEQIREVASGAARIRG 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB7 ETLGIIGLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALGLQRVSTLQDLLFHSDCVT ::::.::.::.:::::.:::::::.:.::::::.::.::.::.::: ::::::..::::. CCDS76 ETLGLIGFGRTGQAVAVRAKAFGFSVIFYDPYLQDGIERSLGVQRVYTLQDLLYQSDCVS 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB7 LHCGLNEHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALAQALKEGRIRGAALDVHES :::.:::::::::::::.:::::::::::.:::::::::::::::::::::::::::::: CCDS76 LHCNLNEHNHHLINDFTIKQMRQGAFLVNAARGGLVDEKALAQALKEGRIRGAALDVHES 250 260 270 280 290 300 300 310 320 330 340 350 pF1KB7 EPFSFSQGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIRRAITGRIPDSLKNCVNKD :::::.:::::::::::::::.::::::::.:::: :: :::::::::::.::.:::::. CCDS76 EPFSFAQGPLKDAPNLICTPHTAWYSEQASLEMREAAATEIRRAITGRIPESLRNCVNKE 310 320 330 340 350 360 360 370 380 390 400 410 pF1KB7 HLTAATHWASMDPAVVHPELNGAAYSRYPPGVVGVAPTGIPAAVEGIVPSAMSLSHGLPP ..... :. .: ..:::::::.: :::::.::::: :.:::.:::.:... ..:.:: CCDS76 FFVTSAPWSVIDQQAIHPELNGATY-RYPPGIVGVAPGGLPAAMEGIIPGGIPVTHNLPT 370 380 390 400 410 420 430 440 pF1KB7 VAHPPHAPSPGQTVKPEADRDHASDQL :::: .::::.: .: .:.: ..: CCDS76 VAHPSQAPSPNQPTKHGDNREHPNEQ 420 430 440 >>CCDS7644.1 CTBP2 gene_id:1488|Hs108|chr10 (985 aa) initn: 2398 init1: 2140 opt: 2397 Z-score: 2226.7 bits: 422.3 E(32554): 1e-117 Smith-Waterman score: 2397; 80.8% identity (95.3% similar) in 426 aa overlap (15-440:561-985) 10 20 30 40 pF1KB7 MGSSHLLNKGLPLGVRPPIMNGPLHPRPLVALLDGRDCTVEMPI .:: :::::::::::::::::::::::::: CCDS76 LHTPHSPYQKVARRTGAPIIVSTMLAPEPSIRPQIMNGPLHPRPLVALLDGRDCTVEMPI 540 550 560 570 580 590 50 60 70 80 90 100 pF1KB7 LKDVATVAFCDAQSTQEIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIVRIGSGFDN :::.:::::::::::::::::::::::::.:::::::::::::::::::.:::::::.:: CCDS76 LKDLATVAFCDAQSTQEIHEKVLNEAVGAMMYHTITLTREDLEKFKALRVIVRIGSGYDN 600 610 620 630 640 650 110 120 130 140 150 160 pF1KB7 IDIKSAGDLGIAVCNVPAASVEETADSTLCHILNLYRRATWLHQALREGTRVQSVEQIRE .:::.::.:::::::.:.:.::::::::.::::::::: :::.::::::::::::::::: CCDS76 VDIKAAGELGIAVCNIPSAAVEETADSTICHILNLYRRNTWLYQALREGTRVQSVEQIRE 660 670 680 690 700 710 170 180 190 200 210 220 pF1KB7 VASGAARIRGETLGIIGLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALGLQRVSTLQ ::::::::::::::.::.::.:::::.:::::::.:.::::::.::.::.::.::: ::: CCDS76 VASGAARIRGETLGLIGFGRTGQAVAVRAKAFGFSVIFYDPYLQDGIERSLGVQRVYTLQ 720 730 740 750 760 770 230 240 250 260 270 280 pF1KB7 DLLFHSDCVTLHCGLNEHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALAQALKEGRI :::..::::.:::.:::::::::::::.:::::::::::.:::::::::::::::::::: CCDS76 DLLYQSDCVSLHCNLNEHNHHLINDFTIKQMRQGAFLVNAARGGLVDEKALAQALKEGRI 780 790 800 810 820 830 290 300 310 320 330 340 pF1KB7 RGAALDVHESEPFSFSQGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIRRAITGRIP :::::::::::::::.:::::::::::::::.::::::::.:::: :: ::::::::::: CCDS76 RGAALDVHESEPFSFAQGPLKDAPNLICTPHTAWYSEQASLEMREAAATEIRRAITGRIP 840 850 860 870 880 890 350 360 370 380 390 400 pF1KB7 DSLKNCVNKDHLTAATHWASMDPAVVHPELNGAAYSRYPPGVVGVAPTGIPAAVEGIVPS .::.:::::. ..... :. .: ..:::::::.: :::::.::::: :.:::.:::.:. CCDS76 ESLRNCVNKEFFVTSAPWSVIDQQAIHPELNGATY-RYPPGIVGVAPGGLPAAMEGIIPG 900 910 920 930 940 410 420 430 440 pF1KB7 AMSLSHGLPPVAHPPHAPSPGQTVKPEADRDHASDQL .. ..:.:: :::: .::::.: .: .:.: ..: CCDS76 GIPVTHNLPTVAHPSQAPSPNQPTKHGDNREHPNEQ 950 960 970 980 >>CCDS904.1 PHGDH gene_id:26227|Hs108|chr1 (533 aa) initn: 302 init1: 169 opt: 484 Z-score: 456.7 bits: 93.9 E(32554): 4e-19 Smith-Waterman score: 484; 31.5% identity (58.5% similar) in 330 aa overlap (67-393:45-360) 40 50 60 70 80 90 pF1KB7 DCTVEMPILKDVATVAFCDAQSTQEIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIV :.. : .. . .: . .. . :... CCDS90 LDPCCRKILQDGGLQVVEKQNLSKEELIAELQDCEGLIVRSATKVTADVINAAEKLQVVG 20 30 40 50 60 70 100 110 120 130 140 150 pF1KB7 RIGSGFDNIDIKSAGDLGIAVCNVPAASVEETADSTLCHILNLYRRATWLHQALREGTRV : :.: ::.:...: :: : :.: .. .:. : :. : :. ....: CCDS90 RAGTGVDNVDLEAATRKGILVMNTPNGNSLSAAELTCGMIMCLARQIPQATASMKDG--- 80 90 100 110 120 130 160 170 180 190 200 210 pF1KB7 QSVEQIREVASGAARIRGETLGIIGLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALG . :. . ... .. :.::::.::::.:. :: : ..::.... ::: .: : ..: CCDS90 -KWERKKFMGT---ELNGKTLGILGLGRIGREVATRMQSFGMKTIGYDPIISPEVSASFG 140 150 160 170 180 220 230 240 250 260 270 pF1KB7 LQRVSTLQDLLFHSDCVTLHCGLNEHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALA .:.. :... : .:.: : . :.:: : : ..:. .:: ::::.::: :: CCDS90 VQQLP-LEEIWPLCDFITVHTPLLPSTTGLLNDNTFAQCKKGVRVVNCARGGIVDEGALL 190 200 210 220 230 240 280 290 300 310 320 330 pF1KB7 QALKEGRIRGAALDVHESEPFSFSQGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIR .::. :. :::::: :: . : : :.: :: . ...:. . :: : .. CCDS90 RALQSGQCAGAALDVFTEEPPR--DRALVDHENVISCPHLGASTKEAQSRCGEEIAVQFV 250 260 270 280 290 300 340 350 360 370 380 390 pF1KB7 RAITGRIPDSLKNCVNKDHLTAATHWASMDPAVVHPELNGA---AYSRYPPGVVGVAPTG . :. :: . :: . ::.: : . : :. :.. : :.. : : CCDS90 DMVKGK---SLTGVVNAQALTSAFS-PHTKPWIGLAEALGTLMRAWAGSPKGTIQVITQG 310 320 330 340 350 360 400 410 420 430 440 pF1KB7 IPAAVEGIVPSAMSLSHGLPPVAHPPHAPSPGQTVKPEADRDHASDQL CCDS90 TSLKNAGNCLSPAVIVGLLKEASKQADVNLVNAKLLVKEAGLNVTTSHSPAAPGEQGFGE 370 380 390 400 410 420 >>CCDS6609.1 GRHPR gene_id:9380|Hs108|chr9 (328 aa) initn: 346 init1: 246 opt: 318 Z-score: 306.1 bits: 65.4 E(32554): 9.9e-11 Smith-Waterman score: 318; 27.7% identity (55.3% similar) in 311 aa overlap (48-348:23-327) 20 30 40 50 60 70 pF1KB7 PIMNGPLHPRPLVALLDGRDCTVEMPILKDVATVAFCDAQ---STQEIHEKVLNEAV--- .: .: :... : . : : :...: CCDS66 MRPVRLMKVFVTRRIPAEGRVALARAADCEVEQWDSDEPIPAKELERGVAGA 10 20 30 40 50 80 90 100 110 120 pF1KB7 -GALMYHTITLTREDLEKFKA-LRIIVRIGSGFDNIDIKSAGDLGIAVCNVPAASVEETA : : . . .. :. : :..: .. :.:.. . :: : .: . .. :: CCDS66 HGLLCLLSDHVDKRILDAAGANLKVISTMSVGIDHLALDEIKKRGIRVGYTPDVLTDTTA 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB7 DSTLCHILNLYRRATWLHQALREGTRVQSVEQIREVASGAARIRGETLGIIGLGRVGQAV . .. .:. :: . ...: . : . . . : . :.:::::::.:::. CCDS66 ELAVSLLLTTCRRLPEAIEEVKNGGWT-SWKPLWLCGYG---LTQSTVGIIGLGRIGQAI 120 130 140 150 160 190 200 210 220 230 240 pF1KB7 ALRAKAFGFNVLFYDPYLSDGVERALGLQRVSTLQDLLFHSDCVTLHCGLNEHNHHLIN- : : : :: . ..: : : . . .: .:: ... :.:. .. : : CCDS66 ARRLKPFGVQRFLYTGRQPRPEEAAEFQAEFVSTPELAAQSDFIVVACSLTPATEGLCNK 170 180 190 200 210 220 250 260 270 280 290 300 pF1KB7 DFTVKQMRQGAFLVNTARGGLVDEKALAQALKEGRIRGAALDVHESEPFSFSQGPLKDAP :: ..:.. : ..: .:: .:.. : ::: :.: .:.::: ::. .. :: CCDS66 DF-FQKMKETAVFINISRGDVVNQDDLYQALASGKIAAAGLDVTSPEPLP-TNHPLLTLK 230 240 250 260 270 280 310 320 330 340 350 360 pF1KB7 NLICTPHAAWYSEQASIEMREEAAREIRRAITGR-IPDSLKNCVNKDHLTAATHWASMDP : . :: . .... : :: .. .. :. .:. :: CCDS66 NCVILPHIGSATHRTRNTMSLLAANNLLAGLRGEPMPSELKL 290 300 310 320 370 380 390 400 410 420 pF1KB7 AVVHPELNGAAYSRYPPGVVGVAPTGIPAAVEGIVPSAMSLSHGLPPVAHPPHAPSPGQT 441 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 14:52:03 2016 done: Sat Nov 5 14:52:04 2016 Total Scan time: 3.250 Total Display time: 0.040 Function used was FASTA [36.3.4 Apr, 2011]