FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB3372, 445 aa 1>>>pF1KB3372 445 - 445 aa - 445 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.8834+/-0.000969; mu= 10.1974+/- 0.058 mean_var=96.9947+/-19.395, 0's: 0 Z-trim(106.8): 20 B-trim: 0 in 0/51 Lambda= 0.130227 statistics sampled from 9169 (9177) to 9169 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.654), E-opt: 0.2 (0.282), width: 16 Scan time: 2.270 The best scores are: opt bits E(32554) CCDS7643.1 CTBP2 gene_id:1488|Hs108|chr10 ( 445) 2973 569.0 3.3e-162 CCDS7644.1 CTBP2 gene_id:1488|Hs108|chr10 ( 985) 2837 543.6 3.3e-154 CCDS43203.1 CTBP1 gene_id:1487|Hs108|chr4 ( 429) 2417 464.5 8.9e-131 CCDS3348.1 CTBP1 gene_id:1487|Hs108|chr4 ( 440) 2417 464.6 9.1e-131 CCDS904.1 PHGDH gene_id:26227|Hs108|chr1 ( 533) 467 98.2 2.1e-20 CCDS6609.1 GRHPR gene_id:9380|Hs108|chr9 ( 328) 314 69.4 6.1e-12 >>CCDS7643.1 CTBP2 gene_id:1488|Hs108|chr10 (445 aa) initn: 2973 init1: 2973 opt: 2973 Z-score: 3025.6 bits: 569.0 E(32554): 3.3e-162 Smith-Waterman score: 2973; 100.0% identity (100.0% similar) in 445 aa overlap (1-445:1-445) 10 20 30 40 50 60 pF1KB3 MALVDKHKVKRQRLDRICEGIRPQIMNGPLHPRPLVALLDGRDCTVEMPILKDLATVAFC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 MALVDKHKVKRQRLDRICEGIRPQIMNGPLHPRPLVALLDGRDCTVEMPILKDLATVAFC 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB3 DAQSTQEIHEKVLNEAVGAMMYHTITLTREDLEKFKALRVIVRIGSGYDNVDIKAAGELG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 DAQSTQEIHEKVLNEAVGAMMYHTITLTREDLEKFKALRVIVRIGSGYDNVDIKAAGELG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB3 IAVCNIPSAAVEETADSTICHILNLYRRNTWLYQALREGTRVQSVEQIREVASGAARIRG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 IAVCNIPSAAVEETADSTICHILNLYRRNTWLYQALREGTRVQSVEQIREVASGAARIRG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB3 ETLGLIGFGRTGQAVAVRAKAFGFSVIFYDPYLQDGIERSLGVQRVYTLQDLLYQSDCVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 ETLGLIGFGRTGQAVAVRAKAFGFSVIFYDPYLQDGIERSLGVQRVYTLQDLLYQSDCVS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB3 LHCNLNEHNHHLINDFTIKQMRQGAFLVNAARGGLVDEKALAQALKEGRIRGAALDVHES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 LHCNLNEHNHHLINDFTIKQMRQGAFLVNAARGGLVDEKALAQALKEGRIRGAALDVHES 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB3 EPFSFAQGPLKDAPNLICTPHTAWYSEQASLEMREAAATEIRRAITGRIPESLRNCVNKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 EPFSFAQGPLKDAPNLICTPHTAWYSEQASLEMREAAATEIRRAITGRIPESLRNCVNKE 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB3 FFVTSAPWSVIDQQAIHPELNGATYRYPPGIVGVAPGGLPAAMEGIIPGGIPVTHNLPTV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 FFVTSAPWSVIDQQAIHPELNGATYRYPPGIVGVAPGGLPAAMEGIIPGGIPVTHNLPTV 370 380 390 400 410 420 430 440 pF1KB3 AHPSQAPSPNQPTKHGDNREHPNEQ ::::::::::::::::::::::::: CCDS76 AHPSQAPSPNQPTKHGDNREHPNEQ 430 440 >>CCDS7644.1 CTBP2 gene_id:1488|Hs108|chr10 (985 aa) initn: 2837 init1: 2837 opt: 2837 Z-score: 2882.0 bits: 543.6 E(32554): 3.3e-154 Smith-Waterman score: 2837; 100.0% identity (100.0% similar) in 425 aa overlap (21-445:561-985) 10 20 30 40 50 pF1KB3 MALVDKHKVKRQRLDRICEGIRPQIMNGPLHPRPLVALLDGRDCTVEMPI :::::::::::::::::::::::::::::: CCDS76 LHTPHSPYQKVARRTGAPIIVSTMLAPEPSIRPQIMNGPLHPRPLVALLDGRDCTVEMPI 540 550 560 570 580 590 60 70 80 90 100 110 pF1KB3 LKDLATVAFCDAQSTQEIHEKVLNEAVGAMMYHTITLTREDLEKFKALRVIVRIGSGYDN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 LKDLATVAFCDAQSTQEIHEKVLNEAVGAMMYHTITLTREDLEKFKALRVIVRIGSGYDN 600 610 620 630 640 650 120 130 140 150 160 170 pF1KB3 VDIKAAGELGIAVCNIPSAAVEETADSTICHILNLYRRNTWLYQALREGTRVQSVEQIRE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 VDIKAAGELGIAVCNIPSAAVEETADSTICHILNLYRRNTWLYQALREGTRVQSVEQIRE 660 670 680 690 700 710 180 190 200 210 220 230 pF1KB3 VASGAARIRGETLGLIGFGRTGQAVAVRAKAFGFSVIFYDPYLQDGIERSLGVQRVYTLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 VASGAARIRGETLGLIGFGRTGQAVAVRAKAFGFSVIFYDPYLQDGIERSLGVQRVYTLQ 720 730 740 750 760 770 240 250 260 270 280 290 pF1KB3 DLLYQSDCVSLHCNLNEHNHHLINDFTIKQMRQGAFLVNAARGGLVDEKALAQALKEGRI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 DLLYQSDCVSLHCNLNEHNHHLINDFTIKQMRQGAFLVNAARGGLVDEKALAQALKEGRI 780 790 800 810 820 830 300 310 320 330 340 350 pF1KB3 RGAALDVHESEPFSFAQGPLKDAPNLICTPHTAWYSEQASLEMREAAATEIRRAITGRIP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 RGAALDVHESEPFSFAQGPLKDAPNLICTPHTAWYSEQASLEMREAAATEIRRAITGRIP 840 850 860 870 880 890 360 370 380 390 400 410 pF1KB3 ESLRNCVNKEFFVTSAPWSVIDQQAIHPELNGATYRYPPGIVGVAPGGLPAAMEGIIPGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 ESLRNCVNKEFFVTSAPWSVIDQQAIHPELNGATYRYPPGIVGVAPGGLPAAMEGIIPGG 900 910 920 930 940 950 420 430 440 pF1KB3 IPVTHNLPTVAHPSQAPSPNQPTKHGDNREHPNEQ ::::::::::::::::::::::::::::::::::: CCDS76 IPVTHNLPTVAHPSQAPSPNQPTKHGDNREHPNEQ 960 970 980 >>CCDS43203.1 CTBP1 gene_id:1487|Hs108|chr4 (429 aa) initn: 2405 init1: 2382 opt: 2417 Z-score: 2461.3 bits: 464.5 E(32554): 8.9e-131 Smith-Waterman score: 2417; 81.0% identity (95.5% similar) in 426 aa overlap (20-445:3-428) 10 20 30 40 50 60 pF1KB3 MALVDKHKVKRQRLDRICEGIRPQIMNGPLHPRPLVALLDGRDCTVEMPILKDLATVAFC :.:: :::::::::::::::::::::::::::::.:::::: CCDS43 MSGVRPPIMNGPLHPRPLVALLDGRDCTVEMPILKDVATVAFC 10 20 30 40 70 80 90 100 110 120 pF1KB3 DAQSTQEIHEKVLNEAVGAMMYHTITLTREDLEKFKALRVIVRIGSGYDNVDIKAAGELG :::::::::::::::::::.:::::::::::::::::::.:::::::.::.:::.::.:: CCDS43 DAQSTQEIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIVRIGSGFDNIDIKSAGDLG 50 60 70 80 90 100 130 140 150 160 170 180 pF1KB3 IAVCNIPSAAVEETADSTICHILNLYRRNTWLYQALREGTRVQSVEQIREVASGAARIRG :::::.:.:.::::::::.::::::::: :::.::::::::::::::::::::::::::: CCDS43 IAVCNVPAASVEETADSTLCHILNLYRRATWLHQALREGTRVQSVEQIREVASGAARIRG 110 120 130 140 150 160 190 200 210 220 230 240 pF1KB3 ETLGLIGFGRTGQAVAVRAKAFGFSVIFYDPYLQDGIERSLGVQRVYTLQDLLYQSDCVS ::::.::.::.:::::.:::::::.:.::::::.::.::.::.::: ::::::..::::. CCDS43 ETLGIIGLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALGLQRVSTLQDLLFHSDCVT 170 180 190 200 210 220 250 260 270 280 290 300 pF1KB3 LHCNLNEHNHHLINDFTIKQMRQGAFLVNAARGGLVDEKALAQALKEGRIRGAALDVHES :::.:::::::::::::.:::::::::::.:::::::::::::::::::::::::::::: CCDS43 LHCGLNEHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALAQALKEGRIRGAALDVHES 230 240 250 260 270 280 310 320 330 340 350 360 pF1KB3 EPFSFAQGPLKDAPNLICTPHTAWYSEQASLEMREAAATEIRRAITGRIPESLRNCVNKE :::::.:::::::::::::::.::::::::.:::: :: :::::::::::.::.:::::. CCDS43 EPFSFSQGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIRRAITGRIPDSLKNCVNKD 290 300 310 320 330 340 370 380 390 400 410 420 pF1KB3 FFVTSAPWSVIDQQAIHPELNGATYRYPPGIVGVAPGGLPAAMEGIIPGGIPVTHNLPTV ..... :. .: ..:::::::.::::::.::::: :.:::.:::.:... ..:.:: : CCDS43 HLTAATHWASMDPAVVHPELNGAAYRYPPGVVGVAPTGIPAAVEGIVPSAMSLSHGLPPV 350 360 370 380 390 400 430 440 pF1KB3 AHPSQAPSPNQPTKHGDNREHPNEQ ::: .::::.: .: .:.: ..: CCDS43 AHPPHAPSPGQTVKPEADRDHASDQL 410 420 >>CCDS3348.1 CTBP1 gene_id:1487|Hs108|chr4 (440 aa) initn: 2405 init1: 2382 opt: 2417 Z-score: 2461.1 bits: 464.6 E(32554): 9.1e-131 Smith-Waterman score: 2417; 81.0% identity (95.5% similar) in 426 aa overlap (20-445:14-439) 10 20 30 40 50 60 pF1KB3 MALVDKHKVKRQRLDRICEGIRPQIMNGPLHPRPLVALLDGRDCTVEMPILKDLATVAFC :.:: :::::::::::::::::::::::::::::.:::::: CCDS33 MGSSHLLNKGLPLGVRPPIMNGPLHPRPLVALLDGRDCTVEMPILKDVATVAFC 10 20 30 40 50 70 80 90 100 110 120 pF1KB3 DAQSTQEIHEKVLNEAVGAMMYHTITLTREDLEKFKALRVIVRIGSGYDNVDIKAAGELG :::::::::::::::::::.:::::::::::::::::::.:::::::.::.:::.::.:: CCDS33 DAQSTQEIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIVRIGSGFDNIDIKSAGDLG 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB3 IAVCNIPSAAVEETADSTICHILNLYRRNTWLYQALREGTRVQSVEQIREVASGAARIRG :::::.:.:.::::::::.::::::::: :::.::::::::::::::::::::::::::: CCDS33 IAVCNVPAASVEETADSTLCHILNLYRRATWLHQALREGTRVQSVEQIREVASGAARIRG 120 130 140 150 160 170 190 200 210 220 230 240 pF1KB3 ETLGLIGFGRTGQAVAVRAKAFGFSVIFYDPYLQDGIERSLGVQRVYTLQDLLYQSDCVS ::::.::.::.:::::.:::::::.:.::::::.::.::.::.::: ::::::..::::. CCDS33 ETLGIIGLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALGLQRVSTLQDLLFHSDCVT 180 190 200 210 220 230 250 260 270 280 290 300 pF1KB3 LHCNLNEHNHHLINDFTIKQMRQGAFLVNAARGGLVDEKALAQALKEGRIRGAALDVHES :::.:::::::::::::.:::::::::::.:::::::::::::::::::::::::::::: CCDS33 LHCGLNEHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALAQALKEGRIRGAALDVHES 240 250 260 270 280 290 310 320 330 340 350 360 pF1KB3 EPFSFAQGPLKDAPNLICTPHTAWYSEQASLEMREAAATEIRRAITGRIPESLRNCVNKE :::::.:::::::::::::::.::::::::.:::: :: :::::::::::.::.:::::. CCDS33 EPFSFSQGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIRRAITGRIPDSLKNCVNKD 300 310 320 330 340 350 370 380 390 400 410 420 pF1KB3 FFVTSAPWSVIDQQAIHPELNGATYRYPPGIVGVAPGGLPAAMEGIIPGGIPVTHNLPTV ..... :. .: ..:::::::.::::::.::::: :.:::.:::.:... ..:.:: : CCDS33 HLTAATHWASMDPAVVHPELNGAAYRYPPGVVGVAPTGIPAAVEGIVPSAMSLSHGLPPV 360 370 380 390 400 410 430 440 pF1KB3 AHPSQAPSPNQPTKHGDNREHPNEQ ::: .::::.: .: .:.: ..: CCDS33 AHPPHAPSPGQTVKPEADRDHASDQL 420 430 440 >>CCDS904.1 PHGDH gene_id:26227|Hs108|chr1 (533 aa) initn: 350 init1: 170 opt: 467 Z-score: 479.8 bits: 98.2 E(32554): 2.1e-20 Smith-Waterman score: 467; 30.8% identity (57.4% similar) in 331 aa overlap (73-398:45-360) 50 60 70 80 90 100 pF1KB3 DCTVEMPILKDLATVAFCDAQSTQEIHEKVLNEAVGAMMYHTITLTREDLEKFKALRVIV :.. : .. . .: . .. . :.:. CCDS90 LDPCCRKILQDGGLQVVEKQNLSKEELIAELQDCEGLIVRSATKVTADVINAAEKLQVVG 20 30 40 50 60 70 110 120 130 140 150 160 pF1KB3 RIGSGYDNVDIKAAGELGIAVCNIPSAAVEETADSTICHILNLYRRNTWLYQALREGTRV : :.: ::::..:: . :: : : :.. .:. : :. : :. ....: CCDS90 RAGTGVDNVDLEAATRKGILVMNTPNGNSLSAAELTCGMIMCLARQIPQATASMKDG--- 80 90 100 110 120 130 170 180 190 200 210 220 pF1KB3 QSVEQIREVASGAARIRGETLGLIGFGRTGQAVAVRAKAFGFSVIFYDPYLQDGIERSLG . :. . ... .. :.:::..:.:: :. ::.: ..::...: ::: .. . :.: CCDS90 -KWERKKFMGT---ELNGKTLGILGLGRIGREVATRMQSFGMKTIGYDPIISPEVSASFG 140 150 160 170 180 230 240 250 260 270 280 pF1KB3 VQRVYTLQDLLYQSDCVSLHCNLNEHNHHLINDFTIKQMRQGAFLVNAARGGLVDEKALA ::.. :... : ...: : . :.:: :. : ..:. .:: ::::.::: :: CCDS90 VQQL-PLEEIWPLCDFITVHTPLLPSTTGLLNDNTFAQCKKGVRVVNCARGGIVDEGALL 190 200 210 220 230 240 290 300 310 320 330 340 pF1KB3 QALKEGRIRGAALDVHESEPFSFAQGPLKDAPNLICTPHTAWYSEQASLEMREAAATEIR .::. :. :::::: :: . : : :.: :: . ...:. . : :... CCDS90 RALQSGQCAGAALDVFTEEPPR--DRALVDHENVISCPHLGASTKEAQSRCGEEIAVQFV 250 260 270 280 290 300 350 360 370 380 390 pF1KB3 RAITGRIPESLRNCVNKEFFVT-----SAPWSVIDQQAIHPELNGATYRYPPGIVGVAPG . :. :: . :: . ... . :: : : : : : . : CCDS90 DMVKGK---SLTGVVNAQALTSAFSPHTKPW--IGLAEALGTLMRAWAGSPKGTIQVITQ 310 320 330 340 350 400 410 420 430 440 pF1KB3 GLPAAMEGIIPGGIPVTHNLPTVAHPSQAPSPNQPTKHGDNREHPNEQ : CCDS90 GTSLKNAGNCLSPAVIVGLLKEASKQADVNLVNAKLLVKEAGLNVTTSHSPAAPGEQGFG 360 370 380 390 400 410 >>CCDS6609.1 GRHPR gene_id:9380|Hs108|chr9 (328 aa) initn: 284 init1: 235 opt: 314 Z-score: 327.9 bits: 69.4 E(32554): 6.1e-12 Smith-Waterman score: 314; 27.8% identity (55.9% similar) in 313 aa overlap (54-354:23-327) 30 40 50 60 70 80 pF1KB3 QIMNGPLHPRPLVALLDGRDCTVEMPILKDLATVAFCDAQ---STQEIHEKVLNEAVGAM :: .: :... : . : : :...: : CCDS66 MRPVRLMKVFVTRRIPAEGRVALARAADCEVEQWDSDEPIPAKELERGV-AG 10 20 30 40 50 90 100 110 120 130 pF1KB3 MYHTITLTREDLEK--FKA----LRVIVRIGSGYDNVDIKAAGELGIAVCNIPSAAVEET . . : . ..: . : :.:: .. : :.. . . :: : :.. .. : CCDS66 AHGLLCLLSDHVDKRILDAAGANLKVISTMSVGIDHLALDEIKKRGIRVGYTPDVLTDTT 60 70 80 90 100 110 140 150 160 170 180 190 pF1KB3 ADSTICHILNLYRRNTWLYQALREGTRVQSVEQIREVASGAARIRGETLGLIGFGRTGQA :. .. .:. :: . ...: . : . . . : . :.:.::.:: ::: CCDS66 AELAVSLLLTTCRRLPEAIEEVKNGGWT-SWKPLWLCGYG---LTQSTVGIIGLGRIGQA 120 130 140 150 160 200 210 220 230 240 250 pF1KB3 VAVRAKAFGFSVIFYDPYLQDGIERSLGVQRVY-TLQDLLYQSDCVSLHCNLNEHNHHLI .: : : :: . ..: : :.. : . . .: ::: . . :.:. .. : CCDS66 IARRLKPFGVQRFLYTGR-QPRPEEAAEFQAEFVSTPELAAQSDFIVVACSLTPATEGLC 170 180 190 200 210 220 260 270 280 290 300 310 pF1KB3 N-DFTIKQMRQGAFLVNAARGGLVDEKALAQALKEGRIRGAALDVHESEPFSFAQGPLKD : :: ...:.. : ..: .:: .:.. : ::: :.: .:.::: ::. .. :: CCDS66 NKDF-FQKMKETAVFINISRGDVVNQDDLYQALASGKIAAAGLDVTSPEPLP-TNHPLLT 230 240 250 260 270 280 320 330 340 350 360 370 pF1KB3 APNLICTPHTAWYSEQASLEMREAAATEIRRAITGR-IPESLRNCVNKEFFVTSAPWSVI : . :: . .... : ::... .. :. .: :. CCDS66 LKNCVILPHIGSATHRTRNTMSLLAANNLLAGLRGEPMPSELKL 290 300 310 320 380 390 400 410 420 430 pF1KB3 DQQAIHPELNGATYRYPPGIVGVAPGGLPAAMEGIIPGGIPVTHNLPTVAHPSQAPSPNQ 445 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 02:14:51 2016 done: Fri Nov 4 02:14:52 2016 Total Scan time: 2.270 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]