FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5057, 533 aa 1>>>pF1KB5057 533 - 533 aa - 533 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.9095+/-0.000948; mu= 14.7538+/- 0.056 mean_var=66.3969+/-13.455, 0's: 0 Z-trim(104.9): 21 B-trim: 275 in 1/49 Lambda= 0.157398 statistics sampled from 8149 (8158) to 8149 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.622), E-opt: 0.2 (0.251), width: 16 Scan time: 3.430 The best scores are: opt bits E(32554) CCDS904.1 PHGDH gene_id:26227|Hs108|chr1 ( 533) 3482 799.9 0 CCDS43203.1 CTBP1 gene_id:1487|Hs108|chr4 ( 429) 482 118.6 1.5e-26 CCDS3348.1 CTBP1 gene_id:1487|Hs108|chr4 ( 440) 482 118.6 1.5e-26 CCDS6609.1 GRHPR gene_id:9380|Hs108|chr9 ( 328) 467 115.2 1.2e-25 CCDS7643.1 CTBP2 gene_id:1488|Hs108|chr10 ( 445) 467 115.2 1.6e-25 CCDS7644.1 CTBP2 gene_id:1488|Hs108|chr10 ( 985) 467 115.3 3.4e-25 >>CCDS904.1 PHGDH gene_id:26227|Hs108|chr1 (533 aa) initn: 3482 init1: 3482 opt: 3482 Z-score: 4270.4 bits: 799.9 E(32554): 0 Smith-Waterman score: 3482; 100.0% identity (100.0% similar) in 533 aa overlap (1-533:1-533) 10 20 30 40 50 60 pF1KB5 MAFANLRKVLISDSLDPCCRKILQDGGLQVVEKQNLSKEELIAELQDCEGLIVRSATKVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 MAFANLRKVLISDSLDPCCRKILQDGGLQVVEKQNLSKEELIAELQDCEGLIVRSATKVT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 ADVINAAEKLQVVGRAGTGVDNVDLEAATRKGILVMNTPNGNSLSAAELTCGMIMCLARQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 ADVINAAEKLQVVGRAGTGVDNVDLEAATRKGILVMNTPNGNSLSAAELTCGMIMCLARQ 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 IPQATASMKDGKWERKKFMGTELNGKTLGILGLGRIGREVATRMQSFGMKTIGYDPIISP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 IPQATASMKDGKWERKKFMGTELNGKTLGILGLGRIGREVATRMQSFGMKTIGYDPIISP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 EVSASFGVQQLPLEEIWPLCDFITVHTPLLPSTTGLLNDNTFAQCKKGVRVVNCARGGIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 EVSASFGVQQLPLEEIWPLCDFITVHTPLLPSTTGLLNDNTFAQCKKGVRVVNCARGGIV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 DEGALLRALQSGQCAGAALDVFTEEPPRDRALVDHENVISCPHLGASTKEAQSRCGEEIA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 DEGALLRALQSGQCAGAALDVFTEEPPRDRALVDHENVISCPHLGASTKEAQSRCGEEIA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 VQFVDMVKGKSLTGVVNAQALTSAFSPHTKPWIGLAEALGTLMRAWAGSPKGTIQVITQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 VQFVDMVKGKSLTGVVNAQALTSAFSPHTKPWIGLAEALGTLMRAWAGSPKGTIQVITQG 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 TSLKNAGNCLSPAVIVGLLKEASKQADVNLVNAKLLVKEAGLNVTTSHSPAAPGEQGFGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 TSLKNAGNCLSPAVIVGLLKEASKQADVNLVNAKLLVKEAGLNVTTSHSPAAPGEQGFGE 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB5 CLLAVALAGAPYQAVGLVQGTTPVLQGLNGAVFRPEVPLRRDLPLLLFRTQTSDPAMLPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 CLLAVALAGAPYQAVGLVQGTTPVLQGLNGAVFRPEVPLRRDLPLLLFRTQTSDPAMLPT 430 440 450 460 470 480 490 500 510 520 530 pF1KB5 MIGLLAEAGVRLLSYQTSLVSDGETWHVMGISSLLPSLEAWKQHVTEAFQFHF ::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 MIGLLAEAGVRLLSYQTSLVSDGETWHVMGISSLLPSLEAWKQHVTEAFQFHF 490 500 510 520 530 >>CCDS43203.1 CTBP1 gene_id:1487|Hs108|chr4 (429 aa) initn: 302 init1: 169 opt: 482 Z-score: 590.2 bits: 118.6 E(32554): 1.5e-26 Smith-Waterman score: 482; 31.7% identity (58.3% similar) in 331 aa overlap (45-360:56-381) 20 30 40 50 60 70 pF1KB5 LDPCCRKILQDGGLQVVEKQNLSKEELIAELQDCEGLIVRSATKVTADVINAAEKLQVVG :.. : .. . .: . .. . :... CCDS43 DCTVEMPILKDVATVAFCDAQSTQEIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIV 30 40 50 60 70 80 80 90 100 110 120 130 pF1KB5 RAGTGVDNVDLEAATRKGILVMNTPNGNSLSAAELTCGMIMCLARQIPQATASMKDG--- : :.: ::.:...: :: : :.: .. .:. : :. : :. ....: CCDS43 RIGSGFDNIDIKSAGDLGIAVCNVPAASVEETADSTLCHILNLYRRATWLHQALREGTRV 90 100 110 120 130 140 140 150 160 170 180 pF1KB5 -KWERKKFMGT---ELNGKTLGILGLGRIGREVATRMQSFGMKTIGYDPIISPEVSASFG . :. . ... .. :.::::.::::.:. :: : ..::.... ::: .: : ..: CCDS43 QSVEQIREVASGAARIRGETLGIIGLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALG 150 160 170 180 190 200 190 200 210 220 230 240 pF1KB5 VQQLP-LEEIWPLCDFITVHTPLLPSTTGLLNDNTFAQCKKGVRVVNCARGGIVDEGALL .:.. :... : .:.: : . :.:: : : ..:. .:: ::::.::: :: CCDS43 LQRVSTLQDLLFHSDCVTLHCGLNEHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALA 210 220 230 240 250 260 250 260 270 280 290 300 pF1KB5 RALQSGQCAGAALDVFTEEPPR--DRALVDHENVISCPHLGASTKEAQSRCGEEIAVQFV .::. :. :::::: :: . : : :.: :: . ...:. . :: : .. CCDS43 QALKEGRIRGAALDVHESEPFSFSQGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIR 270 280 290 300 310 320 310 320 330 340 350 pF1KB5 DMVKGK---SLTGVVNAQALTSAFSPHTKPWIGLAEAL--GTLMRAWAGSPKGTIQVITQ . :. :: . :: . ::.: : : .. :. : : : :.. : CCDS43 RAITGRIPDSLKNCVNKDHLTAA--TH---WASMDPAVVHPELNGAAYRYPPGVVGVAPT 330 340 350 360 370 380 360 370 380 390 400 410 pF1KB5 GTSLKNAGNCLSPAVIVGLLKEASKQADVNLVNAKLLVKEAGLNVTTSHSPAAPGEQGFG : CCDS43 GIPAAVEGIVPSAMSLSHGLPPVAHPPHAPSPGQTVKPEADRDHASDQL 390 400 410 420 >>CCDS3348.1 CTBP1 gene_id:1487|Hs108|chr4 (440 aa) initn: 302 init1: 169 opt: 482 Z-score: 590.1 bits: 118.6 E(32554): 1.5e-26 Smith-Waterman score: 482; 31.7% identity (58.3% similar) in 331 aa overlap (45-360:67-392) 20 30 40 50 60 70 pF1KB5 LDPCCRKILQDGGLQVVEKQNLSKEELIAELQDCEGLIVRSATKVTADVINAAEKLQVVG :.. : .. . .: . .. . :... CCDS33 DCTVEMPILKDVATVAFCDAQSTQEIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIV 40 50 60 70 80 90 80 90 100 110 120 130 pF1KB5 RAGTGVDNVDLEAATRKGILVMNTPNGNSLSAAELTCGMIMCLARQIPQATASMKDG--- : :.: ::.:...: :: : :.: .. .:. : :. : :. ....: CCDS33 RIGSGFDNIDIKSAGDLGIAVCNVPAASVEETADSTLCHILNLYRRATWLHQALREGTRV 100 110 120 130 140 150 140 150 160 170 180 pF1KB5 -KWERKKFMGT---ELNGKTLGILGLGRIGREVATRMQSFGMKTIGYDPIISPEVSASFG . :. . ... .. :.::::.::::.:. :: : ..::.... ::: .: : ..: CCDS33 QSVEQIREVASGAARIRGETLGIIGLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALG 160 170 180 190 200 210 190 200 210 220 230 240 pF1KB5 VQQLP-LEEIWPLCDFITVHTPLLPSTTGLLNDNTFAQCKKGVRVVNCARGGIVDEGALL .:.. :... : .:.: : . :.:: : : ..:. .:: ::::.::: :: CCDS33 LQRVSTLQDLLFHSDCVTLHCGLNEHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALA 220 230 240 250 260 270 250 260 270 280 290 300 pF1KB5 RALQSGQCAGAALDVFTEEPPR--DRALVDHENVISCPHLGASTKEAQSRCGEEIAVQFV .::. :. :::::: :: . : : :.: :: . ...:. . :: : .. CCDS33 QALKEGRIRGAALDVHESEPFSFSQGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIR 280 290 300 310 320 330 310 320 330 340 350 pF1KB5 DMVKGK---SLTGVVNAQALTSAFSPHTKPWIGLAEAL--GTLMRAWAGSPKGTIQVITQ . :. :: . :: . ::.: : : .. :. : : : :.. : CCDS33 RAITGRIPDSLKNCVNKDHLTAA--TH---WASMDPAVVHPELNGAAYRYPPGVVGVAPT 340 350 360 370 380 390 360 370 380 390 400 410 pF1KB5 GTSLKNAGNCLSPAVIVGLLKEASKQADVNLVNAKLLVKEAGLNVTTSHSPAAPGEQGFG : CCDS33 GIPAAVEGIVPSAMSLSHGLPPVAHPPHAPSPGQTVKPEADRDHASDQL 400 410 420 430 440 >>CCDS6609.1 GRHPR gene_id:9380|Hs108|chr9 (328 aa) initn: 333 init1: 191 opt: 467 Z-score: 573.8 bits: 115.2 E(32554): 1.2e-25 Smith-Waterman score: 470; 29.2% identity (60.2% similar) in 319 aa overlap (6-312:6-322) 10 20 30 40 50 pF1KB5 MAFANLRKVLISDSLDPCCRKILQDGGLQVVEKQN----LSKEELIAELQDCEGLIVRSA : ::... . : : .. ::. . . .:: . .::. . CCDS66 MRPVRLMKVFVTRRIPAEGRVALARAADCEVEQWDSDEPIPAKELERGVAGAHGLLCLLS 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB5 TKVTADVINAA-EKLQVVGRAGTGVDNVDLEAATRKGILVMNTPNGNSLSAAELTCGMIM .: ...:: .:.:.. ..:.:.. :. ..:: : ::. . ..:::. .... CCDS66 DHVDKRILDAAGANLKVISTMSVGIDHLALDEIKKRGIRVGYTPDVLTDTTAELAVSLLL 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB5 CLARQIPQATASMKDGKWERKKFM---GTELNGKTLGILGLGRIGREVATRMQSFGMKTI :..:.: .:.: : : . : :. .:.::.::::::. .: :.. ::.. . CCDS66 TTCRRLPEAIEEVKNGGWTSWKPLWLCGYGLTQSTVGIIGLGRIGQAIARRLKPFGVQRF 130 140 150 160 170 180 180 190 200 210 220 pF1KB5 ---GYDPIISPEVSASFGVQQLPLEEIWPLCDFITVHTPLLPSTTGLLNDNTFAQCKKGV : .: :: .: : .. . :. :::.: : :.: :: : . : . :. . CCDS66 LYTGRQP--RPEEAAEFQAEFVSTPELAAQSDFIVVACSLTPATEGLCNKDFFQKMKETA 190 200 210 220 230 230 240 250 260 270 280 pF1KB5 RVVNCARGGIVDEGALLRALQSGQCAGAALDVFTEEP-PRDRALVDHENVISCPHLGAST .: .:: .:.. : .:: ::. :.:.::: . :: : .. :. .: . ::.:..: CCDS66 VFINISRGDVVNQDDLYQALASGKIAAAGLDVTSPEPLPTNHPLLTLKNCVILPHIGSAT 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB5 KEAQSRCGEEIAVQFVDMVKGKSLTGVVNAQALTSAFSPHTKPWIGLAEALGTLMRAWAG ..... . : ... ..:. . CCDS66 HRTRNTMSLLAANNLLAGLRGEPMPSELKL 300 310 320 >>CCDS7643.1 CTBP2 gene_id:1488|Hs108|chr10 (445 aa) initn: 350 init1: 170 opt: 467 Z-score: 571.6 bits: 115.2 E(32554): 1.6e-25 Smith-Waterman score: 467; 30.8% identity (57.4% similar) in 331 aa overlap (45-360:73-398) 20 30 40 50 60 70 pF1KB5 LDPCCRKILQDGGLQVVEKQNLSKEELIAELQDCEGLIVRSATKVTADVINAAEKLQVVG :.. : .. . .: . .. . :.:. CCDS76 DCTVEMPILKDLATVAFCDAQSTQEIHEKVLNEAVGAMMYHTITLTREDLEKFKALRVIV 50 60 70 80 90 100 80 90 100 110 120 130 pF1KB5 RAGTGVDNVDLEAATRKGILVMNTPNGNSLSAAELTCGMIMCLARQIPQATASMKDG--- : :.: ::::..:: . :: : : :.. .:. : :. : :. ....: CCDS76 RIGSGYDNVDIKAAGELGIAVCNIPSAAVEETADSTICHILNLYRRNTWLYQALREGTRV 110 120 130 140 150 160 140 150 160 170 180 pF1KB5 -KWERKKFMGT---ELNGKTLGILGLGRIGREVATRMQSFGMKTIGYDPIISPEVSASFG . :. . ... .. :.:::..:.:: :. ::.: ..::...: ::: .. . :.: CCDS76 QSVEQIREVASGAARIRGETLGLIGFGRTGQAVAVRAKAFGFSVIFYDPYLQDGIERSLG 170 180 190 200 210 220 190 200 210 220 230 240 pF1KB5 VQQL-PLEEIWPLCDFITVHTPLLPSTTGLLNDNTFAQCKKGVRVVNCARGGIVDEGALL ::.. :... : ...: : . :.:: :. : ..:. .:: ::::.::: :: CCDS76 VQRVYTLQDLLYQSDCVSLHCNLNEHNHHLINDFTIKQMRQGAFLVNAARGGLVDEKALA 230 240 250 260 270 280 250 260 270 280 290 300 pF1KB5 RALQSGQCAGAALDVFTEEPPR--DRALVDHENVISCPHLGASTKEAQSRCGEEIAVQFV .::. :. :::::: :: . : : :.: :: . ...:. . : :... CCDS76 QALKEGRIRGAALDVHESEPFSFAQGPLKDAPNLICTPHTAWYSEQASLEMREAAATEIR 290 300 310 320 330 340 310 320 330 340 350 pF1KB5 DMVKGK---SLTGVVNAQALTSAFSPHTKPW--IGLAEALGTLMRAWAGSPKGTIQVITQ . :. :: . :: . ... . :: : : : : : . : CCDS76 RAITGRIPESLRNCVNKEFFVT-----SAPWSVIDQQAIHPELNGATYRYPPGIVGVAPG 350 360 370 380 390 360 370 380 390 400 410 pF1KB5 GTSLKNAGNCLSPAVIVGLLKEASKQADVNLVNAKLLVKEAGLNVTTSHSPAAPGEQGFG : CCDS76 GLPAAMEGIIPGGIPVTHNLPTVAHPSQAPSPNQPTKHGDNREHPNEQ 400 410 420 430 440 >>CCDS7644.1 CTBP2 gene_id:1488|Hs108|chr10 (985 aa) initn: 350 init1: 170 opt: 467 Z-score: 565.8 bits: 115.3 E(32554): 3.4e-25 Smith-Waterman score: 467; 30.8% identity (57.4% similar) in 331 aa overlap (45-360:613-938) 20 30 40 50 60 70 pF1KB5 LDPCCRKILQDGGLQVVEKQNLSKEELIAELQDCEGLIVRSATKVTADVINAAEKLQVVG :.. : .. . .: . .. . :.:. CCDS76 DCTVEMPILKDLATVAFCDAQSTQEIHEKVLNEAVGAMMYHTITLTREDLEKFKALRVIV 590 600 610 620 630 640 80 90 100 110 120 130 pF1KB5 RAGTGVDNVDLEAATRKGILVMNTPNGNSLSAAELTCGMIMCLARQIPQATASMKDG--- : :.: ::::..:: . :: : : :.. .:. : :. : :. ....: CCDS76 RIGSGYDNVDIKAAGELGIAVCNIPSAAVEETADSTICHILNLYRRNTWLYQALREGTRV 650 660 670 680 690 700 140 150 160 170 180 pF1KB5 -KWERKKFMGT---ELNGKTLGILGLGRIGREVATRMQSFGMKTIGYDPIISPEVSASFG . :. . ... .. :.:::..:.:: :. ::.: ..::...: ::: .. . :.: CCDS76 QSVEQIREVASGAARIRGETLGLIGFGRTGQAVAVRAKAFGFSVIFYDPYLQDGIERSLG 710 720 730 740 750 760 190 200 210 220 230 240 pF1KB5 VQQL-PLEEIWPLCDFITVHTPLLPSTTGLLNDNTFAQCKKGVRVVNCARGGIVDEGALL ::.. :... : ...: : . :.:: :. : ..:. .:: ::::.::: :: CCDS76 VQRVYTLQDLLYQSDCVSLHCNLNEHNHHLINDFTIKQMRQGAFLVNAARGGLVDEKALA 770 780 790 800 810 820 250 260 270 280 290 300 pF1KB5 RALQSGQCAGAALDVFTEEPPR--DRALVDHENVISCPHLGASTKEAQSRCGEEIAVQFV .::. :. :::::: :: . : : :.: :: . ...:. . : :... CCDS76 QALKEGRIRGAALDVHESEPFSFAQGPLKDAPNLICTPHTAWYSEQASLEMREAAATEIR 830 840 850 860 870 880 310 320 330 340 350 pF1KB5 DMVKGK---SLTGVVNAQALTSAFSPHTKPW--IGLAEALGTLMRAWAGSPKGTIQVITQ . :. :: . :: . ... . :: : : : : : . : CCDS76 RAITGRIPESLRNCVNKEFFVT-----SAPWSVIDQQAIHPELNGATYRYPPGIVGVAPG 890 900 910 920 930 360 370 380 390 400 410 pF1KB5 GTSLKNAGNCLSPAVIVGLLKEASKQADVNLVNAKLLVKEAGLNVTTSHSPAAPGEQGFG : CCDS76 GLPAAMEGIIPGGIPVTHNLPTVAHPSQAPSPNQPTKHGDNREHPNEQ 940 950 960 970 980 533 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 06:17:45 2016 done: Sat Nov 5 06:17:46 2016 Total Scan time: 3.430 Total Display time: 0.050 Function used was FASTA [36.3.4 Apr, 2011]