FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2237, 693 aa 1>>>pF1KE2237 693 - 693 aa - 693 aa Library: human.CCDS.faa 18921897 residues in 33420 sequences Statistics: Expectation_n fit: rho(ln(x))= 13.7409+/-0.000989; mu= -19.5033+/- 0.058 mean_var=440.7943+/-93.698, 0's: 0 Z-trim(116.2): 43 B-trim: 192 in 1/52 Lambda= 0.061088 statistics sampled from 16975 (17014) to 16975 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.805), E-opt: 0.2 (0.509), width: 16 Scan time: 2.240 The best scores are: opt bits E(33420) CCDS30875.1 CRTC2 gene_id:200186|Hs109|chr1 ( 693) 4733 431.6 1.9e-120 CCDS45348.1 CRTC3 gene_id:64784|Hs109|chr15 ( 618) 949 98.1 4.2e-20 CCDS32331.1 CRTC3 gene_id:64784|Hs109|chr15 ( 619) 946 97.8 5.1e-20 CCDS42525.1 CRTC1 gene_id:23373|Hs109|chr19 ( 650) 775 82.8 1.8e-15 >>CCDS30875.1 CRTC2 gene_id:200186|Hs109|chr1 (693 aa) initn: 4733 init1: 4733 opt: 4733 Z-score: 2276.1 bits: 431.6 E(33420): 1.9e-120 Smith-Waterman score: 4733; 100.0% identity (100.0% similar) in 693 aa overlap (1-693:1-693) 10 20 30 40 50 60 pF1KE2 MATSGANGPGSATASASNPRKFSEKIALQKQRQAEETAAFEEVMMDIGSTRLQAQKLRLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 MATSGANGPGSATASASNPRKFSEKIALQKQRQAEETAAFEEVMMDIGSTRLQAQKLRLA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 YTRSSHYGGSLPNVNQIGSGLAEFQSPLHSPLDSSRSTRHHGLVERVQRDPRRMVSPLRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 YTRSSHYGGSLPNVNQIGSGLAEFQSPLHSPLDSSRSTRHHGLVERVQRDPRRMVSPLRR 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 YTRHIDSSPYSPAYLSPPPESSWRRTMAWGNFPAEKGQLFRLPSALNRTSSDSALHTSVM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 YTRHIDSSPYSPAYLSPPPESSWRRTMAWGNFPAEKGQLFRLPSALNRTSSDSALHTSVM 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 NPSPQDTYPGPTPPSILPSRRGGILDGEMDPKVPAIEENLLDDKHLLKPWDAKKLSSSSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 NPSPQDTYPGPTPPSILPSRRGGILDGEMDPKVPAIEENLLDDKHLLKPWDAKKLSSSSS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 RPRSCEVPGINIFPSPDQPANVPVLPPAMNTGGSLPDLTNLHFPPPLPTPLDPEETAYPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 RPRSCEVPGINIFPSPDQPANVPVLPPAMNTGGSLPDLTNLHFPPPLPTPLDPEETAYPS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 LSGGNSTSNLTHTMTHLGISRGMGLGPGYDAPGLHSPLSHPSLQSSLSNPNLQASLSSPQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 LSGGNSTSNLTHTMTHLGISRGMGLGPGYDAPGLHSPLSHPSLQSSLSNPNLQASLSSPQ 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 PQLQGSHSHPSLPASSLARHVLPTTSLGHPSLSAPALSSSSSSSSTSSPVLGAPSYPAST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 PQLQGSHSHPSLPASSLARHVLPTTSLGHPSLSAPALSSSSSSSSTSSPVLGAPSYPAST 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 PGASPHHRRVPLSPLSLLAGPADARRSQQQLPKQFSPTMSPTLSSITQGVPLDTSKLSTD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 PGASPHHRRVPLSPLSLLAGPADARRSQQQLPKQFSPTMSPTLSSITQGVPLDTSKLSTD 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 QRLPPYPYSSPSLVLPTQPHTPKSLQQPGLPSQSCSVQSSGGQPPGRQSHYGTPYPPGPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 QRLPPYPYSSPSLVLPTQPHTPKSLQQPGLPSQSCSVQSSGGQPPGRQSHYGTPYPPGPS 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE2 GHGQQSYHRPMSDFNLGNLEQFSMESPSASLVLDPPGFSEGPGFLGGEGPMGGPQDPHTF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 GHGQQSYHRPMSDFNLGNLEQFSMESPSASLVLDPPGFSEGPGFLGGEGPMGGPQDPHTF 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE2 NHQNLTHCSRHGSGPNIILTGDSSPGFSKEIAAALAGVPGFEVSAAGLELGLGLEDELRM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 NHQNLTHCSRHGSGPNIILTGDSSPGFSKEIAAALAGVPGFEVSAAGLELGLGLEDELRM 610 620 630 640 650 660 670 680 690 pF1KE2 EPLGLEGLNMLSDPCALLPDPAVEESFRSDRLQ ::::::::::::::::::::::::::::::::: CCDS30 EPLGLEGLNMLSDPCALLPDPAVEESFRSDRLQ 670 680 690 >>CCDS45348.1 CRTC3 gene_id:64784|Hs109|chr15 (618 aa) initn: 948 init1: 351 opt: 949 Z-score: 474.5 bits: 98.1 E(33420): 4.2e-20 Smith-Waterman score: 1208; 38.8% identity (59.8% similar) in 707 aa overlap (6-692:2-618) 10 20 30 40 50 60 pF1KE2 MATSGANGPGSATASASNPRKFSEKIALQKQRQAEETAAFEEVMMDIGSTRLQAQKLRLA : .:::..: :::::::::::. ::::::: :::..: :. .:.: :::. CCDS45 MAASPGSGSA---NPRKFSEKIALHTQRQAEETRAFEQLMTDLTLSRVQFQKLQQL 10 20 30 40 50 70 80 90 100 110 120 pF1KE2 YTRSSHYGGSLPNVNQIGSGLAEFQSPLHSPLDSSRSTRHHGLVERVQRDPRRMVSPLRR . : :::::::.:. :. .::: .:. :. :.::::::::: .:. :. ::.: CCDS45 RLTQYH-GGSLPNVSQLRSSASEFQPSFHQA-DNVRGTRHHGLVERPSRN--RF-HPLHR 60 70 80 90 100 130 140 150 160 170 pF1KE2 YT-----RHIDSSPYSPAYLSPPPESSW-RRTMAWGNFPAEKGQLFRLPSALNRTSSDSA . :..:.: .. : : : . :: :. : . :: ::: ::::::.:::: CCDS45 RSGDKPGRQFDGSAFGANYSSQPLDESWPRQQPPWKD---EKHPGFRLTSALNRTNSDSA 110 120 130 140 150 160 180 190 200 210 220 pF1KE2 LHTSVMNPSPQDTYPGPTPPSILPSRRGGILDGEMDPKV-------PAIEENLLD-DKHL ::::... .::: : : : :. :. ::: . . : :::::. : : CCDS45 LHTSALSTKPQDPYGGGGQ-SAWPAPYMGFCDGENNGHGEVASFPGPLKEENLLNVPKPL 170 180 190 200 210 220 230 240 250 260 270 280 pF1KE2 LKP-WDAKKLSSSSSRPRSCEVPGINIFPSPDQPANVPVLPPAMNTGGSLPDLTNLHFPP : :..:...: :.:::::.: : : :: : .. . ..:::::::::::::. CCDS45 PKQLWETKEIQSLSGRPRSCDVGGGNAFPHNGQNLGLSPFLGTLNTGGSLPDLTNLHYST 230 240 250 260 270 280 290 300 310 320 330 340 pF1KE2 PLPTPLDPEETAYPSLSGGNSTSNLTHTMTHLGISRGMGLGPGYDAPGLHSPLSHPSLQS :::. :: . . :.: :::..:. .:::::: .. ::.: :.::.:. CCDS45 PLPASLDTTDHHFGSMSVGNSVNNIPAAMTHLGIR---------SSSGLQSSRSNPSIQA 290 300 310 320 330 350 360 370 380 390 400 pF1KE2 SLSNPNLQASLSSPQPQLQGSHSHPSLPASSLARHVLPTTSLGHPSLSAPALSSSSSSSS .:.. :..::.. ::. .:..: :::: .::. : :.. CCDS45 TLNKTVLSSSLNN----------HPQTS--------VPNASALHPSLRLFSLSNPSLSTT 340 350 360 370 410 420 430 440 450 460 pF1KE2 TSSPVLGAPSYPASTPGASPHHRRVPLSPLSLLAGPADARRSQQQLPKQFSPTMSPTLSS . :..:: ..:. :.:::.: :: ...: . .:.: : :: CCDS45 N----LSGPS----------RRRQPPVSPLTLSPGP----EAHQGFSRQLSST-SPL--- 380 390 400 410 470 480 490 500 510 520 pF1KE2 ITQGVPLDTSKLSTDQR--LPPYPYSSPSLVLPTQPH-TPKSLQQPGLPSQSCSVQSSGG .: ::.. ...: : : . . : : :. .:. : :: : CCDS45 ----APYPTSQMVSSDRSQLSFLPTEAQAQVSPPPPYPAPQELTQPLLQ----------- 420 430 440 450 460 530 540 550 560 570 580 pF1KE2 QPPGRQSHYGTPYPPGPSGHGQQSYHRPMSDFNLGNLEQFSMESPSASLVLDPPGFSEGP :: . : .:. . : . :.:::.: . :. . .. .: .. :: CCDS45 QPRA---------PEAPAQQPQAASSLPQSDFQLLPAQGSSLTNFFPDVGFDQQSMRPGP 470 480 490 500 510 590 600 610 620 630 640 pF1KE2 GFLGGEGPM--GGPQDPHTFNHQNLTHCSRHGSGPNIILTGDSSPGFSKEIAAALAGVPG .: . :. : .. . : . : :: :: :: ::: .. :.. .::::.: CCDS45 AF-PQQVPLVQQGSRELQDSFHLRPSPYSNCGSLPNTILP-DSSTSLFKDLNSALAGLP- 520 530 540 550 560 650 660 670 680 690 pF1KE2 FEVSAAGLELGLGLEDELRMEPLGLEGLNMLSDPCALLPDPAVEESFRSDRLQ ::: ... . ::.::..:::.:.::::::: : ::.:::.::.::: CCDS45 -EVSL-NVDTPFPLEEELQIEPLSLDGLNMLSDSSMGLLDPSVEETFRADRL 570 580 590 600 610 >>CCDS32331.1 CRTC3 gene_id:64784|Hs109|chr15 (619 aa) initn: 1025 init1: 351 opt: 946 Z-score: 473.1 bits: 97.8 E(33420): 5.1e-20 Smith-Waterman score: 1217; 38.8% identity (59.8% similar) in 707 aa overlap (6-692:2-619) 10 20 30 40 50 60 pF1KE2 MATSGANGPGSATASASNPRKFSEKIALQKQRQAEETAAFEEVMMDIGSTRLQAQKLRLA : .:::..: :::::::::::. ::::::: :::..: :. .:.: :::. CCDS32 MAASPGSGSA---NPRKFSEKIALHTQRQAEETRAFEQLMTDLTLSRVQFQKLQQL 10 20 30 40 50 70 80 90 100 110 120 pF1KE2 YTRSSHYGGSLPNVNQIGSGLAEFQSPLHSPLDSSRSTRHHGLVERVQRDPRRMVSPLRR . : :::::::.:. :. .::: .:. :. :.::::::::: .:. :. ::.: CCDS32 RLTQYH-GGSLPNVSQLRSSASEFQPSFHQA-DNVRGTRHHGLVERPSRN--RF-HPLHR 60 70 80 90 100 130 140 150 160 170 pF1KE2 YT-----RHIDSSPYSPAYLSPPPESSW-RRTMAWGNFPAEKGQLFRLPSALNRTSSDSA . :..:.: .. : : : . :: :. : . :: ::: ::::::.:::: CCDS32 RSGDKPGRQFDGSAFGANYSSQPLDESWPRQQPPWKD---EKHPGFRLTSALNRTNSDSA 110 120 130 140 150 160 180 190 200 210 220 pF1KE2 LHTSVMNPSPQDTYPGPTPPSILPSRRGGILDGEMDPKV-------PAIEENLLD-DKHL ::::... .::: : : : :. :. ::: . . : :::::. : : CCDS32 LHTSALSTKPQDPYGGGGQ-SAWPAPYMGFCDGENNGHGEVASFPGPLKEENLLNVPKPL 170 180 190 200 210 220 230 240 250 260 270 280 pF1KE2 LKP-WDAKKLSSSSSRPRSCEVPGINIFPSPDQPANVPVLPPAMNTGGSLPDLTNLHFPP : :..:...: :.:::::.: : : :: : .. . ..:::::::::::::. CCDS32 PKQLWETKEIQSLSGRPRSCDVGGGNAFPHNGQNLGLSPFLGTLNTGGSLPDLTNLHYST 230 240 250 260 270 280 290 300 310 320 330 340 pF1KE2 PLPTPLDPEETAYPSLSGGNSTSNLTHTMTHLGISRGMGLGPGYDAPGLHSPLSHPSLQS :::. :: . . :.: :::..:. .:::::: .. ::.: :.::.:. CCDS32 PLPASLDTTDHHFGSMSVGNSVNNIPAAMTHLGIR---------SSSGLQSSRSNPSIQA 290 300 310 320 330 350 360 370 380 390 400 pF1KE2 SLSNPNLQASLSSPQPQLQGSHSHPSLPASSLARHVLPTTSLGHPSLSAPALSSSSSSSS .:.. :..::.. ::. .:..: :::: .::. : :.. CCDS32 TLNKTVLSSSLNN----------HPQTS--------VPNASALHPSLRLFSLSNPSLSTT 340 350 360 370 410 420 430 440 450 460 pF1KE2 TSSPVLGAPSYPASTPGASPHHRRVPLSPLSLLAGPADARRSQQQLPKQFSPTMSPTLSS . :..:: ..:. :.:::.: :: ...: . .:.: : :: CCDS32 N----LSGPS----------RRRQPPVSPLTLSPGP----EAHQGFSRQLSST-SPL--- 380 390 400 410 470 480 490 500 510 520 pF1KE2 ITQGVPLDTSKLSTDQR--LPPYPYSSPSLVLPTQPH-TPKSLQQPGLPSQSCSVQSSGG .: ::.. ...: : : . . : : :. .:. : :: : CCDS32 ----APYPTSQMVSSDRSQLSFLPTEAQAQVSPPPPYPAPQELTQPLLQ----------- 420 430 440 450 460 530 540 550 560 570 580 pF1KE2 QPPGRQSHYGTPYPPGPSGHGQQSYHRPMSDFNLGNLEQFSMESPSASLVLDPPGFSEGP :: . : .:. . : . :.:::.: . :. . .. .: .. :: CCDS32 QPRA---------PEAPAQQPQAASSLPQSDFQLLPAQGSSLTNFFPDVGFDQQSMRPGP 470 480 490 500 510 590 600 610 620 630 640 pF1KE2 GFLGGEGPM--GGPQDPHTFNHQNLTHCSRHGSGPNIILTGDSSPGFSKEIAAALAGVPG .: . :. : .. . : . : :: :: :: ::: .. :.. .::::.: CCDS32 AF-PQQVPLVQQGSRELQDSFHLRPSPYSNCGSLPNTILPEDSSTSLFKDLNSALAGLP- 520 530 540 550 560 650 660 670 680 690 pF1KE2 FEVSAAGLELGLGLEDELRMEPLGLEGLNMLSDPCALLPDPAVEESFRSDRLQ ::: ... . ::.::..:::.:.::::::: : ::.:::.::.::: CCDS32 -EVSL-NVDTPFPLEEELQIEPLSLDGLNMLSDSSMGLLDPSVEETFRADRL 570 580 590 600 610 >>CCDS42525.1 CRTC1 gene_id:23373|Hs109|chr19 (650 aa) initn: 975 init1: 394 opt: 775 Z-score: 391.3 bits: 82.8 E(33420): 1.8e-15 Smith-Waterman score: 1233; 39.4% identity (61.3% similar) in 724 aa overlap (14-692:2-650) 10 20 30 40 50 pF1KE2 MATSGANGPGSATASASNPRKFSEKIALQKQRQAEETAAFEEVMMDIGSTR---LQAQK- :...:::::::::::..:.:::::::::::: :.. :: :: :: CCDS42 MATSNNPRKFSEKIALHNQKQAEETAAFEEVMKDLSLTRAARLQLQKS 10 20 30 40 60 70 80 90 pF1KE2 --LRLAYTRSSHYGGSLPNVNQIGSGLAE--FQ----------------SPLHSP-LDSS :.:. .:...:::::::::::::: . :: .:..: ::.: CCDS42 QYLQLGPSRGQYYGGSLPNVNQIGSGTMDLPFQPSGFLGEALAAAPVSLTPFQSSGLDTS 50 60 70 80 90 100 100 110 120 130 140 pF1KE2 RSTRHHGLVERVQRDPRRMVSPLRR------YTRHIDSSPYSPAYLSPPPESSWRRTMAW :.:::::::.:: :. :. :: :: . :. :: ::. ::::: ..::::: CCDS42 RTTRHHGLVDRVYRERGRLGSPHRRPLSVDKHGRQADSCPYGTMYLSPPADTSWRRT--- 110 120 130 140 150 160 150 160 170 180 190 200 pF1KE2 GNFPAEKGQLFRLPSALNRTSSDSALHTSVMNPSPQDTYPGPTPPSILPSRRGGILDGEM .:::::: :.:.:. ... . . . ..: .: CCDS42 --------------------NSDSALHQSTMTPTQPESFSSGSQD--VHQKRVLLLT--- 170 180 190 200 210 220 230 240 250 260 pF1KE2 DPKVPAIEENLLD-DKHLLKP-WDAKKLSSSSSRPRSCEVPGINIFPSPDQPANVPVLPP ::..::. . ::.: : ::.:: ..:::.:::::::::::: :: .. ..: CCDS42 ---VPGMEETTSEADKNLSKQAWDTKK---TGSRPKSCEVPGINIFPSADQENTTALIPA 210 220 230 240 250 270 280 290 300 310 320 pF1KE2 AMNTGGSLPDLTNLHFPPPLPTPLDPEETAYPSLSGGNSTSNLTHTMTHLGISRGMGLGP . :::::::::::.::: :::::::::: ..:.::...::.::. ..:::::. : : CCDS42 THNTGGSLPDLTNIHFPSPLPTPLDPEEPTFPALSSSSSTGNLAANLTHLGIG---GAGQ 260 270 280 290 300 310 330 340 350 360 370 380 pF1KE2 GYDAPGLHSPLSHPSLQSSLSNPNLQASLSSPQPQLQGSHSHPSL-PASSLARHV-LPTT :...:: :: .:. : :: ::. . :.: :.: : : ... : . . CCDS42 GMSTPG-SSPQHRPAGVSPLS-------LSTEARRQQAS---PTLSPLSPITQAVAMDAL 320 330 340 350 360 390 400 410 420 430 440 pF1KE2 SLGHPSLSAPALSSSSSSSSTSSPVLGAPSYPAST--PGASPHHRRVPLSPLSLLAGPAD :: . .: .....:.. .: : ::: : : . : : : . : :. CCDS42 SL-EQQLPYAFFTQAGSQQPPPQPQPPPPPPPASQQPPPPPPPQAPVRLPPGGPLLPSAS 370 380 390 400 410 450 460 470 480 490 500 pF1KE2 ARRSQQQLPKQFSPTMSPTLSSITQGVPLDTSKLSTDQRLPPYPYSSPSLV-LPTQPHTP :. : : .. :. : ::. :. : . .. : . :.:.: :. .: CCDS42 LTRGPQ--PPPLAVTV-P--SSLPQSPPENPGQPSMGIDIA----SAPALQQYRTSAGSP 420 430 440 450 460 470 510 520 530 540 550 560 pF1KE2 KSLQQPGLPSQSCSVQSSGGQPPGRQSHYGTPYPPGPSGHGQQSYHRPMSDFNLGNLEQF . :.: : .. . : :. : . : :. . : . . :: : . .. .:::: CCDS42 AN-QSPTSPVSNQGF--SPGSSPQHTSTLGSVF--GDAYYEQQMAARQANALS-HQLEQF 480 490 500 510 520 570 580 590 600 610 pF1KE2 SM-ESPSASLVLDPPG----FSEGPGFLGGEGPMGGPQDPHTFNHQNLTHCSRHGSGPNI .: :. .: : :: .:.. ...: : :. : :.: . : :.. ::: CCDS42 NMMENAISSSSLYSPGSTLNYSQA-AMMGLTGSHGSLPD-----SQQLGYAS-HSGIPNI 530 540 550 560 570 620 630 640 650 660 670 pF1KE2 ILT--GDSSPGFSKEIAAALAGVPGFEVSAAGLELGLGLEDELRMEPLGLEGLNMLSDPC ::: :.: :..:::....:::: .. . .. : :::...:: :.::.::.:: CCDS42 ILTVTGESPPSLSKELTSSLAGVGDVSFDSDS-QFPL---DELKIDPLTLDGLHMLNDPD 580 590 600 610 620 630 680 690 pF1KE2 ALLPDPAVEESFRSDRLQ .: :::.:..:: ::: CCDS42 MVLADPATEDTFRMDRL 640 650 693 residues in 1 query sequences 18921897 residues in 33420 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Aug 16 14:42:02 2021 done: Mon Aug 16 14:42:02 2021 Total Scan time: 2.240 Total Display time: 0.080 Function used was FASTA [36.3.4 Apr, 2011]