FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA0575, 947 aa 1>>>pF1KA0575 947 - 947 aa - 947 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 10.0889+/-0.00127; mu= 0.4706+/- 0.076 mean_var=251.9336+/-50.244, 0's: 0 Z-trim(110.4): 5 B-trim: 0 in 0/51 Lambda= 0.080804 statistics sampled from 11576 (11578) to 11576 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.698), E-opt: 0.2 (0.356), width: 16 Scan time: 5.040 The best scores are: opt bits E(32554) CCDS42655.1 GREB1 gene_id:9687|Hs108|chr2 (1949) 6425 763.2 0 CCDS45836.1 GREB1L gene_id:80000|Hs108|chr18 (1923) 3141 380.3 1.9e-104 >>CCDS42655.1 GREB1 gene_id:9687|Hs108|chr2 (1949 aa) initn: 6425 init1: 6425 opt: 6425 Z-score: 4057.5 bits: 763.2 E(32554): 0 Smith-Waterman score: 6425; 100.0% identity (100.0% similar) in 947 aa overlap (1-947:1003-1949) 10 20 30 pF1KA0 MWQKIEDVEWRPQTYLELEGLPCILIFSGM :::::::::::::::::::::::::::::: CCDS42 RLALEEHFEIILGSPSSGVTVGKHFVKQLRMWQKIEDVEWRPQTYLELEGLPCILIFSGM 980 990 1000 1010 1020 1030 40 50 60 70 80 90 pF1KA0 DPHGESLPRSLRYCDLRLINSSCLVRTALEQELGLAAYFVSNEVPLEKGARNEALESDAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 DPHGESLPRSLRYCDLRLINSSCLVRTALEQELGLAAYFVSNEVPLEKGARNEALESDAE 1040 1050 1060 1070 1080 1090 100 110 120 130 140 150 pF1KA0 KLSSTDNEDEELGTEGSTSEKRSPMKRERSRSHDSASSSLSSKASGSALGGESSAQPTAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 KLSSTDNEDEELGTEGSTSEKRSPMKRERSRSHDSASSSLSSKASGSALGGESSAQPTAL 1100 1110 1120 1130 1140 1150 160 170 180 190 200 210 pF1KA0 PQGEHARSPQPRGPAEEGRAPGEKQRPRASQGPPSAISRHSPGPTPQPDCSLRTGQRSVQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 PQGEHARSPQPRGPAEEGRAPGEKQRPRASQGPPSAISRHSPGPTPQPDCSLRTGQRSVQ 1160 1170 1180 1190 1200 1210 220 230 240 250 260 270 pF1KA0 VSVTSSCSQLSSSSGSSSSSVAPAAGTWVLQASQCSLTKACRQPPIVFLPKLVYDMVVST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 VSVTSSCSQLSSSSGSSSSSVAPAAGTWVLQASQCSLTKACRQPPIVFLPKLVYDMVVST 1220 1230 1240 1250 1260 1270 280 290 300 310 320 330 pF1KA0 DSSGLPKAASLLPSPSVMWASSFRPLLSKTMTSTEQSLYYRQWTVPRPSHMDYGNRAEGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 DSSGLPKAASLLPSPSVMWASSFRPLLSKTMTSTEQSLYYRQWTVPRPSHMDYGNRAEGR 1280 1290 1300 1310 1320 1330 340 350 360 370 380 390 pF1KA0 VDGFHPRRLLLSGPPQIGKTGAYLQFLSVLSRMLVRLTEVDVYDEEEININLREESDWHY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 VDGFHPRRLLLSGPPQIGKTGAYLQFLSVLSRMLVRLTEVDVYDEEEININLREESDWHY 1340 1350 1360 1370 1380 1390 400 410 420 430 440 450 pF1KA0 LQLSDPWPDLELFKKLPFDYIIHDPKYEDASLICSHYQGIKSEDRGMSRKPEDLYVRRQT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 LQLSDPWPDLELFKKLPFDYIIHDPKYEDASLICSHYQGIKSEDRGMSRKPEDLYVRRQT 1400 1410 1420 1430 1440 1450 460 470 480 490 500 510 pF1KA0 ARMRLSKYAAYNTYHHCEQCHQYMGFHPRYQLYESTLHAFAFSYSMLGEEIQLHFIIPKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 ARMRLSKYAAYNTYHHCEQCHQYMGFHPRYQLYESTLHAFAFSYSMLGEEIQLHFIIPKS 1460 1470 1480 1490 1500 1510 520 530 540 550 560 570 pF1KA0 KEHHFVFSQPGGQLESMRLPLVTDKSHEYIKSPTFTPTTGRHEHGLFNLYHAMDGASHLH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 KEHHFVFSQPGGQLESMRLPLVTDKSHEYIKSPTFTPTTGRHEHGLFNLYHAMDGASHLH 1520 1530 1540 1550 1560 1570 580 590 600 610 620 630 pF1KA0 VLVVKEYEMAIYKKYWPNHIMLVLPSIFNSAGVGAAHFLIKELSYHNLELERNRQEELGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 VLVVKEYEMAIYKKYWPNHIMLVLPSIFNSAGVGAAHFLIKELSYHNLELERNRQEELGI 1580 1590 1600 1610 1620 1630 640 650 660 670 680 690 pF1KA0 KPQDIWPFIVISDDSCVMWNVVDVNSAGERSREFSWSERNVSLKHIMQHIEAAPDIMHYA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 KPQDIWPFIVISDDSCVMWNVVDVNSAGERSREFSWSERNVSLKHIMQHIEAAPDIMHYA 1640 1650 1660 1670 1680 1690 700 710 720 730 740 750 pF1KA0 LLGLRKWSSKTRASEVQEPFSRCHVHNFIILNVDLTQNVQYNQNRFLCDDVDFNLRVHSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 LLGLRKWSSKTRASEVQEPFSRCHVHNFIILNVDLTQNVQYNQNRFLCDDVDFNLRVHSA 1700 1710 1720 1730 1740 1750 760 770 780 790 800 810 pF1KA0 GLLLCRFNRFSVMKKQIVVGGHRSFHITSKVSDNSAAVVPAQYICAPDSKHTFLAAPAQL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 GLLLCRFNRFSVMKKQIVVGGHRSFHITSKVSDNSAAVVPAQYICAPDSKHTFLAAPAQL 1760 1770 1780 1790 1800 1810 820 830 840 850 860 870 pF1KA0 LLEKFLQHHSHLFFPLSLKNHDHPVLSVDCYLNLGSQISVCYVSSRPHSLNISCSDLLFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 LLEKFLQHHSHLFFPLSLKNHDHPVLSVDCYLNLGSQISVCYVSSRPHSLNISCSDLLFS 1820 1830 1840 1850 1860 1870 880 890 900 910 920 930 pF1KA0 GLLLYLCDSFVGASFLKKFHFLKGATLCVICQDRSSLRQTVVRLELEDEWQFRLRDEFQT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 GLLLYLCDSFVGASFLKKFHFLKGATLCVICQDRSSLRQTVVRLELEDEWQFRLRDEFQT 1880 1890 1900 1910 1920 1930 940 pF1KA0 ANAREDRPLFFLTGRHI ::::::::::::::::: CCDS42 ANAREDRPLFFLTGRHI 1940 >>CCDS45836.1 GREB1L gene_id:80000|Hs108|chr18 (1923 aa) initn: 3082 init1: 1750 opt: 3141 Z-score: 1988.6 bits: 380.3 E(32554): 1.9e-104 Smith-Waterman score: 3447; 56.1% identity (77.3% similar) in 953 aa overlap (2-947:1012-1923) 10 20 30 pF1KA0 MWQKIEDVEWRPQTYLELEGLPCILIFSGMD :. : :: :.:: .:.:::::.:..: : CCDS45 LGLQYRFEIILGNPATELSVATHFVARLKSWRGNEPEEWIPRTYQDLDGLPCIVILTGKD 990 1000 1010 1020 1030 1040 40 50 60 70 80 90 pF1KA0 PHGESLPRSLRYCDLRLINSSCLVRTALEQELGLAAYFVSNEVPLEKGARNEALESDAEK : ::..::::.:::::::.:: :.:::::::.::: .::.:: :. .. : CCDS45 PLGETFPRSLKYCDLRLIDSSYLTRTALEQEVGLACCYVSKEV-----IRGPTVALD--- 1050 1060 1070 1080 1090 100 110 120 130 140 150 pF1KA0 LSSTDNEDEELGTEGSTSEKRSPMKRERSRSHDSASSSLSSKASGSALGGESSAQPTALP ::. ..: . .:....: ..: .: .:: . .::: . . :.. :: CCDS45 LSGKEQERAAV-SENDSDELLIDLERPQS------NSSAVTGTSGSIMENGVSSSSTADK 1100 1110 1120 1130 1140 160 170 180 190 200 210 pF1KA0 QGEHARSPQPRGPAEEGRAPGEKQRPRASQGPPSAISRHSPGPTPQPDCSLRTGQRSVQV . ... .:. ..:: . : . ::.. .: : : . .:. :. CCDS45 SQKQSLTPSFQSPAT---SLGLDEGVSASSAGAGA------GETLKQECD------SLGP 1150 1160 1170 1180 1190 220 230 240 250 260 270 pF1KA0 SVTSSCSQLSSSSGSSSSSVAPAAGTWVLQASQ-CSLTKACRQPPIVFLPKLVYDMVVST ...:: ..: :::: .: . : : . : .: ::.:.: : .:... : CCDS45 QMASS-----TTSKPSSSSSGPRTLPWPGQPIRGCRGPQAA-LPPVVILSKAAYSLLGSQ 1200 1210 1220 1230 1240 280 290 300 310 320 pF1KA0 DSSGLPKAASLLPSPSVMWASSFRPLLSKTMTSTEQSLYYRQWTVPRPSHMDYGNR---A :. ::...:::: .: :.::.::::.: :.: ::::::::::. : : ::.:. : CCDS45 KSGKLPSSSSLLPHADVAWVSSLRPLLNKDMSSEEQSLYYRQWTLARQHHADYSNQLDPA 1250 1260 1270 1280 1290 1300 330 340 350 360 370 380 pF1KA0 EGRVDGFHPRRLLLSGPPQIGKTGAYLQFLSVLSRMLVRLTEVDVYDEEEININLREESD : . ::::::::.::::.::::.::::: .: :::.:: ::::::::::: . : :. CCDS45 SGTRN-FHPRRLLLTGPPQVGKTGSYLQFLRILFRMLIRLLEVDVYDEEEINTDHNESSE 1310 1320 1330 1340 1350 1360 390 400 410 420 430 440 pF1KA0 WHYLQLSDPWPDLELFKKLPFDYIIHDPKYEDASLICSH-YQGIKSEDRGMSRKPEDLYV . ..::::.: :.:.::: .::::: ::. .. :.:.: :. : CCDS45 VSQSE-GEPWPDIESFSKMPFDVSVHDPKYSLMSLVYTEKLAGVKQEVIKESKVEEPR-- 1370 1380 1390 1400 1410 1420 450 460 470 480 490 500 pF1KA0 RRQTARMRLSKYAAYNTYHHCEQCHQYMGFHPRYQLYESTLHAFAFSYSMLGEEIQLHFI .:.:. . :.:::::::.::::::.::: : :. .::::::.:: ::::::.::.:: CCDS45 KRETVSIMLTKYAAYNTFHHCEQCRQYMDFTSASQMSDSTLHAFTFSSSMLGEEVQLYFI 1430 1440 1450 1460 1470 1480 510 520 530 540 550 560 pF1KA0 IPKSKEHHFVFSQPGGQLESMRLPLVTDKSHEYIKSPTFTPTTGRHEHGLFNLYHAMDGA :::::: :::::. : .:::::::::.::. . .::: :::..:::::::.::.:::.: CCDS45 IPKSKESHFVFSKQGKHLESMRLPLVSDKNLNAVKSPIFTPSSGRHEHGLLNLFHAMEGI 1490 1500 1510 1520 1530 1540 570 580 590 600 610 620 pF1KA0 SHLHVLVVKEYEMAIYKKYWPNHIMLVLPSIFNSAGVGAAHFLIKELSYHNLELERNRQE ::::.:::::::: .:.::::::::::::..::.::::::.::::::::::::::::: : CCDS45 SHLHLLVVKEYEMPLYRKYWPNHIMLVLPGMFNNAGVGAARFLIKELSYHNLELERNRLE 1550 1560 1570 1580 1590 1600 630 640 650 660 670 680 pF1KA0 ELGIKPQDIWPFIVISDDSCVMWNVVDVNSAGERSREFSWSERNVSLKHIMQHIEAAPDI ::::: : .:::::. :::::.::. .:. . . : . : .::::: ..:::::.: : CCDS45 ELGIKRQCVWPFIVMMDDSCVLWNIHSVQEPSSQPMEVGVSSKNVSLKTVLQHIEATPKI 1610 1620 1630 1640 1650 1660 690 700 710 720 730 740 pF1KA0 MHYALLGLRKWSSKTRASEVQEPFSRCHVHNFIILNVDLTQNVQYNQNRFLCDDVDFNLR .:::.::..::::: .. .. ::::::::.::.::.::::::::. ::..:.:.::::: CCDS45 VHYAILGIQKWSSKLTSQSLKAPFSRCHVHDFILLNTDLTQNVQYDFNRYFCEDADFNLR 1670 1680 1690 1700 1710 1720 750 760 770 780 790 800 pF1KA0 VHSAGLLLCRFNRFSVMKKQIVVGGHRSFHITSK--VSDNSAAVVPAQYICAPDSKHTFL ..:.:::.:::: ::.:::.. :::.:.: : : ::.. : ..: ::::::::.::.: CCDS45 TNSSGLLICRFNNFSLMKKHVQVGGQRDFIIKPKIMVSESLAPILPLQYICAPDSEHTLL 1730 1740 1750 1760 1770 1780 810 820 830 840 850 860 pF1KA0 AAPAQLLLEKFLQHHSHLFFPLSLKNHDHPVLSVDCYLNLGSQISVCYVSSRPHSLNISC :::::.:::::::: :. .:: ...: :::..:::::.: ....::.:::::: :..: CCDS45 AAPAQFLLEKFLQHASYKLFPKAIHNFRSPVLAIDCYLNIGPEVAICYISSRPHSSNVNC 1790 1800 1810 1820 1830 1840 870 880 890 900 910 920 pF1KA0 SDLLFSGLLLYLCDSFVGASFLKKFHFLKGATLCVICQDRSSLRQTVVRLELEDEWQFRL ..:::::::::::::::. ::::.::::::::::::::::::::.::::::::::::: CCDS45 EGVFFSGLLLYLCDSFVGAD-LKKFKFLKGATLCVICQDRSSLRQTIVRLELEDEWQFRL 1850 1860 1870 1880 1890 1900 930 940 pF1KA0 RDEFQTANAREDRPLFFLTGRHI ::::::::. .:.::.::::::. CCDS45 RDEFQTANSSDDKPLYFLTGRHV 1910 1920 947 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 09:44:37 2016 done: Thu Nov 3 09:44:38 2016 Total Scan time: 5.040 Total Display time: 0.060 Function used was FASTA [36.3.4 Apr, 2011]