FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KA0575, 947 aa
1>>>pF1KA0575 947 - 947 aa - 947 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 10.0889+/-0.00127; mu= 0.4706+/- 0.076
mean_var=251.9336+/-50.244, 0's: 0 Z-trim(110.4): 5 B-trim: 0 in 0/51
Lambda= 0.080804
statistics sampled from 11576 (11578) to 11576 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.698), E-opt: 0.2 (0.356), width: 16
Scan time: 5.040
The best scores are: opt bits E(32554)
CCDS42655.1 GREB1 gene_id:9687|Hs108|chr2 (1949) 6425 763.2 0
CCDS45836.1 GREB1L gene_id:80000|Hs108|chr18 (1923) 3141 380.3 1.9e-104
>>CCDS42655.1 GREB1 gene_id:9687|Hs108|chr2 (1949 aa)
initn: 6425 init1: 6425 opt: 6425 Z-score: 4057.5 bits: 763.2 E(32554): 0
Smith-Waterman score: 6425; 100.0% identity (100.0% similar) in 947 aa overlap (1-947:1003-1949)
10 20 30
pF1KA0 MWQKIEDVEWRPQTYLELEGLPCILIFSGM
::::::::::::::::::::::::::::::
CCDS42 RLALEEHFEIILGSPSSGVTVGKHFVKQLRMWQKIEDVEWRPQTYLELEGLPCILIFSGM
980 990 1000 1010 1020 1030
40 50 60 70 80 90
pF1KA0 DPHGESLPRSLRYCDLRLINSSCLVRTALEQELGLAAYFVSNEVPLEKGARNEALESDAE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 DPHGESLPRSLRYCDLRLINSSCLVRTALEQELGLAAYFVSNEVPLEKGARNEALESDAE
1040 1050 1060 1070 1080 1090
100 110 120 130 140 150
pF1KA0 KLSSTDNEDEELGTEGSTSEKRSPMKRERSRSHDSASSSLSSKASGSALGGESSAQPTAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 KLSSTDNEDEELGTEGSTSEKRSPMKRERSRSHDSASSSLSSKASGSALGGESSAQPTAL
1100 1110 1120 1130 1140 1150
160 170 180 190 200 210
pF1KA0 PQGEHARSPQPRGPAEEGRAPGEKQRPRASQGPPSAISRHSPGPTPQPDCSLRTGQRSVQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 PQGEHARSPQPRGPAEEGRAPGEKQRPRASQGPPSAISRHSPGPTPQPDCSLRTGQRSVQ
1160 1170 1180 1190 1200 1210
220 230 240 250 260 270
pF1KA0 VSVTSSCSQLSSSSGSSSSSVAPAAGTWVLQASQCSLTKACRQPPIVFLPKLVYDMVVST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 VSVTSSCSQLSSSSGSSSSSVAPAAGTWVLQASQCSLTKACRQPPIVFLPKLVYDMVVST
1220 1230 1240 1250 1260 1270
280 290 300 310 320 330
pF1KA0 DSSGLPKAASLLPSPSVMWASSFRPLLSKTMTSTEQSLYYRQWTVPRPSHMDYGNRAEGR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 DSSGLPKAASLLPSPSVMWASSFRPLLSKTMTSTEQSLYYRQWTVPRPSHMDYGNRAEGR
1280 1290 1300 1310 1320 1330
340 350 360 370 380 390
pF1KA0 VDGFHPRRLLLSGPPQIGKTGAYLQFLSVLSRMLVRLTEVDVYDEEEININLREESDWHY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 VDGFHPRRLLLSGPPQIGKTGAYLQFLSVLSRMLVRLTEVDVYDEEEININLREESDWHY
1340 1350 1360 1370 1380 1390
400 410 420 430 440 450
pF1KA0 LQLSDPWPDLELFKKLPFDYIIHDPKYEDASLICSHYQGIKSEDRGMSRKPEDLYVRRQT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 LQLSDPWPDLELFKKLPFDYIIHDPKYEDASLICSHYQGIKSEDRGMSRKPEDLYVRRQT
1400 1410 1420 1430 1440 1450
460 470 480 490 500 510
pF1KA0 ARMRLSKYAAYNTYHHCEQCHQYMGFHPRYQLYESTLHAFAFSYSMLGEEIQLHFIIPKS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 ARMRLSKYAAYNTYHHCEQCHQYMGFHPRYQLYESTLHAFAFSYSMLGEEIQLHFIIPKS
1460 1470 1480 1490 1500 1510
520 530 540 550 560 570
pF1KA0 KEHHFVFSQPGGQLESMRLPLVTDKSHEYIKSPTFTPTTGRHEHGLFNLYHAMDGASHLH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 KEHHFVFSQPGGQLESMRLPLVTDKSHEYIKSPTFTPTTGRHEHGLFNLYHAMDGASHLH
1520 1530 1540 1550 1560 1570
580 590 600 610 620 630
pF1KA0 VLVVKEYEMAIYKKYWPNHIMLVLPSIFNSAGVGAAHFLIKELSYHNLELERNRQEELGI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 VLVVKEYEMAIYKKYWPNHIMLVLPSIFNSAGVGAAHFLIKELSYHNLELERNRQEELGI
1580 1590 1600 1610 1620 1630
640 650 660 670 680 690
pF1KA0 KPQDIWPFIVISDDSCVMWNVVDVNSAGERSREFSWSERNVSLKHIMQHIEAAPDIMHYA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 KPQDIWPFIVISDDSCVMWNVVDVNSAGERSREFSWSERNVSLKHIMQHIEAAPDIMHYA
1640 1650 1660 1670 1680 1690
700 710 720 730 740 750
pF1KA0 LLGLRKWSSKTRASEVQEPFSRCHVHNFIILNVDLTQNVQYNQNRFLCDDVDFNLRVHSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 LLGLRKWSSKTRASEVQEPFSRCHVHNFIILNVDLTQNVQYNQNRFLCDDVDFNLRVHSA
1700 1710 1720 1730 1740 1750
760 770 780 790 800 810
pF1KA0 GLLLCRFNRFSVMKKQIVVGGHRSFHITSKVSDNSAAVVPAQYICAPDSKHTFLAAPAQL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 GLLLCRFNRFSVMKKQIVVGGHRSFHITSKVSDNSAAVVPAQYICAPDSKHTFLAAPAQL
1760 1770 1780 1790 1800 1810
820 830 840 850 860 870
pF1KA0 LLEKFLQHHSHLFFPLSLKNHDHPVLSVDCYLNLGSQISVCYVSSRPHSLNISCSDLLFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 LLEKFLQHHSHLFFPLSLKNHDHPVLSVDCYLNLGSQISVCYVSSRPHSLNISCSDLLFS
1820 1830 1840 1850 1860 1870
880 890 900 910 920 930
pF1KA0 GLLLYLCDSFVGASFLKKFHFLKGATLCVICQDRSSLRQTVVRLELEDEWQFRLRDEFQT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 GLLLYLCDSFVGASFLKKFHFLKGATLCVICQDRSSLRQTVVRLELEDEWQFRLRDEFQT
1880 1890 1900 1910 1920 1930
940
pF1KA0 ANAREDRPLFFLTGRHI
:::::::::::::::::
CCDS42 ANAREDRPLFFLTGRHI
1940
>>CCDS45836.1 GREB1L gene_id:80000|Hs108|chr18 (1923 aa)
initn: 3082 init1: 1750 opt: 3141 Z-score: 1988.6 bits: 380.3 E(32554): 1.9e-104
Smith-Waterman score: 3447; 56.1% identity (77.3% similar) in 953 aa overlap (2-947:1012-1923)
10 20 30
pF1KA0 MWQKIEDVEWRPQTYLELEGLPCILIFSGMD
:. : :: :.:: .:.:::::.:..: :
CCDS45 LGLQYRFEIILGNPATELSVATHFVARLKSWRGNEPEEWIPRTYQDLDGLPCIVILTGKD
990 1000 1010 1020 1030 1040
40 50 60 70 80 90
pF1KA0 PHGESLPRSLRYCDLRLINSSCLVRTALEQELGLAAYFVSNEVPLEKGARNEALESDAEK
: ::..::::.:::::::.:: :.:::::::.::: .::.:: :. .. :
CCDS45 PLGETFPRSLKYCDLRLIDSSYLTRTALEQEVGLACCYVSKEV-----IRGPTVALD---
1050 1060 1070 1080 1090
100 110 120 130 140 150
pF1KA0 LSSTDNEDEELGTEGSTSEKRSPMKRERSRSHDSASSSLSSKASGSALGGESSAQPTALP
::. ..: . .:....: ..: .: .:: . .::: . . :.. ::
CCDS45 LSGKEQERAAV-SENDSDELLIDLERPQS------NSSAVTGTSGSIMENGVSSSSTADK
1100 1110 1120 1130 1140
160 170 180 190 200 210
pF1KA0 QGEHARSPQPRGPAEEGRAPGEKQRPRASQGPPSAISRHSPGPTPQPDCSLRTGQRSVQV
. ... .:. ..:: . : . ::.. .: : : . .:. :.
CCDS45 SQKQSLTPSFQSPAT---SLGLDEGVSASSAGAGA------GETLKQECD------SLGP
1150 1160 1170 1180 1190
220 230 240 250 260 270
pF1KA0 SVTSSCSQLSSSSGSSSSSVAPAAGTWVLQASQ-CSLTKACRQPPIVFLPKLVYDMVVST
...:: ..: :::: .: . : : . : .: ::.:.: : .:... :
CCDS45 QMASS-----TTSKPSSSSSGPRTLPWPGQPIRGCRGPQAA-LPPVVILSKAAYSLLGSQ
1200 1210 1220 1230 1240
280 290 300 310 320
pF1KA0 DSSGLPKAASLLPSPSVMWASSFRPLLSKTMTSTEQSLYYRQWTVPRPSHMDYGNR---A
:. ::...:::: .: :.::.::::.: :.: ::::::::::. : : ::.:. :
CCDS45 KSGKLPSSSSLLPHADVAWVSSLRPLLNKDMSSEEQSLYYRQWTLARQHHADYSNQLDPA
1250 1260 1270 1280 1290 1300
330 340 350 360 370 380
pF1KA0 EGRVDGFHPRRLLLSGPPQIGKTGAYLQFLSVLSRMLVRLTEVDVYDEEEININLREESD
: . ::::::::.::::.::::.::::: .: :::.:: ::::::::::: . : :.
CCDS45 SGTRN-FHPRRLLLTGPPQVGKTGSYLQFLRILFRMLIRLLEVDVYDEEEINTDHNESSE
1310 1320 1330 1340 1350 1360
390 400 410 420 430 440
pF1KA0 WHYLQLSDPWPDLELFKKLPFDYIIHDPKYEDASLICSH-YQGIKSEDRGMSRKPEDLYV
. ..::::.: :.:.::: .::::: ::. .. :.:.: :. :
CCDS45 VSQSE-GEPWPDIESFSKMPFDVSVHDPKYSLMSLVYTEKLAGVKQEVIKESKVEEPR--
1370 1380 1390 1400 1410 1420
450 460 470 480 490 500
pF1KA0 RRQTARMRLSKYAAYNTYHHCEQCHQYMGFHPRYQLYESTLHAFAFSYSMLGEEIQLHFI
.:.:. . :.:::::::.::::::.::: : :. .::::::.:: ::::::.::.::
CCDS45 KRETVSIMLTKYAAYNTFHHCEQCRQYMDFTSASQMSDSTLHAFTFSSSMLGEEVQLYFI
1430 1440 1450 1460 1470 1480
510 520 530 540 550 560
pF1KA0 IPKSKEHHFVFSQPGGQLESMRLPLVTDKSHEYIKSPTFTPTTGRHEHGLFNLYHAMDGA
:::::: :::::. : .:::::::::.::. . .::: :::..:::::::.::.:::.:
CCDS45 IPKSKESHFVFSKQGKHLESMRLPLVSDKNLNAVKSPIFTPSSGRHEHGLLNLFHAMEGI
1490 1500 1510 1520 1530 1540
570 580 590 600 610 620
pF1KA0 SHLHVLVVKEYEMAIYKKYWPNHIMLVLPSIFNSAGVGAAHFLIKELSYHNLELERNRQE
::::.:::::::: .:.::::::::::::..::.::::::.::::::::::::::::: :
CCDS45 SHLHLLVVKEYEMPLYRKYWPNHIMLVLPGMFNNAGVGAARFLIKELSYHNLELERNRLE
1550 1560 1570 1580 1590 1600
630 640 650 660 670 680
pF1KA0 ELGIKPQDIWPFIVISDDSCVMWNVVDVNSAGERSREFSWSERNVSLKHIMQHIEAAPDI
::::: : .:::::. :::::.::. .:. . . : . : .::::: ..:::::.: :
CCDS45 ELGIKRQCVWPFIVMMDDSCVLWNIHSVQEPSSQPMEVGVSSKNVSLKTVLQHIEATPKI
1610 1620 1630 1640 1650 1660
690 700 710 720 730 740
pF1KA0 MHYALLGLRKWSSKTRASEVQEPFSRCHVHNFIILNVDLTQNVQYNQNRFLCDDVDFNLR
.:::.::..::::: .. .. ::::::::.::.::.::::::::. ::..:.:.:::::
CCDS45 VHYAILGIQKWSSKLTSQSLKAPFSRCHVHDFILLNTDLTQNVQYDFNRYFCEDADFNLR
1670 1680 1690 1700 1710 1720
750 760 770 780 790 800
pF1KA0 VHSAGLLLCRFNRFSVMKKQIVVGGHRSFHITSK--VSDNSAAVVPAQYICAPDSKHTFL
..:.:::.:::: ::.:::.. :::.:.: : : ::.. : ..: ::::::::.::.:
CCDS45 TNSSGLLICRFNNFSLMKKHVQVGGQRDFIIKPKIMVSESLAPILPLQYICAPDSEHTLL
1730 1740 1750 1760 1770 1780
810 820 830 840 850 860
pF1KA0 AAPAQLLLEKFLQHHSHLFFPLSLKNHDHPVLSVDCYLNLGSQISVCYVSSRPHSLNISC
:::::.:::::::: :. .:: ...: :::..:::::.: ....::.:::::: :..:
CCDS45 AAPAQFLLEKFLQHASYKLFPKAIHNFRSPVLAIDCYLNIGPEVAICYISSRPHSSNVNC
1790 1800 1810 1820 1830 1840
870 880 890 900 910 920
pF1KA0 SDLLFSGLLLYLCDSFVGASFLKKFHFLKGATLCVICQDRSSLRQTVVRLELEDEWQFRL
..:::::::::::::::. ::::.::::::::::::::::::::.:::::::::::::
CCDS45 EGVFFSGLLLYLCDSFVGAD-LKKFKFLKGATLCVICQDRSSLRQTIVRLELEDEWQFRL
1850 1860 1870 1880 1890 1900
930 940
pF1KA0 RDEFQTANAREDRPLFFLTGRHI
::::::::. .:.::.::::::.
CCDS45 RDEFQTANSSDDKPLYFLTGRHV
1910 1920
947 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 09:44:37 2016 done: Thu Nov 3 09:44:38 2016
Total Scan time: 5.040 Total Display time: 0.060
Function used was FASTA [36.3.4 Apr, 2011]