FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA1442, 540 aa
1>>>pF1KSDA1442 540 - 540 aa - 540 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 9.3791+/-0.000989; mu= 1.9592+/- 0.059
mean_var=264.5488+/-55.044, 0's: 0 Z-trim(113.6): 13 B-trim: 0 in 0/50
Lambda= 0.078854
statistics sampled from 14177 (14188) to 14177 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.761), E-opt: 0.2 (0.436), width: 16
Scan time: 3.760
The best scores are: opt bits E(32554)
CCDS46573.1 EBF4 gene_id:57593|Hs108|chr20 ( 598) 3466 407.6 2.1e-113
CCDS31314.1 EBF3 gene_id:253738|Hs108|chr10 ( 551) 2799 331.7 1.4e-90
CCDS4343.1 EBF1 gene_id:1879|Hs108|chr5 ( 591) 2738 324.8 1.8e-88
CCDS43726.1 EBF2 gene_id:64641|Hs108|chr8 ( 575) 2640 313.6 4e-85
CCDS78081.1 EBF1 gene_id:1879|Hs108|chr5 ( 560) 1707 207.5 3.5e-53
>>CCDS46573.1 EBF4 gene_id:57593|Hs108|chr20 (598 aa)
initn: 3490 init1: 3461 opt: 3466 Z-score: 2149.4 bits: 407.6 E(32554): 2.1e-113
Smith-Waterman score: 3466; 95.2% identity (96.1% similar) in 540 aa overlap (1-539:1-540)
10 20 30 40 50 60
pF1KSD MDALPRSGLNLKEEPLLPAGLGSVRSWMQGAGILDASTAAQSGVGLARAHFEKQPPSNLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 MDALPRSGLNLKEEPLLPAGLGSVRSWMQGAGILDASTAAQSGVGLARAHFEKQPPSNLR
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD KSNFFHFVLAMYDRQGQPVEVERTAFIDFVEKDREPGAEKTNNGIHYRLRLVYNNGLRTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 KSNFFHFVLAMYDRQGQPVEVERTAFIDFVEKDREPGAEKTNNGIHYRLRLVYNNGLRTE
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD QDLYVRLIDSMSKQAIIYEGQDKNPEMCRVLLTHEIMCSRCCDRKSCGNRNETPSDPVII
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 QDLYVRLIDSMSKQAIIYEGQDKNPEMCRVLLTHEIMCSRCCDRKSCGNRNETPSDPVII
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD DRFFLKFFLKCNQNCLKNAGNPRDMRRFQVVVSTTVSVDGHVLAVSDNMFVHNNSKHGRR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 DRFFLKFFLKCNQNCLKNAGNPRDMRRFQVVVSTTVSVDGHVLAVSDNMFVHNNSKHGRR
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD ARRLDPSEAATPCIKAISPGEGWTTGGATVIVIGDNFFDGLQVVFGNVLVWSELITPHAI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 ARRLDPSEAATPCIKAISPGEGWTTGGATVIVIGDNFFDGLQVVFGNVLVWSELITPHAI
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD RVQTPPRHIPGVVEVTLSYKSKQFCKGCPGRFVYTALNEPTIDYGFQRLQKVIPRHPGDP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 RVQTPPRHIPGVVEVTLSYKSKQFCKGCPGRFVYTALNEPTIDYGFQRLQKVIPRHPGDP
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD ERLPKEVLLKRAADLAEALYGVPGSNQELLLKRAADVAEALYSTPRAPGPLAPLAPSHPH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 ERLPKEVLLKRAADLAEALYGVPGSNQELLLKRAADVAEALYSTPRAPGPLAPLAPSHPH
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD SAVVGINAFSSPLAIAVGDATPGPEPGYARSCSSASPRGFAPSPGSQQSGYGGGLGAGLG
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 PAVVGINAFSSPLAIAVGDATPGPEPGYARSCSSASPRGFAPSPGSQQSGYGGGLGAGLG
430 440 450 460 470 480
490 500 510 520 530
pF1KSD GYGAPGVAGLGVPGSPSFLNGSTATSPFA-KERLRPRAAPPKLPTPGLPQSPRRGASRPV
::::::::::::::::::::::::::::: : :: .. :. . . ::
CCDS46 GYGAPGVAGLGVPGSPSFLNGSTATSPFAIMPSSPPLAAASSMSLPAAAPTTSVFSFSPV
490 500 510 520 530 540
540
pF1KSD F
CCDS46 NMISAVKQRSAFAPVLRPPSSPPQACPRAHGEGLPDQSFEDSDKFHSPARGLQGLAYS
550 560 570 580 590
>>CCDS31314.1 EBF3 gene_id:253738|Hs108|chr10 (551 aa)
initn: 2746 init1: 1464 opt: 2799 Z-score: 1739.8 bits: 331.7 E(32554): 1.4e-90
Smith-Waterman score: 2799; 77.2% identity (92.8% similar) in 527 aa overlap (2-520:6-529)
10 20 30 40 50
pF1KSD MDALPRSGLNLKEEPLLPAGLGSVRSWMQGAGILDASTAAQSGVGLARAHFEKQPP
. .::.: ..::::: .:.. :::::. ::..::.:::::::::::::::::::
CCDS31 MFGIQENIPRGGTTMKEEPL-GSGMNPVRSWMHTAGVVDANTAAQSGVGLARAHFEKQPP
10 20 30 40 50
60 70 80 90 100 110
pF1KSD SNLRKSNFFHFVLAMYDRQGQPVEVERTAFIDFVEKDREPGAEKTNNGIHYRLRLVYNNG
::::::::::::::.:::::::::.:::::.:::::..::. :::::::::.:.:.:.::
CCDS31 SNLRKSNFFHFVLALYDRQGQPVEIERTAFVDFVEKEKEPNNEKTNNGIHYKLQLLYSNG
60 70 80 90 100 110
120 130 140 150 160 170
pF1KSD LRTEQDLYVRLIDSMSKQAIIYEGQDKNPEMCRVLLTHEIMCSRCCDRKSCGNRNETPSD
.::::::::::::::.::::.::::::::::::::::::::::::::.::::::::::::
CCDS31 VRTEQDLYVRLIDSMTKQAIVYEGQDKNPEMCRVLLTHEIMCSRCCDKKSCGNRNETPSD
120 130 140 150 160 170
180 190 200 210 220 230
pF1KSD PVIIDRFFLKFFLKCNQNCLKNAGNPRDMRRFQVVVSTTVSVDGHVLAVSDNMFVHNNSK
::::::::::::::::::::::::::::::::::::::::.:::::::::::::::::::
CCDS31 PVIIDRFFLKFFLKCNQNCLKNAGNPRDMRRFQVVVSTTVNVDGHVLAVSDNMFVHNNSK
180 190 200 210 220 230
240 250 260 270 280 290
pF1KSD HGRRARRLDPSEAATPCIKAISPGEGWTTGGATVIVIGDNFFDGLQVVFGNVLVWSELIT
::::::::::::: :::::::::.:::::::::::.::::::::::::::..::::::::
CCDS31 HGRRARRLDPSEA-TPCIKAISPSEGWTTGGATVIIIGDNFFDGLQVVFGTMLVWSELIT
240 250 260 270 280 290
300 310 320 330 340 350
pF1KSD PHAIRVQTPPRHIPGVVEVTLSYKSKQFCKGCPGRFVYTALNEPTIDYGFQRLQKVIPRH
::::::::::::::::::::::::::::::: ::::::::::::::::::::::::::::
CCDS31 PHAIRVQTPPRHIPGVVEVTLSYKSKQFCKGAPGRFVYTALNEPTIDYGFQRLQKVIPRH
300 310 320 330 340 350
360 370 380 390 400 410
pF1KSD PGDPERLPKEVLLKRAADLAEALYGVPGSNQELLLKRAADVAEALYSTPRAPGPLAPLAP
:::::::::::::::::::.:::::.: .:::..::::::.::::::.:: . . :.
CCDS31 PGDPERLPKEVLLKRAADLVEALYGMPHNNQEIILKRAADIAEALYSVPRNHNQIPTLGN
360 370 380 390 400 410
420 430 440 450 460 470
pF1KSD SHPHSAVVGINAFSSPLAIAVGDATPGPEP-GYARSCSSASPRGFAPSPGSQQSGYGGGL
. :....:.:.::: ::. :.... . . ::.:. ::.::::..:: :::.:. .
CCDS31 NPAHTGMMGVNSFSSQLAVNVSETSQANDQVGYSRNTSSVSPRGYVPSSTPQQSNYNT-V
420 430 440 450 460 470
480 490 500 510 520
pF1KSD GAGLGGYGAPGVAGLGVPGSPSFLNGSTATSPFA-KER------LRPRAAPPKLPTPGLP
.....:::. ..:.:::::::.:::::.:.::.. :.. .::.:.::
CCDS31 STSMNGYGSGAMASLGVPGSPGFLNGSSANSPYGMKQKSAFAPVVRPQASPPPSCTSANG
480 490 500 510 520 530
530 540
pF1KSD QSPRRGASRPVF
CCDS31 NGLQAMSGLVVPPM
540 550
>>CCDS4343.1 EBF1 gene_id:1879|Hs108|chr5 (591 aa)
initn: 2797 init1: 1468 opt: 2738 Z-score: 1701.8 bits: 324.8 E(32554): 1.8e-88
Smith-Waterman score: 2738; 75.1% identity (91.3% similar) in 531 aa overlap (2-524:6-532)
10 20 30 40 50
pF1KSD MDALPRSGLNLKEEPLLPAGLGSVRSWMQGAGILDASTAAQSGVGLARAHFEKQPP
... ::: ..::::: .:...::.::::::.:::.:::::::::::::::::::
CCDS43 MFGIQESIQRSGSSMKEEPL-GSGMNAVRTWMQGAGVLDANTAAQSGVGLARAHFEKQPP
10 20 30 40 50
60 70 80 90 100 110
pF1KSD SNLRKSNFFHFVLAMYDRQGQPVEVERTAFIDFVEKDREPGAEKTNNGIHYRLRLVYNNG
::::::::::::::.:::::::::.:::::. ::::..: ..:::::::::::.:.:.::
CCDS43 SNLRKSNFFHFVLALYDRQGQPVEIERTAFVGFVEKEKEANSEKTNNGIHYRLQLLYSNG
60 70 80 90 100 110
120 130 140 150 160 170
pF1KSD LRTEQDLYVRLIDSMSKQAIIYEGQDKNPEMCRVLLTHEIMCSRCCDRKSCGNRNETPSD
.:::::.::::::::.::::.::::::::::::::::::::::::::.::::::::::::
CCDS43 IRTEQDFYVRLIDSMTKQAIVYEGQDKNPEMCRVLLTHEIMCSRCCDKKSCGNRNETPSD
120 130 140 150 160 170
180 190 200 210 220 230
pF1KSD PVIIDRFFLKFFLKCNQNCLKNAGNPRDMRRFQVVVSTTVSVDGHVLAVSDNMFVHNNSK
::::::::::::::::::::::::::::::::::::::::.:::::::::::::::::::
CCDS43 PVIIDRFFLKFFLKCNQNCLKNAGNPRDMRRFQVVVSTTVNVDGHVLAVSDNMFVHNNSK
180 190 200 210 220 230
240 250 260 270 280
pF1KSD HGRRARRLDPSEA-------ATPCIKAISPGEGWTTGGATVIVIGDNFFDGLQVVFGNVL
::::::::::::. ::::::::::.:::::::::::.:::::::::::.::..:
CCDS43 HGRRARRLDPSEGTPSYLEHATPCIKAISPSEGWTTGGATVIIIGDNFFDGLQVIFGTML
240 250 260 270 280 290
290 300 310 320 330 340
pF1KSD VWSELITPHAIRVQTPPRHIPGVVEVTLSYKSKQFCKGCPGRFVYTALNEPTIDYGFQRL
:::::::::::::::::::::::::::::::::::::: ::::.::::::::::::::::
CCDS43 VWSELITPHAIRVQTPPRHIPGVVEVTLSYKSKQFCKGTPGRFIYTALNEPTIDYGFQRL
300 310 320 330 340 350
350 360 370 380 390 400
pF1KSD QKVIPRHPGDPERLPKEVLLKRAADLAEALYGVPGSNQELLLKRAADVAEALYSTPRAPG
::::::::::::::::::.:::::::.:::::.: .:::..::::::.::::::.:: .
CCDS43 QKVIPRHPGDPERLPKEVILKRAADLVEALYGMPHNNQEIILKRAADIAEALYSVPRNHN
360 370 380 390 400 410
410 420 430 440 450 460
pF1KSD PLAPLAPSHPHSAVVGINAFSSPLAIAVGDATPGPEPGYARSCSSASPRGFAPSPGSQQS
: :: . :....:.:.::. ::. :..:. . . :..:. ::.::.:..:: ::.
CCDS43 QLPALANTSVHAGMMGVNSFSGQLAVNVSEASQATNQGFTRNSSSVSPHGYVPSTTPQQT
420 430 440 450 460 470
470 480 490 500 510 520
pF1KSD GYGGGLGAGLGGYGAPGVAGLGVPGSPSFLNGSTATSPFAKERLRPR-AAPPKLPTPGLP
.:.. . ....:::. ....:: :::.:::::.:.::.: : :. .::.
CCDS43 NYNS-VTTSMNGYGSAAMSNLG--GSPTFLNGSAANSPYAIVPSSPTMASSTSLPSNCSS
480 490 500 510 520 530
530 540
pF1KSD QSPRRGASRPVF
CCDS43 SSGIFSFSPANMVSAVKQKSAFAPVVRPQTSPPPTCTSTNGNSLQAISGMIVPPM
540 550 560 570 580 590
>>CCDS43726.1 EBF2 gene_id:64641|Hs108|chr8 (575 aa)
initn: 2704 init1: 1389 opt: 2640 Z-score: 1641.8 bits: 313.6 E(32554): 4e-85
Smith-Waterman score: 2640; 71.9% identity (88.1% similar) in 544 aa overlap (2-539:6-545)
10 20 30 40 50
pF1KSD MDALPRSGLNLKEEPLLPAGLGSVRSWMQGAGILDASTAAQSGVGLARAHFEKQPP
:.: : : .:::. : : . :::::....:..::..::::::.:.:::::::::
CCDS43 MFGIQDTLGR-GPTLKEKSL-GAEMDSVRSWVRNVGVVDANVAAQSGVALSRAHFEKQPP
10 20 30 40 50
60 70 80 90 100 110
pF1KSD SNLRKSNFFHFVLAMYDRQGQPVEVERTAFIDFVEKDREPGAEKTNNGIHYRLRLVYNNG
::::::::::::::.:::::::::.:::::.::::.:.: : :::::: ::.:.:.:.::
CCDS43 SNLRKSNFFHFVLALYDRQGQPVEIERTAFVDFVENDKEQGNEKTNNGTHYKLQLLYSNG
60 70 80 90 100 110
120 130 140 150 160 170
pF1KSD LRTEQDLYVRLIDSMSKQAIIYEGQDKNPEMCRVLLTHEIMCSRCCDRKSCGNRNETPSD
.:::::::::::::..:: : ::::.:::::::::::::.::::::..::::::::::::
CCDS43 VRTEQDLYVRLIDSVTKQPIAYEGQNKNPEMCRVLLTHEVMCSRCCEKKSCGNRNETPSD
120 130 140 150 160 170
180 190 200 210 220 230
pF1KSD PVIIDRFFLKFFLKCNQNCLKNAGNPRDMRRFQVVVSTTVSVDGHVLAVSDNMFVHNNSK
:::::::::::::::::::::.:::::::::::::.::::.:::::::::::::::::::
CCDS43 PVIIDRFFLKFFLKCNQNCLKTAGNPRDMRRFQVVLSTTVNVDGHVLAVSDNMFVHNNSK
180 190 200 210 220 230
240 250 260 270 280 290
pF1KSD HGRRARRLDPSEAATPCIKAISPGEGWTTGGATVIVIGDNFFDGLQVVFGNVLVWSELIT
::::::::::::: :::::::::.:::::::: ::.::::::::::::::..::::::::
CCDS43 HGRRARRLDPSEA-TPCIKAISPSEGWTTGGAMVIIIGDNFFDGLQVVFGTMLVWSELIT
240 250 260 270 280 290
300 310 320 330 340 350
pF1KSD PHAIRVQTPPRHIPGVVEVTLSYKSKQFCKGCPGRFVYTALNEPTIDYGFQRLQKVIPRH
::::::::::::::::::::::::::::::: ::::.:::::::::::::::::::::::
CCDS43 PHAIRVQTPPRHIPGVVEVTLSYKSKQFCKGAPGRFIYTALNEPTIDYGFQRLQKVIPRH
300 310 320 330 340 350
360 370 380 390 400 410
pF1KSD PGDPERLPKEVLLKRAADLAEALYGVPGSNQELLLKRAADVAEALYSTPRAPGPLAPLAP
::::::: ::.::::::::.:::::.: .::...::::::.::::::.:: :. : :.
CCDS43 PGDPERLAKEMLLKRAADLVEALYGTPHNNQDIILKRAADIAEALYSVPRNPSQLPALSS
360 370 380 390 400 410
420 430 440 450 460 470
pF1KSD SHPHSAVVGINAFSSPLAIAVGDATPGPEPGYARSCSSASPRGFAPSPGSQQSGYGGGLG
: ::...:::...: :.......: : . :: :. :: ::::.. : :::.:. . .
CCDS43 SPAHSGMMGINSYGSQLGVSISESTQGNNQGYIRNTSSISPRGYSSSSTPQQSNYSTS-S
420 430 440 450 460 470
480 490 500 510 520 530
pF1KSD AGLGGYGAPGVAGLGVPGSPSFLNGSTATSPFAKERLRPRAAPPK----LPTPG--LPQS
...::. .:.:::::::.::::: . ::.. : .. . :: . .:
CCDS43 NSMNGYSNVPMANLGVPGSPGFLNGSPTGSPYGIMSSSPTVGSSSTSSILPFSSSVFPAV
480 490 500 510 520 530
540
pF1KSD PRRGASRPVF
...: ::
CCDS43 KQKSAFAPVIRPQGSPSPACSSGNGNGFRAMTGLVVPPM
540 550 560 570
>>CCDS78081.1 EBF1 gene_id:1879|Hs108|chr5 (560 aa)
initn: 2167 init1: 1153 opt: 1707 Z-score: 1068.3 bits: 207.5 E(32554): 3.5e-53
Smith-Waterman score: 2525; 71.9% identity (88.0% similar) in 524 aa overlap (2-524:6-501)
10 20 30 40 50
pF1KSD MDALPRSGLNLKEEPLLPAGLGSVRSWMQGAGILDASTAAQSGVGLARAHFEKQPP
... ::: ..::::: .:...::.::::::.:::.:::::::::::::::::::
CCDS78 MFGIQESIQRSGSSMKEEPL-GSGMNAVRTWMQGAGVLDANTAAQSGVGLARAHFEKQPP
10 20 30 40 50
60 70 80 90 100 110
pF1KSD SNLRKSNFFHFVLAMYDRQGQPVEVERTAFIDFVEKDREPGAEKTNNGIHYRLRLVYNNG
::::::::::::::.:::::::::.:::::. ::::..: ..:::::::::::.:.:.::
CCDS78 SNLRKSNFFHFVLALYDRQGQPVEIERTAFVGFVEKEKEANSEKTNNGIHYRLQLLYSNG
60 70 80 90 100 110
120 130 140 150 160 170
pF1KSD LRTEQDLYVRLIDSMSKQAIIYEGQDKNPEMCRVLLTHEIMCSRCCDRKSCGNRNETPSD
.:::::.::::::::.::::.:::::::::::::::::::::
CCDS78 IRTEQDFYVRLIDSMTKQAIVYEGQDKNPEMCRVLLTHEIMC------------------
120 130 140 150 160
180 190 200 210 220 230
pF1KSD PVIIDRFFLKFFLKCNQNCLKNAGNPRDMRRFQVVVSTTVSVDGHVLAVSDNMFVHNNSK
:::::::::::::::::::::::::::::::::::.:::::::::::::::::::
CCDS78 -----RFFLKFFLKCNQNCLKNAGNPRDMRRFQVVVSTTVNVDGHVLAVSDNMFVHNNSK
170 180 190 200 210
240 250 260 270 280 290
pF1KSD HGRRARRLDPSEAATPCIKAISPGEGWTTGGATVIVIGDNFFDGLQVVFGNVLVWSELIT
::::::::::::: :::::::::.:::::::::::.:::::::::::.::..::::::::
CCDS78 HGRRARRLDPSEA-TPCIKAISPSEGWTTGGATVIIIGDNFFDGLQVIFGTMLVWSELIT
220 230 240 250 260 270
300 310 320 330 340 350
pF1KSD PHAIRVQTPPRHIPGVVEVTLSYKSKQFCKGCPGRFVYTALNEPTIDYGFQRLQKVIPRH
::::::::::::::::::::::::::::::: ::::.:::::::::::::::::::::::
CCDS78 PHAIRVQTPPRHIPGVVEVTLSYKSKQFCKGTPGRFIYTALNEPTIDYGFQRLQKVIPRH
280 290 300 310 320 330
360 370 380 390 400 410
pF1KSD PGDPERLPKEVLLKRAADLAEALYGVPGSNQELLLKRAADVAEALYSTPRAPGPLAPLAP
:::::::::::.:::::::.:::::.: .:::..::::::.::::::.:: . : ::
CCDS78 PGDPERLPKEVILKRAADLVEALYGMPHNNQEIILKRAADIAEALYSVPRNHNQLPALAN
340 350 360 370 380 390
420 430 440 450 460 470
pF1KSD SHPHSAVVGINAFSSPLAIAVGDATPGPEPGYARSCSSASPRGFAPSPGSQQSGYGGGLG
. :....:.:.::. ::. :..:. . . :..:. ::.::.:..:: ::..:.. .
CCDS78 TSVHAGMMGVNSFSGQLAVNVSEASQATNQGFTRNSSSVSPHGYVPSTTPQQTNYNS-VT
400 410 420 430 440 450
480 490 500 510 520 530
pF1KSD AGLGGYGAPGVAGLGVPGSPSFLNGSTATSPFAKERLRPR-AAPPKLPTPGLPQSPRRGA
....:::. ....:: :::.:::::.:.::.: : :. .::.
CCDS78 TSMNGYGSAAMSNLG--GSPTFLNGSAANSPYAIVPSSPTMASSTSLPSNCSSSSGIFSF
460 470 480 490 500 510
540
pF1KSD SRPVF
CCDS78 SPANMVSAVKQKSAFAPVVRPQTSPPPTCTSTNGNSLQAISGMIVPPM
520 530 540 550 560
540 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 06:19:59 2016 done: Thu Nov 3 06:20:00 2016
Total Scan time: 3.760 Total Display time: 0.050
Function used was FASTA [36.3.4 Apr, 2011]