FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA1442, 540 aa 1>>>pF1KSDA1442 540 - 540 aa - 540 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.3791+/-0.000989; mu= 1.9592+/- 0.059 mean_var=264.5488+/-55.044, 0's: 0 Z-trim(113.6): 13 B-trim: 0 in 0/50 Lambda= 0.078854 statistics sampled from 14177 (14188) to 14177 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.761), E-opt: 0.2 (0.436), width: 16 Scan time: 3.760 The best scores are: opt bits E(32554) CCDS46573.1 EBF4 gene_id:57593|Hs108|chr20 ( 598) 3466 407.6 2.1e-113 CCDS31314.1 EBF3 gene_id:253738|Hs108|chr10 ( 551) 2799 331.7 1.4e-90 CCDS4343.1 EBF1 gene_id:1879|Hs108|chr5 ( 591) 2738 324.8 1.8e-88 CCDS43726.1 EBF2 gene_id:64641|Hs108|chr8 ( 575) 2640 313.6 4e-85 CCDS78081.1 EBF1 gene_id:1879|Hs108|chr5 ( 560) 1707 207.5 3.5e-53 >>CCDS46573.1 EBF4 gene_id:57593|Hs108|chr20 (598 aa) initn: 3490 init1: 3461 opt: 3466 Z-score: 2149.4 bits: 407.6 E(32554): 2.1e-113 Smith-Waterman score: 3466; 95.2% identity (96.1% similar) in 540 aa overlap (1-539:1-540) 10 20 30 40 50 60 pF1KSD MDALPRSGLNLKEEPLLPAGLGSVRSWMQGAGILDASTAAQSGVGLARAHFEKQPPSNLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 MDALPRSGLNLKEEPLLPAGLGSVRSWMQGAGILDASTAAQSGVGLARAHFEKQPPSNLR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD KSNFFHFVLAMYDRQGQPVEVERTAFIDFVEKDREPGAEKTNNGIHYRLRLVYNNGLRTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 KSNFFHFVLAMYDRQGQPVEVERTAFIDFVEKDREPGAEKTNNGIHYRLRLVYNNGLRTE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD QDLYVRLIDSMSKQAIIYEGQDKNPEMCRVLLTHEIMCSRCCDRKSCGNRNETPSDPVII :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 QDLYVRLIDSMSKQAIIYEGQDKNPEMCRVLLTHEIMCSRCCDRKSCGNRNETPSDPVII 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD DRFFLKFFLKCNQNCLKNAGNPRDMRRFQVVVSTTVSVDGHVLAVSDNMFVHNNSKHGRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 DRFFLKFFLKCNQNCLKNAGNPRDMRRFQVVVSTTVSVDGHVLAVSDNMFVHNNSKHGRR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD ARRLDPSEAATPCIKAISPGEGWTTGGATVIVIGDNFFDGLQVVFGNVLVWSELITPHAI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 ARRLDPSEAATPCIKAISPGEGWTTGGATVIVIGDNFFDGLQVVFGNVLVWSELITPHAI 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD RVQTPPRHIPGVVEVTLSYKSKQFCKGCPGRFVYTALNEPTIDYGFQRLQKVIPRHPGDP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 RVQTPPRHIPGVVEVTLSYKSKQFCKGCPGRFVYTALNEPTIDYGFQRLQKVIPRHPGDP 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD ERLPKEVLLKRAADLAEALYGVPGSNQELLLKRAADVAEALYSTPRAPGPLAPLAPSHPH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 ERLPKEVLLKRAADLAEALYGVPGSNQELLLKRAADVAEALYSTPRAPGPLAPLAPSHPH 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD SAVVGINAFSSPLAIAVGDATPGPEPGYARSCSSASPRGFAPSPGSQQSGYGGGLGAGLG ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 PAVVGINAFSSPLAIAVGDATPGPEPGYARSCSSASPRGFAPSPGSQQSGYGGGLGAGLG 430 440 450 460 470 480 490 500 510 520 530 pF1KSD GYGAPGVAGLGVPGSPSFLNGSTATSPFA-KERLRPRAAPPKLPTPGLPQSPRRGASRPV ::::::::::::::::::::::::::::: : :: .. :. . . :: CCDS46 GYGAPGVAGLGVPGSPSFLNGSTATSPFAIMPSSPPLAAASSMSLPAAAPTTSVFSFSPV 490 500 510 520 530 540 540 pF1KSD F CCDS46 NMISAVKQRSAFAPVLRPPSSPPQACPRAHGEGLPDQSFEDSDKFHSPARGLQGLAYS 550 560 570 580 590 >>CCDS31314.1 EBF3 gene_id:253738|Hs108|chr10 (551 aa) initn: 2746 init1: 1464 opt: 2799 Z-score: 1739.8 bits: 331.7 E(32554): 1.4e-90 Smith-Waterman score: 2799; 77.2% identity (92.8% similar) in 527 aa overlap (2-520:6-529) 10 20 30 40 50 pF1KSD MDALPRSGLNLKEEPLLPAGLGSVRSWMQGAGILDASTAAQSGVGLARAHFEKQPP . .::.: ..::::: .:.. :::::. ::..::.::::::::::::::::::: CCDS31 MFGIQENIPRGGTTMKEEPL-GSGMNPVRSWMHTAGVVDANTAAQSGVGLARAHFEKQPP 10 20 30 40 50 60 70 80 90 100 110 pF1KSD SNLRKSNFFHFVLAMYDRQGQPVEVERTAFIDFVEKDREPGAEKTNNGIHYRLRLVYNNG ::::::::::::::.:::::::::.:::::.:::::..::. :::::::::.:.:.:.:: CCDS31 SNLRKSNFFHFVLALYDRQGQPVEIERTAFVDFVEKEKEPNNEKTNNGIHYKLQLLYSNG 60 70 80 90 100 110 120 130 140 150 160 170 pF1KSD LRTEQDLYVRLIDSMSKQAIIYEGQDKNPEMCRVLLTHEIMCSRCCDRKSCGNRNETPSD .::::::::::::::.::::.::::::::::::::::::::::::::.:::::::::::: CCDS31 VRTEQDLYVRLIDSMTKQAIVYEGQDKNPEMCRVLLTHEIMCSRCCDKKSCGNRNETPSD 120 130 140 150 160 170 180 190 200 210 220 230 pF1KSD PVIIDRFFLKFFLKCNQNCLKNAGNPRDMRRFQVVVSTTVSVDGHVLAVSDNMFVHNNSK ::::::::::::::::::::::::::::::::::::::::.::::::::::::::::::: CCDS31 PVIIDRFFLKFFLKCNQNCLKNAGNPRDMRRFQVVVSTTVNVDGHVLAVSDNMFVHNNSK 180 190 200 210 220 230 240 250 260 270 280 290 pF1KSD HGRRARRLDPSEAATPCIKAISPGEGWTTGGATVIVIGDNFFDGLQVVFGNVLVWSELIT ::::::::::::: :::::::::.:::::::::::.::::::::::::::..:::::::: CCDS31 HGRRARRLDPSEA-TPCIKAISPSEGWTTGGATVIIIGDNFFDGLQVVFGTMLVWSELIT 240 250 260 270 280 290 300 310 320 330 340 350 pF1KSD PHAIRVQTPPRHIPGVVEVTLSYKSKQFCKGCPGRFVYTALNEPTIDYGFQRLQKVIPRH ::::::::::::::::::::::::::::::: :::::::::::::::::::::::::::: CCDS31 PHAIRVQTPPRHIPGVVEVTLSYKSKQFCKGAPGRFVYTALNEPTIDYGFQRLQKVIPRH 300 310 320 330 340 350 360 370 380 390 400 410 pF1KSD PGDPERLPKEVLLKRAADLAEALYGVPGSNQELLLKRAADVAEALYSTPRAPGPLAPLAP :::::::::::::::::::.:::::.: .:::..::::::.::::::.:: . . :. CCDS31 PGDPERLPKEVLLKRAADLVEALYGMPHNNQEIILKRAADIAEALYSVPRNHNQIPTLGN 360 370 380 390 400 410 420 430 440 450 460 470 pF1KSD SHPHSAVVGINAFSSPLAIAVGDATPGPEP-GYARSCSSASPRGFAPSPGSQQSGYGGGL . :....:.:.::: ::. :.... . . ::.:. ::.::::..:: :::.:. . CCDS31 NPAHTGMMGVNSFSSQLAVNVSETSQANDQVGYSRNTSSVSPRGYVPSSTPQQSNYNT-V 420 430 440 450 460 470 480 490 500 510 520 pF1KSD GAGLGGYGAPGVAGLGVPGSPSFLNGSTATSPFA-KER------LRPRAAPPKLPTPGLP .....:::. ..:.:::::::.:::::.:.::.. :.. .::.:.:: CCDS31 STSMNGYGSGAMASLGVPGSPGFLNGSSANSPYGMKQKSAFAPVVRPQASPPPSCTSANG 480 490 500 510 520 530 530 540 pF1KSD QSPRRGASRPVF CCDS31 NGLQAMSGLVVPPM 540 550 >>CCDS4343.1 EBF1 gene_id:1879|Hs108|chr5 (591 aa) initn: 2797 init1: 1468 opt: 2738 Z-score: 1701.8 bits: 324.8 E(32554): 1.8e-88 Smith-Waterman score: 2738; 75.1% identity (91.3% similar) in 531 aa overlap (2-524:6-532) 10 20 30 40 50 pF1KSD MDALPRSGLNLKEEPLLPAGLGSVRSWMQGAGILDASTAAQSGVGLARAHFEKQPP ... ::: ..::::: .:...::.::::::.:::.::::::::::::::::::: CCDS43 MFGIQESIQRSGSSMKEEPL-GSGMNAVRTWMQGAGVLDANTAAQSGVGLARAHFEKQPP 10 20 30 40 50 60 70 80 90 100 110 pF1KSD SNLRKSNFFHFVLAMYDRQGQPVEVERTAFIDFVEKDREPGAEKTNNGIHYRLRLVYNNG ::::::::::::::.:::::::::.:::::. ::::..: ..:::::::::::.:.:.:: CCDS43 SNLRKSNFFHFVLALYDRQGQPVEIERTAFVGFVEKEKEANSEKTNNGIHYRLQLLYSNG 60 70 80 90 100 110 120 130 140 150 160 170 pF1KSD LRTEQDLYVRLIDSMSKQAIIYEGQDKNPEMCRVLLTHEIMCSRCCDRKSCGNRNETPSD .:::::.::::::::.::::.::::::::::::::::::::::::::.:::::::::::: CCDS43 IRTEQDFYVRLIDSMTKQAIVYEGQDKNPEMCRVLLTHEIMCSRCCDKKSCGNRNETPSD 120 130 140 150 160 170 180 190 200 210 220 230 pF1KSD PVIIDRFFLKFFLKCNQNCLKNAGNPRDMRRFQVVVSTTVSVDGHVLAVSDNMFVHNNSK ::::::::::::::::::::::::::::::::::::::::.::::::::::::::::::: CCDS43 PVIIDRFFLKFFLKCNQNCLKNAGNPRDMRRFQVVVSTTVNVDGHVLAVSDNMFVHNNSK 180 190 200 210 220 230 240 250 260 270 280 pF1KSD HGRRARRLDPSEA-------ATPCIKAISPGEGWTTGGATVIVIGDNFFDGLQVVFGNVL ::::::::::::. ::::::::::.:::::::::::.:::::::::::.::..: CCDS43 HGRRARRLDPSEGTPSYLEHATPCIKAISPSEGWTTGGATVIIIGDNFFDGLQVIFGTML 240 250 260 270 280 290 290 300 310 320 330 340 pF1KSD VWSELITPHAIRVQTPPRHIPGVVEVTLSYKSKQFCKGCPGRFVYTALNEPTIDYGFQRL :::::::::::::::::::::::::::::::::::::: ::::.:::::::::::::::: CCDS43 VWSELITPHAIRVQTPPRHIPGVVEVTLSYKSKQFCKGTPGRFIYTALNEPTIDYGFQRL 300 310 320 330 340 350 350 360 370 380 390 400 pF1KSD QKVIPRHPGDPERLPKEVLLKRAADLAEALYGVPGSNQELLLKRAADVAEALYSTPRAPG ::::::::::::::::::.:::::::.:::::.: .:::..::::::.::::::.:: . CCDS43 QKVIPRHPGDPERLPKEVILKRAADLVEALYGMPHNNQEIILKRAADIAEALYSVPRNHN 360 370 380 390 400 410 410 420 430 440 450 460 pF1KSD PLAPLAPSHPHSAVVGINAFSSPLAIAVGDATPGPEPGYARSCSSASPRGFAPSPGSQQS : :: . :....:.:.::. ::. :..:. . . :..:. ::.::.:..:: ::. CCDS43 QLPALANTSVHAGMMGVNSFSGQLAVNVSEASQATNQGFTRNSSSVSPHGYVPSTTPQQT 420 430 440 450 460 470 470 480 490 500 510 520 pF1KSD GYGGGLGAGLGGYGAPGVAGLGVPGSPSFLNGSTATSPFAKERLRPR-AAPPKLPTPGLP .:.. . ....:::. ....:: :::.:::::.:.::.: : :. .::. CCDS43 NYNS-VTTSMNGYGSAAMSNLG--GSPTFLNGSAANSPYAIVPSSPTMASSTSLPSNCSS 480 490 500 510 520 530 530 540 pF1KSD QSPRRGASRPVF CCDS43 SSGIFSFSPANMVSAVKQKSAFAPVVRPQTSPPPTCTSTNGNSLQAISGMIVPPM 540 550 560 570 580 590 >>CCDS43726.1 EBF2 gene_id:64641|Hs108|chr8 (575 aa) initn: 2704 init1: 1389 opt: 2640 Z-score: 1641.8 bits: 313.6 E(32554): 4e-85 Smith-Waterman score: 2640; 71.9% identity (88.1% similar) in 544 aa overlap (2-539:6-545) 10 20 30 40 50 pF1KSD MDALPRSGLNLKEEPLLPAGLGSVRSWMQGAGILDASTAAQSGVGLARAHFEKQPP :.: : : .:::. : : . :::::....:..::..::::::.:.::::::::: CCDS43 MFGIQDTLGR-GPTLKEKSL-GAEMDSVRSWVRNVGVVDANVAAQSGVALSRAHFEKQPP 10 20 30 40 50 60 70 80 90 100 110 pF1KSD SNLRKSNFFHFVLAMYDRQGQPVEVERTAFIDFVEKDREPGAEKTNNGIHYRLRLVYNNG ::::::::::::::.:::::::::.:::::.::::.:.: : :::::: ::.:.:.:.:: CCDS43 SNLRKSNFFHFVLALYDRQGQPVEIERTAFVDFVENDKEQGNEKTNNGTHYKLQLLYSNG 60 70 80 90 100 110 120 130 140 150 160 170 pF1KSD LRTEQDLYVRLIDSMSKQAIIYEGQDKNPEMCRVLLTHEIMCSRCCDRKSCGNRNETPSD .:::::::::::::..:: : ::::.:::::::::::::.::::::..:::::::::::: CCDS43 VRTEQDLYVRLIDSVTKQPIAYEGQNKNPEMCRVLLTHEVMCSRCCEKKSCGNRNETPSD 120 130 140 150 160 170 180 190 200 210 220 230 pF1KSD PVIIDRFFLKFFLKCNQNCLKNAGNPRDMRRFQVVVSTTVSVDGHVLAVSDNMFVHNNSK :::::::::::::::::::::.:::::::::::::.::::.::::::::::::::::::: CCDS43 PVIIDRFFLKFFLKCNQNCLKTAGNPRDMRRFQVVLSTTVNVDGHVLAVSDNMFVHNNSK 180 190 200 210 220 230 240 250 260 270 280 290 pF1KSD HGRRARRLDPSEAATPCIKAISPGEGWTTGGATVIVIGDNFFDGLQVVFGNVLVWSELIT ::::::::::::: :::::::::.:::::::: ::.::::::::::::::..:::::::: CCDS43 HGRRARRLDPSEA-TPCIKAISPSEGWTTGGAMVIIIGDNFFDGLQVVFGTMLVWSELIT 240 250 260 270 280 290 300 310 320 330 340 350 pF1KSD PHAIRVQTPPRHIPGVVEVTLSYKSKQFCKGCPGRFVYTALNEPTIDYGFQRLQKVIPRH ::::::::::::::::::::::::::::::: ::::.::::::::::::::::::::::: CCDS43 PHAIRVQTPPRHIPGVVEVTLSYKSKQFCKGAPGRFIYTALNEPTIDYGFQRLQKVIPRH 300 310 320 330 340 350 360 370 380 390 400 410 pF1KSD PGDPERLPKEVLLKRAADLAEALYGVPGSNQELLLKRAADVAEALYSTPRAPGPLAPLAP ::::::: ::.::::::::.:::::.: .::...::::::.::::::.:: :. : :. CCDS43 PGDPERLAKEMLLKRAADLVEALYGTPHNNQDIILKRAADIAEALYSVPRNPSQLPALSS 360 370 380 390 400 410 420 430 440 450 460 470 pF1KSD SHPHSAVVGINAFSSPLAIAVGDATPGPEPGYARSCSSASPRGFAPSPGSQQSGYGGGLG : ::...:::...: :.......: : . :: :. :: ::::.. : :::.:. . . CCDS43 SPAHSGMMGINSYGSQLGVSISESTQGNNQGYIRNTSSISPRGYSSSSTPQQSNYSTS-S 420 430 440 450 460 470 480 490 500 510 520 530 pF1KSD AGLGGYGAPGVAGLGVPGSPSFLNGSTATSPFAKERLRPRAAPPK----LPTPG--LPQS ...::. .:.:::::::.::::: . ::.. : .. . :: . .: CCDS43 NSMNGYSNVPMANLGVPGSPGFLNGSPTGSPYGIMSSSPTVGSSSTSSILPFSSSVFPAV 480 490 500 510 520 530 540 pF1KSD PRRGASRPVF ...: :: CCDS43 KQKSAFAPVIRPQGSPSPACSSGNGNGFRAMTGLVVPPM 540 550 560 570 >>CCDS78081.1 EBF1 gene_id:1879|Hs108|chr5 (560 aa) initn: 2167 init1: 1153 opt: 1707 Z-score: 1068.3 bits: 207.5 E(32554): 3.5e-53 Smith-Waterman score: 2525; 71.9% identity (88.0% similar) in 524 aa overlap (2-524:6-501) 10 20 30 40 50 pF1KSD MDALPRSGLNLKEEPLLPAGLGSVRSWMQGAGILDASTAAQSGVGLARAHFEKQPP ... ::: ..::::: .:...::.::::::.:::.::::::::::::::::::: CCDS78 MFGIQESIQRSGSSMKEEPL-GSGMNAVRTWMQGAGVLDANTAAQSGVGLARAHFEKQPP 10 20 30 40 50 60 70 80 90 100 110 pF1KSD SNLRKSNFFHFVLAMYDRQGQPVEVERTAFIDFVEKDREPGAEKTNNGIHYRLRLVYNNG ::::::::::::::.:::::::::.:::::. ::::..: ..:::::::::::.:.:.:: CCDS78 SNLRKSNFFHFVLALYDRQGQPVEIERTAFVGFVEKEKEANSEKTNNGIHYRLQLLYSNG 60 70 80 90 100 110 120 130 140 150 160 170 pF1KSD LRTEQDLYVRLIDSMSKQAIIYEGQDKNPEMCRVLLTHEIMCSRCCDRKSCGNRNETPSD .:::::.::::::::.::::.::::::::::::::::::::: CCDS78 IRTEQDFYVRLIDSMTKQAIVYEGQDKNPEMCRVLLTHEIMC------------------ 120 130 140 150 160 180 190 200 210 220 230 pF1KSD PVIIDRFFLKFFLKCNQNCLKNAGNPRDMRRFQVVVSTTVSVDGHVLAVSDNMFVHNNSK :::::::::::::::::::::::::::::::::::.::::::::::::::::::: CCDS78 -----RFFLKFFLKCNQNCLKNAGNPRDMRRFQVVVSTTVNVDGHVLAVSDNMFVHNNSK 170 180 190 200 210 240 250 260 270 280 290 pF1KSD HGRRARRLDPSEAATPCIKAISPGEGWTTGGATVIVIGDNFFDGLQVVFGNVLVWSELIT ::::::::::::: :::::::::.:::::::::::.:::::::::::.::..:::::::: CCDS78 HGRRARRLDPSEA-TPCIKAISPSEGWTTGGATVIIIGDNFFDGLQVIFGTMLVWSELIT 220 230 240 250 260 270 300 310 320 330 340 350 pF1KSD PHAIRVQTPPRHIPGVVEVTLSYKSKQFCKGCPGRFVYTALNEPTIDYGFQRLQKVIPRH ::::::::::::::::::::::::::::::: ::::.::::::::::::::::::::::: CCDS78 PHAIRVQTPPRHIPGVVEVTLSYKSKQFCKGTPGRFIYTALNEPTIDYGFQRLQKVIPRH 280 290 300 310 320 330 360 370 380 390 400 410 pF1KSD PGDPERLPKEVLLKRAADLAEALYGVPGSNQELLLKRAADVAEALYSTPRAPGPLAPLAP :::::::::::.:::::::.:::::.: .:::..::::::.::::::.:: . : :: CCDS78 PGDPERLPKEVILKRAADLVEALYGMPHNNQEIILKRAADIAEALYSVPRNHNQLPALAN 340 350 360 370 380 390 420 430 440 450 460 470 pF1KSD SHPHSAVVGINAFSSPLAIAVGDATPGPEPGYARSCSSASPRGFAPSPGSQQSGYGGGLG . :....:.:.::. ::. :..:. . . :..:. ::.::.:..:: ::..:.. . CCDS78 TSVHAGMMGVNSFSGQLAVNVSEASQATNQGFTRNSSSVSPHGYVPSTTPQQTNYNS-VT 400 410 420 430 440 450 480 490 500 510 520 530 pF1KSD AGLGGYGAPGVAGLGVPGSPSFLNGSTATSPFAKERLRPR-AAPPKLPTPGLPQSPRRGA ....:::. ....:: :::.:::::.:.::.: : :. .::. CCDS78 TSMNGYGSAAMSNLG--GSPTFLNGSAANSPYAIVPSSPTMASSTSLPSNCSSSSGIFSF 460 470 480 490 500 510 540 pF1KSD SRPVF CCDS78 SPANMVSAVKQKSAFAPVVRPQTSPPPTCTSTNGNSLQAISGMIVPPM 520 530 540 550 560 540 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 06:19:59 2016 done: Thu Nov 3 06:20:00 2016 Total Scan time: 3.760 Total Display time: 0.050 Function used was FASTA [36.3.4 Apr, 2011]