FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB7786, 512 aa
1>>>pF1KB7786 512 - 512 aa - 512 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 9.0103+/-0.000822; mu= 2.1174+/- 0.049
mean_var=206.2325+/-41.529, 0's: 0 Z-trim(114.5): 75 B-trim: 2 in 1/54
Lambda= 0.089309
statistics sampled from 14946 (15021) to 14946 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.786), E-opt: 0.2 (0.461), width: 16
Scan time: 4.020
The best scores are: opt bits E(32554)
CCDS44250.1 ETV3 gene_id:2117|Hs108|chr1 ( 512) 3546 469.3 4.5e-132
CCDS12600.1 ERF gene_id:2077|Hs108|chr19 ( 548) 962 136.4 7.9e-32
CCDS1164.1 ETV3 gene_id:2117|Hs108|chr1 ( 143) 948 134.2 9.4e-32
CCDS30893.1 ETV3L gene_id:440695|Hs108|chr1 ( 361) 773 111.9 1.2e-24
CCDS77308.1 ERF gene_id:2077|Hs108|chr19 ( 473) 536 81.5 2.4e-15
>>CCDS44250.1 ETV3 gene_id:2117|Hs108|chr1 (512 aa)
initn: 3546 init1: 3546 opt: 3546 Z-score: 2484.6 bits: 469.3 E(32554): 4.5e-132
Smith-Waterman score: 3546; 100.0% identity (100.0% similar) in 512 aa overlap (1-512:1-512)
10 20 30 40 50 60
pF1KB7 MKAGCSIVEKPEGGGGYQFPDWAYKTESSPGSRQIQLWHFILELLQKEEFRHVIAWQQGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 MKAGCSIVEKPEGGGGYQFPDWAYKTESSPGSRQIQLWHFILELLQKEEFRHVIAWQQGE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 YGEFVIKDPDEVARLWGRRKCKPQMNYDKLSRALRYYYNKRILHKTKGKRFTYKFNFNKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 YGEFVIKDPDEVARLWGRRKCKPQMNYDKLSRALRYYYNKRILHKTKGKRFTYKFNFNKL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 VMPNYPFINIRSSGVVPQSAPPVPTASSRFHFPPLDTHSPTNDVQPGRFSASSLTASGQE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 VMPNYPFINIRSSGVVPQSAPPVPTASSRFHFPPLDTHSPTNDVQPGRFSASSLTASGQE
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 SSNGTDRKTELSELEDGSAADWRRGVDPVSSRNAIGGGGIGHQKRKPDIMLPLFARPGMY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 SSNGTDRKTELSELEDGSAADWRRGVDPVSSRNAIGGGGIGHQKRKPDIMLPLFARPGMY
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB7 PDPHSPFAVSPIPGRGGVLNVPISPALSLTPTIFSYSPSPGLSPFTSSSCFSFNPEEMKH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 PDPHSPFAVSPIPGRGGVLNVPISPALSLTPTIFSYSPSPGLSPFTSSSCFSFNPEEMKH
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB7 YLHSQACSVFNYHLSPRTFPRYPGLMVPPLQCQMHPEESTQFSIKLQPPPVGRKNRERVE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 YLHSQACSVFNYHLSPRTFPRYPGLMVPPLQCQMHPEESTQFSIKLQPPPVGRKNRERVE
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB7 SSEESAPVTTPTMASIPPRIKVEPASEKDPESLRQSAREKEEHTQEEGTVPSRTIEEEKG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 SSEESAPVTTPTMASIPPRIKVEPASEKDPESLRQSAREKEEHTQEEGTVPSRTIEEEKG
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB7 TIFARPAAPPIWPSVPISTPSGEPLEVTEDSEDRPGKEPSAPEKKEDALMPPKLRLKRRW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 TIFARPAAPPIWPSVPISTPSGEPLEVTEDSEDRPGKEPSAPEKKEDALMPPKLRLKRRW
430 440 450 460 470 480
490 500 510
pF1KB7 NDDPEARELSKSGKFLWNGSGPQGLATAAADA
::::::::::::::::::::::::::::::::
CCDS44 NDDPEARELSKSGKFLWNGSGPQGLATAAADA
490 500 510
>>CCDS12600.1 ERF gene_id:2077|Hs108|chr19 (548 aa)
initn: 1060 init1: 480 opt: 962 Z-score: 684.9 bits: 136.4 E(32554): 7.9e-32
Smith-Waterman score: 1324; 45.6% identity (62.0% similar) in 553 aa overlap (10-504:2-502)
10 20 30 40 50 60
pF1KB7 MKAGCSIVEKPEGGGGYQFPDWAYKTESSPGSRQIQLWHFILELLQKEEFRHVIAWQQGE
: . :. ::::::: :::::::::::::::::::.:::.. ::::: :.
CCDS12 MKTPADTGFAFPDWAYKPESSPGSRQIQLWHFILELLRKEEYQGVIAWQ-GD
10 20 30 40 50
70 80 90 100 110 120
pF1KB7 YGEFVIKDPDEVARLWGRRKCKPQMNYDKLSRALRYYYNKRILHKTKGKRFTYKFNFNKL
::::::::::::::::: ::::::::::::::::::::::::::::::::::::::::::
CCDS12 YGEFVIKDPDEVARLWGVRKCKPQMNYDKLSRALRYYYNKRILHKTKGKRFTYKFNFNKL
60 70 80 90 100 110
130 140 150 160 170
pF1KB7 VMPNYPFINIR-SSGVVPQSAPPVPTASSRFHFPPL---DTHSPTNDVQPGRFSASSLTA
:. :::::.. ..:.:::::::::...:.:.::: .. :::.: : : : ..
CCDS12 VLVNYPFIDVGLAGGAVPQSAPPVPSGGSHFRFPPSTPSEVLSPTED--PRSPPACSSSS
120 130 140 150 160
180 190 200 210 220 230
pF1KB7 SGQESSNGTDR--KTELSELEDGSAA-DWRRGVDPVSSRNAIGGGGIGHQKRKPDIMLP-
:. :. . : . .:. ::.. . : :: .: : .: . : ::
CCDS12 SSLFSAVVARRLGRGSVSDCSDGTSELEEPLGEDP-RARPP-GPPDLGAFRGPPLARLPH
170 180 190 200 210 220
240 250 260 270 280
pF1KB7 ------LFARPGMYPDPHSPFAVSPIPGRGGVLNVPISPALSLTPTIFSYSPSPGLSPFT
.. :: :.: ::: :::. : :..: .:::: .::: ..:.::: :::.
CCDS12 DPGVFRVYPRPRGGPEPLSPFPVSPLAGPGSLLPPQLSPALPMTPTHLAYTPSPTLSPMY
230 240 250 260 270 280
290 300 310 320 330
pF1KB7 SS-----------SCFSFNPEEMKHYLHSQACSVFNYHLSPRTFPRYPGLMVP----PLQ
: : :::.::.::.::.... ::.:::::::.: .::::.:: : .
CCDS12 PSGGGGPSGSGGGSHFSFSPEDMKRYLQAHTQSVYNYHLSPRAFLHYPGLVVPQPQRPDK
290 300 310 320 330 340
340 350 360 370
pF1KB7 CQ---MHPEE--------------STQFSIKLQPPPVGRKNRERVESSEESAPVTTPTMA
: : :: :. :..::::::.::..: :.. .: . . .
CCDS12 CPLPPMAPETPPVPSSASSSSSSSSSPFKFKLQPPPLGRRQRAAGEKAVAGADKSGGSAG
350 360 370 380 390 400
380 390 400 410 420
pF1KB7 SI------------PPRIKVEPASEKDPESLRQSAREKEEHTQEEGTVPSRTIEEEKGTI
.. ::.::::: :: . : . : . ..:. :: : .
CCDS12 GLAEGAGALAPPPPPPQIKVEPISEGESEEV-----EVTDISDED---------EEDGEV
410 420 430 440 450
430 440 450 460 470 480
pF1KB7 FARPAAPPIWPSVPISTPSGEPLEVTEDSEDRPGKEPSAPEKKEDALMPPKLRLKRRWND
: : ::: : .: .::. :.: . :: :::.::::..
CCDS12 FKTPRAPPAPP---------KP---------EPGEAPGASQ-----CMPLKLRFKRRWSE
460 470 480 490
490 500 510
pF1KB7 DPEARELSKSGKFLWNGSGPQGLATAAADA
: . : .:.:: :
CCDS12 DCR----------LEGGGGPAGGFEDEGEDKKVRGEGPGEAGGPLTPRRVSSDLQHATAQ
500 510 520 530 540
>>CCDS1164.1 ETV3 gene_id:2117|Hs108|chr1 (143 aa)
initn: 948 init1: 948 opt: 948 Z-score: 683.5 bits: 134.2 E(32554): 9.4e-32
Smith-Waterman score: 948; 98.5% identity (99.3% similar) in 136 aa overlap (1-136:1-136)
10 20 30 40 50 60
pF1KB7 MKAGCSIVEKPEGGGGYQFPDWAYKTESSPGSRQIQLWHFILELLQKEEFRHVIAWQQGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 MKAGCSIVEKPEGGGGYQFPDWAYKTESSPGSRQIQLWHFILELLQKEEFRHVIAWQQGE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 YGEFVIKDPDEVARLWGRRKCKPQMNYDKLSRALRYYYNKRILHKTKGKRFTYKFNFNKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 YGEFVIKDPDEVARLWGRRKCKPQMNYDKLSRALRYYYNKRILHKTKGKRFTYKFNFNKL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 VMPNYPFINIRSSGVVPQSAPPVPTASSRFHFPPLDTHSPTNDVQPGRFSASSLTASGQE
:::::::::::::: .
CCDS11 VMPNYPFINIRSSGKIQTLLVGN
130 140
>>CCDS30893.1 ETV3L gene_id:440695|Hs108|chr1 (361 aa)
initn: 786 init1: 753 opt: 773 Z-score: 555.9 bits: 111.9 E(32554): 1.2e-24
Smith-Waterman score: 779; 40.6% identity (58.7% similar) in 397 aa overlap (1-384:1-360)
10 20 30 40 50
pF1KB7 MKAGCSIVEKPEGGG----GYQFPDWAYKTESSPGSRQIQLWHFILELLQKEEFRHVIAW
:. .: : . : : :::::::.::::::::::::::::::::::::::::::
CCDS30 MHCSCLAEGIPANPGNWISGLAFPDWAYKAESSPGSRQIQLWHFILELLQKEEFRHVIAW
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB7 QQGEYGEFVIKDPDEVARLWGRRKCKPQMNYDKLSRALRYYYNKRILHKTKGKRFTYKFN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 QQGEYGEFVIKDPDEVARLWGRRKCKPQMNYDKLSRALRYYYNKRILHKTKGKRFTYKFN
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB7 FNKLVMPNYPFINIRSSGVVPQSAPPVP------TASSRFHFPPLDTHSPTNDVQPGRFS
:.::.. :::. ..: ::: : : : . :. ..: .. :.
CCDS30 FSKLIVVNYPLWEVR--------APPSPHLLLGAPALCRPALVPVGVQSEL--LHSMLFA
130 140 150 160 170
180 190 200 210 220
pF1KB7 ASSLTA--SGQESSNGTDRKTELSELEDGSAAD-WRRGVDPVSSRNAIGGGGIGHQKRKP
.... .::.. : : : . ::... .: : : : .. . : . :
CCDS30 HQAMVEQLTGQQTPRGPP---ETSGDKKGSSSSVYRLGSAPGPCRLGLCCHLGSVQGELP
180 190 200 210 220
230 240 250 260 270 280
pF1KB7 DIMLPLFARPGMYPDPHSPFAVSPIPGRGGVLNVPISPALSLTPTIFSYSPSPGLSPFTS
. . . : : :.:. :. :. : : : : . :: :
CCDS30 GV--------ASFTPPLPP----PLPSNWTCLSGPFLPPL---P---SEQQLPG--AFKP
230 240 250 260
290 300 310 320 330 340
pF1KB7 SSCFSFNPEEMKHYLHSQACSVFNYHLSPRTFPRYPGLMVPPLQCQMHPEESTQFSIKLQ
. . .:. . : . .. :. . : : . : ...: . . :.
CCDS30 DILLP-GPRSLPGAWHFPGLPLLA-GLGQGAGERLWLLSLRPEGLEVKPAPMMEAKGGLD
270 280 290 300 310 320
350 360 370 380 390 400
pF1KB7 PPPVGRKNRERVESSEESAPVTTPTMASIPPRIKVEPASEKDPESLRQSAREKEEHTQEE
: : . .:....::: .:.:.. .. ..:
CCDS30 PREVFCPETRRLKTGEES--LTSPNLENLKAVWPLDPP
330 340 350 360
410 420 430 440 450 460
pF1KB7 GTVPSRTIEEEKGTIFARPAAPPIWPSVPISTPSGEPLEVTEDSEDRPGKEPSAPEKKED
>>CCDS77308.1 ERF gene_id:2077|Hs108|chr19 (473 aa)
initn: 874 init1: 294 opt: 536 Z-score: 389.2 bits: 81.5 E(32554): 2.4e-15
Smith-Waterman score: 898; 40.2% identity (57.9% similar) in 478 aa overlap (85-504:1-427)
60 70 80 90 100 110
pF1KB7 AWQQGEYGEFVIKDPDEVARLWGRRKCKPQMNYDKLSRALRYYYNKRILHKTKGKRFTYK
::::::::::::::::::::::::::::::
CCDS77 MNYDKLSRALRYYYNKRILHKTKGKRFTYK
10 20 30
120 130 140 150 160 170
pF1KB7 FNFNKLVMPNYPFINIR-SSGVVPQSAPPVPTASSRFHFPPL---DTHSPTNDVQPGRFS
:::::::. :::::.. ..:.:::::::::...:.:.::: .. :::.: :
CCDS77 FNFNKLVLVNYPFIDVGLAGGAVPQSAPPVPSGGSHFRFPPSTPSEVLSPTED--PRSPP
40 50 60 70 80
180 190 200 210 220
pF1KB7 ASSLTASGQESSNGTDR--KTELSELEDGSAA-DWRRGVDPVSSRNAIGGGGIGHQKRKP
: : ..:. :. . : . .:. ::.. . : :: .: : .: . :
CCDS77 ACSSSSSSLFSAVVARRLGRGSVSDCSDGTSELEEPLGEDP-RARPP-GPPDLGAFRGPP
90 100 110 120 130 140
230 240 250 260 270 280
pF1KB7 DIMLP-------LFARPGMYPDPHSPFAVSPIPGRGGVLNVPISPALSLTPTIFSYSPSP
:: .. :: :.: ::: :::. : :..: .:::: .::: ..:.:::
CCDS77 LARLPHDPGVFRVYPRPRGGPEPLSPFPVSPLAGPGSLLPPQLSPALPMTPTHLAYTPSP
150 160 170 180 190 200
290 300 310 320
pF1KB7 GLSPFTSS-----------SCFSFNPEEMKHYLHSQACSVFNYHLSPRTFPRYPGLMVP-
:::. : : :::.::.::.::.... ::.:::::::.: .::::.::
CCDS77 TLSPMYPSGGGGPSGSGGGSHFSFSPEDMKRYLQAHTQSVYNYHLSPRAFLHYPGLVVPQ
210 220 230 240 250 260
330 340 350 360
pF1KB7 ---PLQCQ---MHPEE--------------STQFSIKLQPPPVGRKNRERVESSEESAPV
: .: : :: :. :..::::::.::..: :.. .:
CCDS77 PQRPDKCPLPPMAPETPPVPSSASSSSSSSSSPFKFKLQPPPLGRRQRAAGEKAVAGADK
270 280 290 300 310 320
370 380 390 400 410
pF1KB7 TTPTMASI------------PPRIKVEPASEKDPESLRQSAREKEEHTQEEGTVPSRTIE
. . ... ::.::::: :: . : . : . ..:.
CCDS77 SGGSAGGLAEGAGALAPPPPPPQIKVEPISEGESEEV-----EVTDISDED---------
330 340 350 360 370
420 430 440 450 460 470
pF1KB7 EEKGTIFARPAAPPIWPSVPISTPSGEPLEVTEDSEDRPGKEPSAPEKKEDALMPPKLRL
:: : .: : ::: : .: .::. :.: . :: :::.
CCDS77 EEDGEVFKTPRAPPAPP---------KP---------EPGEAPGASQ-----CMPLKLRF
380 390 400
480 490 500 510
pF1KB7 KRRWNDDPEARELSKSGKFLWNGSGPQGLATAAADA
::::..: . : .:.:: :
CCDS77 KRRWSEDCR----------LEGGGGPAGGFEDEGEDKKVRGEGPGEAGGPLTPRRVSSDL
410 420 430 440 450
512 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 16:20:32 2016 done: Sat Nov 5 16:20:33 2016
Total Scan time: 4.020 Total Display time: 0.030
Function used was FASTA [36.3.4 Apr, 2011]