FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB7811, 529 aa
1>>>pF1KB7811 529 - 529 aa - 529 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 10.5036+/-0.000863; mu= -4.8784+/- 0.052
mean_var=250.7434+/-51.790, 0's: 0 Z-trim(115.1): 11 B-trim: 0 in 0/53
Lambda= 0.080995
statistics sampled from 15665 (15674) to 15665 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.781), E-opt: 0.2 (0.481), width: 16
Scan time: 3.620
The best scores are: opt bits E(32554)
CCDS6419.1 HSF1 gene_id:3297|Hs108|chr8 ( 529) 3512 423.2 3.6e-118
CCDS42175.1 HSF4 gene_id:3299|Hs108|chr16 ( 492) 925 120.9 3.4e-27
CCDS45510.1 HSF4 gene_id:3299|Hs108|chr16 ( 462) 890 116.8 5.4e-26
CCDS47470.1 HSF2 gene_id:3298|Hs108|chr6 ( 518) 837 110.7 4.4e-24
CCDS5124.1 HSF2 gene_id:3298|Hs108|chr6 ( 536) 837 110.7 4.5e-24
>>CCDS6419.1 HSF1 gene_id:3297|Hs108|chr8 (529 aa)
initn: 3512 init1: 3512 opt: 3512 Z-score: 2235.1 bits: 423.2 E(32554): 3.6e-118
Smith-Waterman score: 3512; 100.0% identity (100.0% similar) in 529 aa overlap (1-529:1-529)
10 20 30 40 50 60
pF1KB7 MDLPVGPGAAGPSNVPAFLTKLWTLVSDPDTDALICWSPSGNSFHVFDQGQFAKEVLPKY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 MDLPVGPGAAGPSNVPAFLTKLWTLVSDPDTDALICWSPSGNSFHVFDQGQFAKEVLPKY
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 FKHNNMASFVRQLNMYGFRKVVHIEQGGLVKPERDDTEFQHPCFLRGQEQLLENIKRKVT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 FKHNNMASFVRQLNMYGFRKVVHIEQGGLVKPERDDTEFQHPCFLRGQEQLLENIKRKVT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 SVSTLKSEDIKIRQDSVTKLLTDVQLMKGKQECMDSKLLAMKHENEALWREVASLRQKHA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 SVSTLKSEDIKIRQDSVTKLLTDVQLMKGKQECMDSKLLAMKHENEALWREVASLRQKHA
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 QQQKVVNKLIQFLISLVQSNRILGVKRKIPLMLNDSGSAHSMPKYSRQFSLEHVHGSGPY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 QQQKVVNKLIQFLISLVQSNRILGVKRKIPLMLNDSGSAHSMPKYSRQFSLEHVHGSGPY
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB7 SAPSPAYSSSSLYAPDAVASSGPIISDITELAPASPMASPGGSIDERPLSSSPLVRVKEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 SAPSPAYSSSSLYAPDAVASSGPIISDITELAPASPMASPGGSIDERPLSSSPLVRVKEE
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB7 PPSPPQSPRVEEASPGRPSSVDTLLSPTALIDSILRESEPAPASVTALTDARGHTDTEGR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 PPSPPQSPRVEEASPGRPSSVDTLLSPTALIDSILRESEPAPASVTALTDARGHTDTEGR
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB7 PPSPPPTSTPEKCLSVACLDKNELSDHLDAMDSNLDNLQTMLSSHGFSVDTSALLDLFSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 PPSPPPTSTPEKCLSVACLDKNELSDHLDAMDSNLDNLQTMLSSHGFSVDTSALLDLFSP
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB7 SVTVPDMSLPDLDSSLASIQELLSPQEPPRPPEAENSSPDSGKQLVHYTAQPLFLLDPGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 SVTVPDMSLPDLDSSLASIQELLSPQEPPRPPEAENSSPDSGKQLVHYTAQPLFLLDPGS
430 440 450 460 470 480
490 500 510 520
pF1KB7 VDTGSNDLPVLFELGEGSYFSEGDGFAEDPTISLLTGSEPPKAKDPTVS
:::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 VDTGSNDLPVLFELGEGSYFSEGDGFAEDPTISLLTGSEPPKAKDPTVS
490 500 510 520
>>CCDS42175.1 HSF4 gene_id:3299|Hs108|chr16 (492 aa)
initn: 738 init1: 587 opt: 925 Z-score: 601.8 bits: 120.9 E(32554): 3.4e-27
Smith-Waterman score: 1001; 41.2% identity (62.8% similar) in 473 aa overlap (7-475:9-453)
10 20 30 40 50
pF1KB7 MDLPVGPGAAGPSNVPAFLTKLWTLVSDPDTDALICWSPSGNSFHVFDQGQFAKEVLP
: ::: ::::: :::.::.:: :: :: :::::.:: : ::..:::::::
CCDS42 MQEAPAALPTEPGPSPVPAFLGKLWALVGDPGTDHLIRWSPSGTSFLVSDQSRFAKEVLP
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB7 KYFKHNNMASFVRQLNMYGFRKVVHIEQGGLVKPERDDTEFQHPCFLRGQEQLLENIKRK
.::::.:::::::::::::::::: ::::::..:::: .::::: :.::.::::: ..::
CCDS42 QYFKHSNMASFVRQLNMYGFRKVVSIEQGGLLRPERDHVEFQHPSFVRGREQLLERVRRK
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB7 VTSVSTLKSEDIKIRQDSVTKLLTDVQLMKGKQECMDSKLLAMKHENEALWREVASLRQK
: . :...: . : ... .:: .:: ..: :: ...: ....:: :::::..:::.
CCDS42 VPA---LRGDDGRWRPEDLGRLLGEVQALRGVQESTEARLRELRQQNEILWREVVTLRQS
130 140 150 160 170
180 190 200 210 220 230
pF1KB7 HAQQQKVVNKLIQFLISLVQSN-RILGVKRKIPLMLNDSGSAHSMPKYSRQFSLEHVHGS
:.::..:..:::: :.. .:.. : :::. ::: : ::. : : . .
CCDS42 HGQQHRVIGKLIQCLFGPLQAGPSNAGGKRKLSLML-DEGSSCPTPAKFNTCPLPGALLQ
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB7 GPYSAPSPAYSSSSLYAPDAVASSGPIISDITELAPASPMASPGGSIDERPLSSSPLVRV
:: :: .. .: . ::::::: : .:. . . : : : . :. .
CCDS42 DPYFIQSPLPETNLGLSPHR--ARGPIISDIPEDSPSPEGTRLSPSSDGR--REKGLALL
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB7 KEEPPSPPQSPRVEEASPGRPSSVDTLLSPTALIDSILRESEPAP-ASVTALTDARGHTD
:::: :::: . . :.:. : . : : : : :. ...: .
CCDS42 KEEP-----------ASPGGDGEAGLALAPNEC-DFCVTAPPPLPVAVVQAILEGKGSFS
300 310 320 330 340
360 370 380 390 400 410
pF1KB7 TEGRPPSPPPTSTPEKCLSVACLDKNELSDHLDAMDSNLDNL--QTMLSSHGFSVDTSAL
:: : .. :: :.. :. :.. : . ..: .:. ::. ..
CCDS42 PEG----PRNAQQPEPGDPREIPDRGPLG--LESGDRSPESLLPPMLLQPPQESVEPAGP
350 360 370 380 390
420 430 440 450 460 470
pF1KB7 LDLFSPSVTVPDMSLPDLDSSLASIQELLSPQEPPRPPEAENSSPDSGKQLVHYTAQPLF
::...::. . .: ::: :. .: :. . :. .::. ::. . ::.
CCDS42 LDVLGPSLQGREWTLMDLDMELSLMQPLVPERGEPELAVKGLNSPSPGKD--PTLGAPLL
400 410 420 430 440 450
480 490 500 510 520
pF1KB7 LLDPGSVDTGSNDLPVLFELGEGSYFSEGDGFAEDPTISLLTGSEPPKAKDPTVS
:
CCDS42 LDVQAALGGPALGLPGALTIYSTPESRTASYLGPEASPSP
460 470 480 490
>>CCDS45510.1 HSF4 gene_id:3299|Hs108|chr16 (462 aa)
initn: 728 init1: 587 opt: 890 Z-score: 580.1 bits: 116.8 E(32554): 5.4e-26
Smith-Waterman score: 902; 39.1% identity (58.2% similar) in 471 aa overlap (7-475:9-423)
10 20 30 40 50
pF1KB7 MDLPVGPGAAGPSNVPAFLTKLWTLVSDPDTDALICWSPSGNSFHVFDQGQFAKEVLP
: ::: ::::: :::.::.:: :: :: :::::.:: : ::..:::::::
CCDS45 MQEAPAALPTEPGPSPVPAFLGKLWALVGDPGTDHLIRWSPSGTSFLVSDQSRFAKEVLP
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB7 KYFKHNNMASFVRQLNMYGFRKVVHIEQGGLVKPERDDTEFQHPCFLRGQEQLLENIKRK
.::::.:::::::::::::::::: ::::::..:::: .::::: :.::.::::: ..::
CCDS45 QYFKHSNMASFVRQLNMYGFRKVVSIEQGGLLRPERDHVEFQHPSFVRGREQLLERVRRK
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB7 VTSVSTLKSEDIKIRQDSVTKLLTDVQLMKGKQECMDSKLLAMKHENEALWREVASLRQK
: . :...: . : ... .:: .:: ..: :: ...: ....:: :::::..:::.
CCDS45 VPA---LRGDDGRWRPEDLGRLLGEVQALRGVQESTEARLRELRQQNEILWREVVTLRQS
130 140 150 160 170
180 190 200 210 220 230
pF1KB7 HAQQQKVVNKLIQFLISLVQSN-RILGVKRKIPLMLNDSGSAHSMPKYSRQFSLEHVHGS
:.::..:..:::: :.. .:.. : :::. ::: : ::. : : . .
CCDS45 HGQQHRVIGKLIQCLFGPLQAGPSNAGGKRKLSLML-DEGSSCPTPAKFNTCPLPGALLQ
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB7 GPYSAPSPAYSSSSLYAPDAVASSGP-IISDITELAPASPMASPGGSIDERPLSSSPLVR
:: ::. : : :.: .:: :..: :. .:: : :
CCDS45 DPYFIQSPSTYSLSQRQIWALALTGPGAPSSLTSQKTLHPLRGPG---------FLPPVM
240 250 260 270 280
300 310 320 330 340 350
pF1KB7 VKEEPPSPPQSPRVEEASPGRPSSVDTLLSPTALIDSILRESEPAPASVTALTDARGHTD
. :: : :. :. : .:: .. ..: :.. . : ::
CCDS45 AGAPPPLPVAV--VQAILEGKGS-----FSP----EGPRNAQQPEPGDPREIPD-RGPLG
290 300 310 320 330
360 370 380 390 400 410
pF1KB7 TEGRPPSPPPTSTPEKCLSVACLDKNELSDHLDAMDSNLDNLQTMLSSHGFSVDTSALLD
:. :: : .:. ::. .. ::
CCDS45 LESGDRSPESLLPP-----------------------------MLLQPPQESVEPAGPLD
340 350 360
420 430 440 450 460 470
pF1KB7 LFSPSVTVPDMSLPDLDSSLASIQELLSPQEPPRPPEAENSSPDSGKQLVHYTAQPLFLL
...::. . .: ::: :. .: :. . :. .::. ::. . ::.:
CCDS45 VLGPSLQGREWTLMDLDMELSLMQPLVPERGEPELAVKGLNSPSPGKD--PTLGAPLLLD
370 380 390 400 410 420
480 490 500 510 520
pF1KB7 DPGSVDTGSNDLPVLFELGEGSYFSEGDGFAEDPTISLLTGSEPPKAKDPTVS
CCDS45 VQAALGGPALGLPGALTIYSTPESRTASYLGPEASPSP
430 440 450 460
>>CCDS47470.1 HSF2 gene_id:3298|Hs108|chr6 (518 aa)
initn: 1001 init1: 493 opt: 837 Z-score: 545.9 bits: 110.7 E(32554): 4.4e-24
Smith-Waterman score: 957; 39.4% identity (65.2% similar) in 477 aa overlap (13-480:5-439)
10 20 30 40 50 60
pF1KB7 MDLPVGPGAAGPSNVPAFLTKLWTLVSDPDTDALICWSPSGNSFHVFDQGQFAKEVLPKY
:::::::.:::::: . :. .: :: .:.:: :.:. .::::.::::
CCDS47 MKQSSNVPAFLSKLWTLVEETHTNEFITWSQNGQSFLVLDEQRFAKEILPKY
10 20 30 40 50
70 80 90 100 110
pF1KB7 FKHNNMASFVRQLNMYGFRKVVHIEQGGLVKPERDD-TEFQHPCFLRGQEQLLENIKRKV
::::::::::::::::::::::::..: .:: ::: .::::: : .::..:::::::::
CCDS47 FKHNNMASFVRQLNMYGFRKVVHIDSG-IVKQERDGPVEFQHPYFKQGQDDLLENIKRKV
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB7 TSVSTLKSEDIKIRQDSVTKLLTDVQLMKGKQECMDSKLLAMKHENEALWREVASLRQKH
.: : :. ::::...::.....: .. ::: ..:.: .: :::.::.::. :: ::
CCDS47 SSS---KPEENKIRQEDLTKIISSAQKVQIKQETIESRLSELKSENESLWKEVSELRAKH
120 130 140 150 160
180 190 200 210 220 230
pF1KB7 AQQQKVVNKLIQFLISLVQSNRILGVKRKIPLMLNDSGSAHSMPKYSRQFSLEHVHGSGP
::::.:. :..::...:::.:.....::: ::.:: .:. . : : ... .
CCDS47 AQQQQVIRKIVQFIVTLVQNNQLVSLKRKRPLLLNTNGAQK---KNLFQHIVKEPTDNHH
170 180 190 200 210 220
240 250 260 270 280 290
pF1KB7 YSAPSPAYSSSSLYAPDAVASSGPIISDIT------ELAPASPMASPGGSIDERPLSSSP
...: .: . : :. :: :.: : :. : .. : :. :
CCDS47 HKVP---HSRTEGLKPRERISDDIIIYDVTDDNADEENIPVIPETNEDVISDPSNCSQYP
230 240 250 260 270 280
300 310 320 330 340 350
pF1KB7 LVRVKEEPPSPPQSPRVEEASPGRPSSVDTLLSPTALIDSILRESEPAPASVTALTDARG
. . :. .: .. . ..:. ..: : . :. : : .:.. :. . .
CCDS47 DIVIVEDDNEDEYAPVIQSGEQNEPAR-ESLSSGS---DG----SSPLMSSAVQLNGSSS
290 300 310 320 330
360 370 380 390 400 410
pF1KB7 HTDTEGRPPSPPPTSTPEKCLS--VACLDKNELSDHLDAMDSNLDNLQTMLSSHGFSVDT
: : :.. .. :. . : : :: :.::..: .:...:.:::.. ::.:
CCDS47 LT-------SEDPVTMMDSILNDNINLLGKVELLDYLDSIDCSLEDFQAMLSGRQFSIDP
340 350 360 370 380
420 430 440 450 460 470
pF1KB7 SALLDLFSPSVTVPDMSLPDLDSSLASIQELLSPQEPPRPPEAENSSPDSGKQLVHYTAQ
. :.: . . :... .. . .: : : . :.:: :::..:::
CCDS47 DLLVDSENKG----------LETTKNNVVQPVS--EEGRKSK---SKPD--KQLIQYTAF
390 400 410 420 430
480 490 500 510 520
pF1KB7 PLFLLDPGSVDTGSNDLPVLFELGEGSYFSEGDGFAEDPTISLLTGSEPPKAKDPTVS
::. . :.
CCDS47 PLLAFLDGNPASSVEQASTTASSEVLSSVDKPIEVDELLDSSLDPEPTQSKLVRLEPLTE
440 450 460 470 480 490
>>CCDS5124.1 HSF2 gene_id:3298|Hs108|chr6 (536 aa)
initn: 706 init1: 493 opt: 837 Z-score: 545.7 bits: 110.7 E(32554): 4.5e-24
Smith-Waterman score: 1009; 39.7% identity (65.7% similar) in 478 aa overlap (13-480:5-457)
10 20 30 40 50 60
pF1KB7 MDLPVGPGAAGPSNVPAFLTKLWTLVSDPDTDALICWSPSGNSFHVFDQGQFAKEVLPKY
:::::::.:::::: . :. .: :: .:.:: :.:. .::::.::::
CCDS51 MKQSSNVPAFLSKLWTLVEETHTNEFITWSQNGQSFLVLDEQRFAKEILPKY
10 20 30 40 50
70 80 90 100 110
pF1KB7 FKHNNMASFVRQLNMYGFRKVVHIEQGGLVKPERDD-TEFQHPCFLRGQEQLLENIKRKV
::::::::::::::::::::::::..: .:: ::: .::::: : .::..:::::::::
CCDS51 FKHNNMASFVRQLNMYGFRKVVHIDSG-IVKQERDGPVEFQHPYFKQGQDDLLENIKRKV
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB7 TSVSTLKSEDIKIRQDSVTKLLTDVQLMKGKQECMDSKLLAMKHENEALWREVASLRQKH
.: : :. ::::...::.....: .. ::: ..:.: .: :::.::.::. :: ::
CCDS51 SSS---KPEENKIRQEDLTKIISSAQKVQIKQETIESRLSELKSENESLWKEVSELRAKH
120 130 140 150 160
180 190 200 210 220 230
pF1KB7 AQQQKVVNKLIQFLISLVQSNRILGVKRKIPLMLNDSGSAHSMPKYSRQFSLEHVHGSGP
::::.:. :..::...:::.:.....::: ::.:: .:. . : : ... .
CCDS51 AQQQQVIRKIVQFIVTLVQNNQLVSLKRKRPLLLNTNGAQK---KNLFQHIVKEPTDNHH
170 180 190 200 210 220
240 250 260 270 280 290
pF1KB7 YSAPSPAYSSSSLYAPDAVASSGPIISDIT------ELAPASPMASPGGSIDERPLSSSP
...: .: . : :. :: :.: : :. : .. : :. :
CCDS51 HKVP---HSRTEGLKPRERISDDIIIYDVTDDNADEENIPVIPETNEDVISDPSNCSQYP
230 240 250 260 270 280
300 310 320 330 340 350
pF1KB7 LVRVKEEPPSPPQSPRVEEASPGRPSSVDTLLSPTALIDSILRESEPAPASVTALTDARG
. . :. .: .. . ..:. ..: : . :. : : .:.. :. . .
CCDS51 DIVIVEDDNEDEYAPVIQSGEQNEPAR-ESLSSGS---DG----SSPLMSSAVQLNGSSS
290 300 310 320 330
360 370 380 390 400 410
pF1KB7 HTDTEGRPPSPPPTSTPEKCLS--VACLDKNELSDHLDAMDSNLDNLQTMLSSHGFSVDT
: : :.. .. :. . : : :: :.::..: .:...:.:::.. ::.:
CCDS51 LT-------SEDPVTMMDSILNDNINLLGKVELLDYLDSIDCSLEDFQAMLSGRQFSIDP
340 350 360 370 380
420 430 440 450 460 470
pF1KB7 SALLDLFSPSVTV-PDMSLPDLDSSLASIQELLSPQEPPRPPEAENSSPDSGKQLVHYTA
. :.:::. :: . : . . : ... . : :...:. :::..:::
CCDS51 DLLVDLFTSSVQMNPTDYINNTKSENKGLETTKNNVVQPVSEEGRKSKSKPDKQLIQYTA
390 400 410 420 430 440
480 490 500 510 520
pF1KB7 QPLFLLDPGSVDTGSNDLPVLFELGEGSYFSEGDGFAEDPTISLLTGSEPPKAKDPTVS
::. . :.
CCDS51 FPLLAFLDGNPASSVEQASTTASSEVLSSVDKPIEVDELLDSSLDPEPTQSKLVRLEPLT
450 460 470 480 490 500
529 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 22:39:31 2016 done: Fri Nov 4 22:39:32 2016
Total Scan time: 3.620 Total Display time: 0.030
Function used was FASTA [36.3.4 Apr, 2011]