FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7811, 529 aa 1>>>pF1KB7811 529 - 529 aa - 529 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 10.5036+/-0.000863; mu= -4.8784+/- 0.052 mean_var=250.7434+/-51.790, 0's: 0 Z-trim(115.1): 11 B-trim: 0 in 0/53 Lambda= 0.080995 statistics sampled from 15665 (15674) to 15665 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.781), E-opt: 0.2 (0.481), width: 16 Scan time: 3.620 The best scores are: opt bits E(32554) CCDS6419.1 HSF1 gene_id:3297|Hs108|chr8 ( 529) 3512 423.2 3.6e-118 CCDS42175.1 HSF4 gene_id:3299|Hs108|chr16 ( 492) 925 120.9 3.4e-27 CCDS45510.1 HSF4 gene_id:3299|Hs108|chr16 ( 462) 890 116.8 5.4e-26 CCDS47470.1 HSF2 gene_id:3298|Hs108|chr6 ( 518) 837 110.7 4.4e-24 CCDS5124.1 HSF2 gene_id:3298|Hs108|chr6 ( 536) 837 110.7 4.5e-24 >>CCDS6419.1 HSF1 gene_id:3297|Hs108|chr8 (529 aa) initn: 3512 init1: 3512 opt: 3512 Z-score: 2235.1 bits: 423.2 E(32554): 3.6e-118 Smith-Waterman score: 3512; 100.0% identity (100.0% similar) in 529 aa overlap (1-529:1-529) 10 20 30 40 50 60 pF1KB7 MDLPVGPGAAGPSNVPAFLTKLWTLVSDPDTDALICWSPSGNSFHVFDQGQFAKEVLPKY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 MDLPVGPGAAGPSNVPAFLTKLWTLVSDPDTDALICWSPSGNSFHVFDQGQFAKEVLPKY 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 FKHNNMASFVRQLNMYGFRKVVHIEQGGLVKPERDDTEFQHPCFLRGQEQLLENIKRKVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 FKHNNMASFVRQLNMYGFRKVVHIEQGGLVKPERDDTEFQHPCFLRGQEQLLENIKRKVT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 SVSTLKSEDIKIRQDSVTKLLTDVQLMKGKQECMDSKLLAMKHENEALWREVASLRQKHA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 SVSTLKSEDIKIRQDSVTKLLTDVQLMKGKQECMDSKLLAMKHENEALWREVASLRQKHA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 QQQKVVNKLIQFLISLVQSNRILGVKRKIPLMLNDSGSAHSMPKYSRQFSLEHVHGSGPY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 QQQKVVNKLIQFLISLVQSNRILGVKRKIPLMLNDSGSAHSMPKYSRQFSLEHVHGSGPY 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 SAPSPAYSSSSLYAPDAVASSGPIISDITELAPASPMASPGGSIDERPLSSSPLVRVKEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 SAPSPAYSSSSLYAPDAVASSGPIISDITELAPASPMASPGGSIDERPLSSSPLVRVKEE 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 PPSPPQSPRVEEASPGRPSSVDTLLSPTALIDSILRESEPAPASVTALTDARGHTDTEGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 PPSPPQSPRVEEASPGRPSSVDTLLSPTALIDSILRESEPAPASVTALTDARGHTDTEGR 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB7 PPSPPPTSTPEKCLSVACLDKNELSDHLDAMDSNLDNLQTMLSSHGFSVDTSALLDLFSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 PPSPPPTSTPEKCLSVACLDKNELSDHLDAMDSNLDNLQTMLSSHGFSVDTSALLDLFSP 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB7 SVTVPDMSLPDLDSSLASIQELLSPQEPPRPPEAENSSPDSGKQLVHYTAQPLFLLDPGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 SVTVPDMSLPDLDSSLASIQELLSPQEPPRPPEAENSSPDSGKQLVHYTAQPLFLLDPGS 430 440 450 460 470 480 490 500 510 520 pF1KB7 VDTGSNDLPVLFELGEGSYFSEGDGFAEDPTISLLTGSEPPKAKDPTVS ::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 VDTGSNDLPVLFELGEGSYFSEGDGFAEDPTISLLTGSEPPKAKDPTVS 490 500 510 520 >>CCDS42175.1 HSF4 gene_id:3299|Hs108|chr16 (492 aa) initn: 738 init1: 587 opt: 925 Z-score: 601.8 bits: 120.9 E(32554): 3.4e-27 Smith-Waterman score: 1001; 41.2% identity (62.8% similar) in 473 aa overlap (7-475:9-453) 10 20 30 40 50 pF1KB7 MDLPVGPGAAGPSNVPAFLTKLWTLVSDPDTDALICWSPSGNSFHVFDQGQFAKEVLP : ::: ::::: :::.::.:: :: :: :::::.:: : ::..::::::: CCDS42 MQEAPAALPTEPGPSPVPAFLGKLWALVGDPGTDHLIRWSPSGTSFLVSDQSRFAKEVLP 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB7 KYFKHNNMASFVRQLNMYGFRKVVHIEQGGLVKPERDDTEFQHPCFLRGQEQLLENIKRK .::::.:::::::::::::::::: ::::::..:::: .::::: :.::.::::: ..:: CCDS42 QYFKHSNMASFVRQLNMYGFRKVVSIEQGGLLRPERDHVEFQHPSFVRGREQLLERVRRK 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB7 VTSVSTLKSEDIKIRQDSVTKLLTDVQLMKGKQECMDSKLLAMKHENEALWREVASLRQK : . :...: . : ... .:: .:: ..: :: ...: ....:: :::::..:::. CCDS42 VPA---LRGDDGRWRPEDLGRLLGEVQALRGVQESTEARLRELRQQNEILWREVVTLRQS 130 140 150 160 170 180 190 200 210 220 230 pF1KB7 HAQQQKVVNKLIQFLISLVQSN-RILGVKRKIPLMLNDSGSAHSMPKYSRQFSLEHVHGS :.::..:..:::: :.. .:.. : :::. ::: : ::. : : . . CCDS42 HGQQHRVIGKLIQCLFGPLQAGPSNAGGKRKLSLML-DEGSSCPTPAKFNTCPLPGALLQ 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB7 GPYSAPSPAYSSSSLYAPDAVASSGPIISDITELAPASPMASPGGSIDERPLSSSPLVRV :: :: .. .: . ::::::: : .:. . . : : : . :. . CCDS42 DPYFIQSPLPETNLGLSPHR--ARGPIISDIPEDSPSPEGTRLSPSSDGR--REKGLALL 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB7 KEEPPSPPQSPRVEEASPGRPSSVDTLLSPTALIDSILRESEPAP-ASVTALTDARGHTD :::: :::: . . :.:. : . : : : : :. ...: . CCDS42 KEEP-----------ASPGGDGEAGLALAPNEC-DFCVTAPPPLPVAVVQAILEGKGSFS 300 310 320 330 340 360 370 380 390 400 410 pF1KB7 TEGRPPSPPPTSTPEKCLSVACLDKNELSDHLDAMDSNLDNL--QTMLSSHGFSVDTSAL :: : .. :: :.. :. :.. : . ..: .:. ::. .. CCDS42 PEG----PRNAQQPEPGDPREIPDRGPLG--LESGDRSPESLLPPMLLQPPQESVEPAGP 350 360 370 380 390 420 430 440 450 460 470 pF1KB7 LDLFSPSVTVPDMSLPDLDSSLASIQELLSPQEPPRPPEAENSSPDSGKQLVHYTAQPLF ::...::. . .: ::: :. .: :. . :. .::. ::. . ::. CCDS42 LDVLGPSLQGREWTLMDLDMELSLMQPLVPERGEPELAVKGLNSPSPGKD--PTLGAPLL 400 410 420 430 440 450 480 490 500 510 520 pF1KB7 LLDPGSVDTGSNDLPVLFELGEGSYFSEGDGFAEDPTISLLTGSEPPKAKDPTVS : CCDS42 LDVQAALGGPALGLPGALTIYSTPESRTASYLGPEASPSP 460 470 480 490 >>CCDS45510.1 HSF4 gene_id:3299|Hs108|chr16 (462 aa) initn: 728 init1: 587 opt: 890 Z-score: 580.1 bits: 116.8 E(32554): 5.4e-26 Smith-Waterman score: 902; 39.1% identity (58.2% similar) in 471 aa overlap (7-475:9-423) 10 20 30 40 50 pF1KB7 MDLPVGPGAAGPSNVPAFLTKLWTLVSDPDTDALICWSPSGNSFHVFDQGQFAKEVLP : ::: ::::: :::.::.:: :: :: :::::.:: : ::..::::::: CCDS45 MQEAPAALPTEPGPSPVPAFLGKLWALVGDPGTDHLIRWSPSGTSFLVSDQSRFAKEVLP 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB7 KYFKHNNMASFVRQLNMYGFRKVVHIEQGGLVKPERDDTEFQHPCFLRGQEQLLENIKRK .::::.:::::::::::::::::: ::::::..:::: .::::: :.::.::::: ..:: CCDS45 QYFKHSNMASFVRQLNMYGFRKVVSIEQGGLLRPERDHVEFQHPSFVRGREQLLERVRRK 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB7 VTSVSTLKSEDIKIRQDSVTKLLTDVQLMKGKQECMDSKLLAMKHENEALWREVASLRQK : . :...: . : ... .:: .:: ..: :: ...: ....:: :::::..:::. CCDS45 VPA---LRGDDGRWRPEDLGRLLGEVQALRGVQESTEARLRELRQQNEILWREVVTLRQS 130 140 150 160 170 180 190 200 210 220 230 pF1KB7 HAQQQKVVNKLIQFLISLVQSN-RILGVKRKIPLMLNDSGSAHSMPKYSRQFSLEHVHGS :.::..:..:::: :.. .:.. : :::. ::: : ::. : : . . CCDS45 HGQQHRVIGKLIQCLFGPLQAGPSNAGGKRKLSLML-DEGSSCPTPAKFNTCPLPGALLQ 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB7 GPYSAPSPAYSSSSLYAPDAVASSGP-IISDITELAPASPMASPGGSIDERPLSSSPLVR :: ::. : : :.: .:: :..: :. .:: : : CCDS45 DPYFIQSPSTYSLSQRQIWALALTGPGAPSSLTSQKTLHPLRGPG---------FLPPVM 240 250 260 270 280 300 310 320 330 340 350 pF1KB7 VKEEPPSPPQSPRVEEASPGRPSSVDTLLSPTALIDSILRESEPAPASVTALTDARGHTD . :: : :. :. : .:: .. ..: :.. . : :: CCDS45 AGAPPPLPVAV--VQAILEGKGS-----FSP----EGPRNAQQPEPGDPREIPD-RGPLG 290 300 310 320 330 360 370 380 390 400 410 pF1KB7 TEGRPPSPPPTSTPEKCLSVACLDKNELSDHLDAMDSNLDNLQTMLSSHGFSVDTSALLD :. :: : .:. ::. .. :: CCDS45 LESGDRSPESLLPP-----------------------------MLLQPPQESVEPAGPLD 340 350 360 420 430 440 450 460 470 pF1KB7 LFSPSVTVPDMSLPDLDSSLASIQELLSPQEPPRPPEAENSSPDSGKQLVHYTAQPLFLL ...::. . .: ::: :. .: :. . :. .::. ::. . ::.: CCDS45 VLGPSLQGREWTLMDLDMELSLMQPLVPERGEPELAVKGLNSPSPGKD--PTLGAPLLLD 370 380 390 400 410 420 480 490 500 510 520 pF1KB7 DPGSVDTGSNDLPVLFELGEGSYFSEGDGFAEDPTISLLTGSEPPKAKDPTVS CCDS45 VQAALGGPALGLPGALTIYSTPESRTASYLGPEASPSP 430 440 450 460 >>CCDS47470.1 HSF2 gene_id:3298|Hs108|chr6 (518 aa) initn: 1001 init1: 493 opt: 837 Z-score: 545.9 bits: 110.7 E(32554): 4.4e-24 Smith-Waterman score: 957; 39.4% identity (65.2% similar) in 477 aa overlap (13-480:5-439) 10 20 30 40 50 60 pF1KB7 MDLPVGPGAAGPSNVPAFLTKLWTLVSDPDTDALICWSPSGNSFHVFDQGQFAKEVLPKY :::::::.:::::: . :. .: :: .:.:: :.:. .::::.:::: CCDS47 MKQSSNVPAFLSKLWTLVEETHTNEFITWSQNGQSFLVLDEQRFAKEILPKY 10 20 30 40 50 70 80 90 100 110 pF1KB7 FKHNNMASFVRQLNMYGFRKVVHIEQGGLVKPERDD-TEFQHPCFLRGQEQLLENIKRKV ::::::::::::::::::::::::..: .:: ::: .::::: : .::..::::::::: CCDS47 FKHNNMASFVRQLNMYGFRKVVHIDSG-IVKQERDGPVEFQHPYFKQGQDDLLENIKRKV 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB7 TSVSTLKSEDIKIRQDSVTKLLTDVQLMKGKQECMDSKLLAMKHENEALWREVASLRQKH .: : :. ::::...::.....: .. ::: ..:.: .: :::.::.::. :: :: CCDS47 SSS---KPEENKIRQEDLTKIISSAQKVQIKQETIESRLSELKSENESLWKEVSELRAKH 120 130 140 150 160 180 190 200 210 220 230 pF1KB7 AQQQKVVNKLIQFLISLVQSNRILGVKRKIPLMLNDSGSAHSMPKYSRQFSLEHVHGSGP ::::.:. :..::...:::.:.....::: ::.:: .:. . : : ... . CCDS47 AQQQQVIRKIVQFIVTLVQNNQLVSLKRKRPLLLNTNGAQK---KNLFQHIVKEPTDNHH 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB7 YSAPSPAYSSSSLYAPDAVASSGPIISDIT------ELAPASPMASPGGSIDERPLSSSP ...: .: . : :. :: :.: : :. : .. : :. : CCDS47 HKVP---HSRTEGLKPRERISDDIIIYDVTDDNADEENIPVIPETNEDVISDPSNCSQYP 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB7 LVRVKEEPPSPPQSPRVEEASPGRPSSVDTLLSPTALIDSILRESEPAPASVTALTDARG . . :. .: .. . ..:. ..: : . :. : : .:.. :. . . CCDS47 DIVIVEDDNEDEYAPVIQSGEQNEPAR-ESLSSGS---DG----SSPLMSSAVQLNGSSS 290 300 310 320 330 360 370 380 390 400 410 pF1KB7 HTDTEGRPPSPPPTSTPEKCLS--VACLDKNELSDHLDAMDSNLDNLQTMLSSHGFSVDT : : :.. .. :. . : : :: :.::..: .:...:.:::.. ::.: CCDS47 LT-------SEDPVTMMDSILNDNINLLGKVELLDYLDSIDCSLEDFQAMLSGRQFSIDP 340 350 360 370 380 420 430 440 450 460 470 pF1KB7 SALLDLFSPSVTVPDMSLPDLDSSLASIQELLSPQEPPRPPEAENSSPDSGKQLVHYTAQ . :.: . . :... .. . .: : : . :.:: :::..::: CCDS47 DLLVDSENKG----------LETTKNNVVQPVS--EEGRKSK---SKPD--KQLIQYTAF 390 400 410 420 430 480 490 500 510 520 pF1KB7 PLFLLDPGSVDTGSNDLPVLFELGEGSYFSEGDGFAEDPTISLLTGSEPPKAKDPTVS ::. . :. CCDS47 PLLAFLDGNPASSVEQASTTASSEVLSSVDKPIEVDELLDSSLDPEPTQSKLVRLEPLTE 440 450 460 470 480 490 >>CCDS5124.1 HSF2 gene_id:3298|Hs108|chr6 (536 aa) initn: 706 init1: 493 opt: 837 Z-score: 545.7 bits: 110.7 E(32554): 4.5e-24 Smith-Waterman score: 1009; 39.7% identity (65.7% similar) in 478 aa overlap (13-480:5-457) 10 20 30 40 50 60 pF1KB7 MDLPVGPGAAGPSNVPAFLTKLWTLVSDPDTDALICWSPSGNSFHVFDQGQFAKEVLPKY :::::::.:::::: . :. .: :: .:.:: :.:. .::::.:::: CCDS51 MKQSSNVPAFLSKLWTLVEETHTNEFITWSQNGQSFLVLDEQRFAKEILPKY 10 20 30 40 50 70 80 90 100 110 pF1KB7 FKHNNMASFVRQLNMYGFRKVVHIEQGGLVKPERDD-TEFQHPCFLRGQEQLLENIKRKV ::::::::::::::::::::::::..: .:: ::: .::::: : .::..::::::::: CCDS51 FKHNNMASFVRQLNMYGFRKVVHIDSG-IVKQERDGPVEFQHPYFKQGQDDLLENIKRKV 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB7 TSVSTLKSEDIKIRQDSVTKLLTDVQLMKGKQECMDSKLLAMKHENEALWREVASLRQKH .: : :. ::::...::.....: .. ::: ..:.: .: :::.::.::. :: :: CCDS51 SSS---KPEENKIRQEDLTKIISSAQKVQIKQETIESRLSELKSENESLWKEVSELRAKH 120 130 140 150 160 180 190 200 210 220 230 pF1KB7 AQQQKVVNKLIQFLISLVQSNRILGVKRKIPLMLNDSGSAHSMPKYSRQFSLEHVHGSGP ::::.:. :..::...:::.:.....::: ::.:: .:. . : : ... . CCDS51 AQQQQVIRKIVQFIVTLVQNNQLVSLKRKRPLLLNTNGAQK---KNLFQHIVKEPTDNHH 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB7 YSAPSPAYSSSSLYAPDAVASSGPIISDIT------ELAPASPMASPGGSIDERPLSSSP ...: .: . : :. :: :.: : :. : .. : :. : CCDS51 HKVP---HSRTEGLKPRERISDDIIIYDVTDDNADEENIPVIPETNEDVISDPSNCSQYP 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB7 LVRVKEEPPSPPQSPRVEEASPGRPSSVDTLLSPTALIDSILRESEPAPASVTALTDARG . . :. .: .. . ..:. ..: : . :. : : .:.. :. . . CCDS51 DIVIVEDDNEDEYAPVIQSGEQNEPAR-ESLSSGS---DG----SSPLMSSAVQLNGSSS 290 300 310 320 330 360 370 380 390 400 410 pF1KB7 HTDTEGRPPSPPPTSTPEKCLS--VACLDKNELSDHLDAMDSNLDNLQTMLSSHGFSVDT : : :.. .. :. . : : :: :.::..: .:...:.:::.. ::.: CCDS51 LT-------SEDPVTMMDSILNDNINLLGKVELLDYLDSIDCSLEDFQAMLSGRQFSIDP 340 350 360 370 380 420 430 440 450 460 470 pF1KB7 SALLDLFSPSVTV-PDMSLPDLDSSLASIQELLSPQEPPRPPEAENSSPDSGKQLVHYTA . :.:::. :: . : . . : ... . : :...:. :::..::: CCDS51 DLLVDLFTSSVQMNPTDYINNTKSENKGLETTKNNVVQPVSEEGRKSKSKPDKQLIQYTA 390 400 410 420 430 440 480 490 500 510 520 pF1KB7 QPLFLLDPGSVDTGSNDLPVLFELGEGSYFSEGDGFAEDPTISLLTGSEPPKAKDPTVS ::. . :. CCDS51 FPLLAFLDGNPASSVEQASTTASSEVLSSVDKPIEVDELLDSSLDPEPTQSKLVRLEPLT 450 460 470 480 490 500 529 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 22:39:31 2016 done: Fri Nov 4 22:39:32 2016 Total Scan time: 3.620 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]