FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB4980, 847 aa
1>>>pF1KB4980 847 - 847 aa - 847 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 8.7198+/-0.00103; mu= 4.6138+/- 0.061
mean_var=174.0875+/-35.339, 0's: 0 Z-trim(109.7): 24 B-trim: 173 in 1/51
Lambda= 0.097205
statistics sampled from 11081 (11098) to 11081 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.698), E-opt: 0.2 (0.341), width: 16
Scan time: 4.310
The best scores are: opt bits E(32554)
CCDS8931.1 STAT6 gene_id:6778|Hs108|chr12 ( 847) 5724 815.7 0
CCDS53804.1 STAT6 gene_id:6778|Hs108|chr12 ( 737) 4983 711.7 1.1e-204
CCDS74067.1 STAT5A gene_id:6776|Hs108|chr17 ( 764) 1466 218.5 3.5e-56
CCDS11423.1 STAT5B gene_id:6777|Hs108|chr17 ( 787) 1461 217.8 5.8e-56
CCDS11424.1 STAT5A gene_id:6776|Hs108|chr17 ( 794) 1461 217.8 5.9e-56
CCDS74066.1 STAT5A gene_id:6776|Hs108|chr17 ( 763) 761 119.6 2e-26
CCDS32657.1 STAT3 gene_id:6774|Hs108|chr17 ( 769) 603 97.5 9.5e-20
CCDS32656.1 STAT3 gene_id:6774|Hs108|chr17 ( 770) 603 97.5 9.5e-20
CCDS59288.1 STAT3 gene_id:6774|Hs108|chr17 ( 722) 595 96.4 2e-19
CCDS2310.1 STAT4 gene_id:6775|Hs108|chr2 ( 748) 563 91.9 4.5e-18
CCDS42793.1 STAT1 gene_id:6772|Hs108|chr2 ( 712) 550 90.0 1.5e-17
CCDS2309.1 STAT1 gene_id:6772|Hs108|chr2 ( 750) 550 90.1 1.6e-17
CCDS55836.1 STAT2 gene_id:6773|Hs108|chr12 ( 847) 530 87.3 1.2e-16
CCDS8917.1 STAT2 gene_id:6773|Hs108|chr12 ( 851) 530 87.3 1.3e-16
>>CCDS8931.1 STAT6 gene_id:6778|Hs108|chr12 (847 aa)
initn: 5724 init1: 5724 opt: 5724 Z-score: 4348.6 bits: 815.7 E(32554): 0
Smith-Waterman score: 5724; 100.0% identity (100.0% similar) in 847 aa overlap (1-847:1-847)
10 20 30 40 50 60
pF1KB4 MSLWGLVSKMPPEKVQRLYVDFPQHLRHLLGDWLESQPWEFLVGSDAFCCNLASALLSDT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 MSLWGLVSKMPPEKVQRLYVDFPQHLRHLLGDWLESQPWEFLVGSDAFCCNLASALLSDT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 VQHLQASVGEQGEGSTILQHISTLESIYQRDPLKLVATFRQILQGEKKAVMEQFRHLPMP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 VQHLQASVGEQGEGSTILQHISTLESIYQRDPLKLVATFRQILQGEKKAVMEQFRHLPMP
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB4 FHWKQEELKFKTGLRRLQHRVGEIHLLREALQKGAEAGQVSLHSLIETPANGTGPSEALA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 FHWKQEELKFKTGLRRLQHRVGEIHLLREALQKGAEAGQVSLHSLIETPANGTGPSEALA
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB4 MLLQETTGELEAAKALVLKRIQIWKRQQQLAGNGAPFEESLAPLQERCESLVDIYSQLQQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 MLLQETTGELEAAKALVLKRIQIWKRQQQLAGNGAPFEESLAPLQERCESLVDIYSQLQQ
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB4 EVGAAGGELEPKTRASLTGRLDEVLRTLVTSCFLVEKQPPQVLKTQTKFQAGVRFLLGLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 EVGAAGGELEPKTRASLTGRLDEVLRTLVTSCFLVEKQPPQVLKTQTKFQAGVRFLLGLR
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB4 FLGAPAKPPLVRADMVTEKQARELSVPQGPGAGAESTGEIINNTVPLENSIPGNCCSALF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 FLGAPAKPPLVRADMVTEKQARELSVPQGPGAGAESTGEIINNTVPLENSIPGNCCSALF
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB4 KNLLLKKIKRCERKGTESVTEEKCAVLFSASFTLGPGKLPIQLQALSLPLVVIVHGNQDN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 KNLLLKKIKRCERKGTESVTEEKCAVLFSASFTLGPGKLPIQLQALSLPLVVIVHGNQDN
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB4 NAKATILWDNAFSEMDRVPFVVAERVPWEKMCETLNLKFMAEVGTNRGLLPEHFLFLAQK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 NAKATILWDNAFSEMDRVPFVVAERVPWEKMCETLNLKFMAEVGTNRGLLPEHFLFLAQK
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB4 IFNDNSLSMEAFQHRSVSWSQFNKEILLGRGFTFWQWFDGVLDLTKRCLRSYWSDRLIIG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 IFNDNSLSMEAFQHRSVSWSQFNKEILLGRGFTFWQWFDGVLDLTKRCLRSYWSDRLIIG
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB4 FISKQYVTSLLLNEPDGTFLLRFSDSEIGGITIAHVIRGQDGSPQIENIQPFSAKDLSIR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 FISKQYVTSLLLNEPDGTFLLRFSDSEIGGITIAHVIRGQDGSPQIENIQPFSAKDLSIR
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB4 SLGDRIRDLAQLKNLYPKKPKDEAFRSHYKPEQMGKDGRGYVPATIKMTVERDQPLPTPE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 SLGDRIRDLAQLKNLYPKKPKDEAFRSHYKPEQMGKDGRGYVPATIKMTVERDQPLPTPE
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB4 LQMPTMVPSYDLGMAPDSSMSMQLGPDMVPQVYPPHSHSIPPYQGLSPEESVNVLSAFQE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 LQMPTMVPSYDLGMAPDSSMSMQLGPDMVPQVYPPHSHSIPPYQGLSPEESVNVLSAFQE
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB4 PHLQMPPSLGQMSLPFDQPHPQGLLPCQPQEHAVSSPDPLLCSDVTMVEDSCLSQPVTAF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 PHLQMPPSLGQMSLPFDQPHPQGLLPCQPQEHAVSSPDPLLCSDVTMVEDSCLSQPVTAF
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB4 PQGTWIGEDIFPPLLPPTEQDLTKLLLEGQGESGGGSLGAQPLLQPSHYGQSGISMSHMD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 PQGTWIGEDIFPPLLPPTEQDLTKLLLEGQGESGGGSLGAQPLLQPSHYGQSGISMSHMD
790 800 810 820 830 840
pF1KB4 LRANPSW
:::::::
CCDS89 LRANPSW
>>CCDS53804.1 STAT6 gene_id:6778|Hs108|chr12 (737 aa)
initn: 4983 init1: 4983 opt: 4983 Z-score: 3787.9 bits: 711.7 E(32554): 1.1e-204
Smith-Waterman score: 4983; 100.0% identity (100.0% similar) in 737 aa overlap (111-847:1-737)
90 100 110 120 130 140
pF1KB4 ISTLESIYQRDPLKLVATFRQILQGEKKAVMEQFRHLPMPFHWKQEELKFKTGLRRLQHR
::::::::::::::::::::::::::::::
CCDS53 MEQFRHLPMPFHWKQEELKFKTGLRRLQHR
10 20 30
150 160 170 180 190 200
pF1KB4 VGEIHLLREALQKGAEAGQVSLHSLIETPANGTGPSEALAMLLQETTGELEAAKALVLKR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 VGEIHLLREALQKGAEAGQVSLHSLIETPANGTGPSEALAMLLQETTGELEAAKALVLKR
40 50 60 70 80 90
210 220 230 240 250 260
pF1KB4 IQIWKRQQQLAGNGAPFEESLAPLQERCESLVDIYSQLQQEVGAAGGELEPKTRASLTGR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 IQIWKRQQQLAGNGAPFEESLAPLQERCESLVDIYSQLQQEVGAAGGELEPKTRASLTGR
100 110 120 130 140 150
270 280 290 300 310 320
pF1KB4 LDEVLRTLVTSCFLVEKQPPQVLKTQTKFQAGVRFLLGLRFLGAPAKPPLVRADMVTEKQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 LDEVLRTLVTSCFLVEKQPPQVLKTQTKFQAGVRFLLGLRFLGAPAKPPLVRADMVTEKQ
160 170 180 190 200 210
330 340 350 360 370 380
pF1KB4 ARELSVPQGPGAGAESTGEIINNTVPLENSIPGNCCSALFKNLLLKKIKRCERKGTESVT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 ARELSVPQGPGAGAESTGEIINNTVPLENSIPGNCCSALFKNLLLKKIKRCERKGTESVT
220 230 240 250 260 270
390 400 410 420 430 440
pF1KB4 EEKCAVLFSASFTLGPGKLPIQLQALSLPLVVIVHGNQDNNAKATILWDNAFSEMDRVPF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 EEKCAVLFSASFTLGPGKLPIQLQALSLPLVVIVHGNQDNNAKATILWDNAFSEMDRVPF
280 290 300 310 320 330
450 460 470 480 490 500
pF1KB4 VVAERVPWEKMCETLNLKFMAEVGTNRGLLPEHFLFLAQKIFNDNSLSMEAFQHRSVSWS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 VVAERVPWEKMCETLNLKFMAEVGTNRGLLPEHFLFLAQKIFNDNSLSMEAFQHRSVSWS
340 350 360 370 380 390
510 520 530 540 550 560
pF1KB4 QFNKEILLGRGFTFWQWFDGVLDLTKRCLRSYWSDRLIIGFISKQYVTSLLLNEPDGTFL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 QFNKEILLGRGFTFWQWFDGVLDLTKRCLRSYWSDRLIIGFISKQYVTSLLLNEPDGTFL
400 410 420 430 440 450
570 580 590 600 610 620
pF1KB4 LRFSDSEIGGITIAHVIRGQDGSPQIENIQPFSAKDLSIRSLGDRIRDLAQLKNLYPKKP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 LRFSDSEIGGITIAHVIRGQDGSPQIENIQPFSAKDLSIRSLGDRIRDLAQLKNLYPKKP
460 470 480 490 500 510
630 640 650 660 670 680
pF1KB4 KDEAFRSHYKPEQMGKDGRGYVPATIKMTVERDQPLPTPELQMPTMVPSYDLGMAPDSSM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 KDEAFRSHYKPEQMGKDGRGYVPATIKMTVERDQPLPTPELQMPTMVPSYDLGMAPDSSM
520 530 540 550 560 570
690 700 710 720 730 740
pF1KB4 SMQLGPDMVPQVYPPHSHSIPPYQGLSPEESVNVLSAFQEPHLQMPPSLGQMSLPFDQPH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 SMQLGPDMVPQVYPPHSHSIPPYQGLSPEESVNVLSAFQEPHLQMPPSLGQMSLPFDQPH
580 590 600 610 620 630
750 760 770 780 790 800
pF1KB4 PQGLLPCQPQEHAVSSPDPLLCSDVTMVEDSCLSQPVTAFPQGTWIGEDIFPPLLPPTEQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 PQGLLPCQPQEHAVSSPDPLLCSDVTMVEDSCLSQPVTAFPQGTWIGEDIFPPLLPPTEQ
640 650 660 670 680 690
810 820 830 840
pF1KB4 DLTKLLLEGQGESGGGSLGAQPLLQPSHYGQSGISMSHMDLRANPSW
:::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 DLTKLLLEGQGESGGGSLGAQPLLQPSHYGQSGISMSHMDLRANPSW
700 710 720 730
>>CCDS74067.1 STAT5A gene_id:6776|Hs108|chr17 (764 aa)
initn: 1439 init1: 936 opt: 1466 Z-score: 1122.1 bits: 218.5 E(32554): 3.5e-56
Smith-Waterman score: 1563; 38.8% identity (66.3% similar) in 762 aa overlap (1-720:1-736)
10 20 30 40 50
pF1KB4 MSLWGLVSKMPPEKVQRLYVDFPQHL----RHLLGDWLESQPWEFLVGSDAFCCNLASAL
:. : .... . .... : . ::. :: :..:.:::::. . .. :. :
CCDS74 MAGWIQAQQLQGDALRQMQVLYGQHFPIEVRHYLAQWIESQPWDAIDLDNPQDRAQATQL
10 20 30 40 50 60
60 70 80 90 100
pF1KB4 LSDTVQHLQASVGEQ-GEGSTILQ----HIST----------LESIYQRDPLKLVATFRQ
: ::.:: .. .: :: . .:. : .: : . ... :.. ::..
CCDS74 LEGLVQELQKKAEHQVGEDGFLLKIKLGHYATQLQCSSPAGILVDAMSQKHLQINQTFEE
70 80 90 100 110 120
110 120 130 140 150
pF1KB4 I--LQGEKKAVMEQFRHLPMPFHWK-QEELKFKTGLRRLQHRVGEIHLLRE-ALQKGAEA
. . . . ...... : . :: :.... . .: . . .: :: :::.
CCDS74 LRLVTQDTENELKKLQQTQEYFIIQYQESLRIQAQFAQLAQLSPQERLSRETALQQ----
130 140 150 160 170
160 170 180 190 200 210
pF1KB4 GQVSLHSLIETPANGTGPSEA-LAMLLQETTGELEAAKALVL--KRIQIWKRQQQLAGNG
::::.. .. :. .. :: :.: :. ....: . :: :::.:::::::
CCDS74 KQVSLEAWLQREAQTLQQYRVELAEKHQKTLQLLRKQQTIILDDELIQ-WKRRQQLAGNG
180 190 200 210 220 230
220 230 240 250 260
pF1KB4 APFEESLAPLQERCESLVDIYSQLQQEVGAA---------GGELEPKTRASLTGRLDEVL
.: : :: :: ::.:..: : .:.. : : .: . : ... . ...
CCDS74 GPPEGSLDVLQSWCEKLAEIIWQNRQQIRRAEHLCQQLPIPGPVE-EMLAEVNATITDII
240 250 260 270 280 290
270 280 290 300 310 320
pF1KB4 RTLVTSCFLVEKQPPQVLKTQTKFQAGVRFLLGLRFLGAPAKPPLVRADMVTEKQARELS
.:::: :..:::::::::::::: : ::.:.: . :.. .:: :.: ...:.::. :
CCDS74 SALVTSTFIIEKQPPQVLKTQTKFAATVRLLVGGK-LNVHMNPPQVKATIISEQQAK--S
300 310 320 330 340 350
330 340 350 360 370 380
pF1KB4 VPQGPGAGAESTGEIINNTVPLENSIPGNCCSALFKNLLLKKIKRCERKGTESVTEEKCA
. .. .. : .:::.:: .: . :: :.:. ::.::: .:.:.::::::: .
CCDS74 LLKNENTRNECSGEILNNCCVMEYHQATGTLSAHFRNMSLKRIKRADRRGAESVTEEKFT
360 370 380 390 400 410
390 400 410 420 430 440
pF1KB4 VLFSASFTLGPGKLPIQLQALSLPLVVIVHGNQDNNAKATILWDNAFSEMDRVPFVVAER
::: ..:..: ..: .:...::::.::::::.::.:: ::.::::::.: ::::.: ..
CCDS74 VLFESQFSVGSNELVFQVKTLSLPVVVIVHGSQDHNATATVLWDNAFAEPGRVPFAVPDK
420 430 440 450 460 470
450 460 470 480 490 500
pF1KB4 VPWEKMCETLNLKFMAEVGTNRGLLPEHFLFLAQKIFNDNSLSMEAFQHRSVSWSQFNKE
: : ..::.::.:: ::: .:::: :...:::::.::..: .: .. ::::::::.:
CCDS74 VLWPQLCEALNMKFKAEVQSNRGLTKENLVFLAQKLFNNSSSHLEDYSGLSVSWSQFNRE
480 490 500 510 520 530
510 520 530 540 550 560
pF1KB4 ILLGRGFTFWQWFDGVLDLTKRCLRSYWSDRLIIGFISKQYVTSLLLNEPDGTFLLRFSD
: : ..:::::::::... :. . .:.: :.::..:: . .::.:.:::::::::::
CCDS74 NLPGWNYTFWQWFDGVMEVLKKHHKPHWNDGAILGFVNKQQAHDLLINKPDGTFLLRFSD
540 550 560 570 580 590
570 580 590 600 610 620
pF1KB4 SEIGGITIAHVIRGQDGSPQ--IENIQPFSAKDLSIRSLGDRIRDLAQLKNLYPKKPKDE
::::::::: . ::. . :..::...:.:::::.::. ::. : ..: .::::
CCDS74 SEIGGITIAW----KFDSPERNLWNLKPFTTRDFSIRSLADRLGDLSYLIYVFPDRPKDE
600 610 620 630 640
630 640 650 660 670 680
pF1KB4 AFRSHYKPEQMGKDGRGYVPATIKMTVERDQPLPTPELQMPTMVPSYDLGMAPDSSMSMQ
.: ..: : ..: ::: ::..: ::. . : : : . . :..
CCDS74 VFSKYYTPV-LAKAVDGYVKPQIKQVV--------PEF----VNASADAGGSSATYMDQA
650 660 670 680 690
690 700 710 720 730
pF1KB4 LGPDMVPQ----VYPPHSHSIPPYQG-LSPEESVNVLSAFQEPHLQMPPSLGQMSLPFDQ
.: . :: .:: . . .: .. .:...: .:
CCDS74 PSPAVCPQAPYNMYPQNPDHVLDQDGEFDLDETMDVARHVEELLRRPMDSLDSRLSPPAG
700 710 720 730 740 750
740 750 760 770 780 790
pF1KB4 PHPQGLLPCQPQEHAVSSPDPLLCSDVTMVEDSCLSQPVTAFPQGTWIGEDIFPPLLPPT
CCDS74 LFTSARGSLS
760
>>CCDS11423.1 STAT5B gene_id:6777|Hs108|chr17 (787 aa)
initn: 1451 init1: 953 opt: 1461 Z-score: 1118.1 bits: 217.8 E(32554): 5.8e-56
Smith-Waterman score: 1566; 39.6% identity (65.1% similar) in 766 aa overlap (22-720:26-771)
10 20 30 40 50
pF1KB4 MSLWGLVSKMPPEKVQRLYVDFPQHLRHLLGDWLESQPWEFLVGSDAFCCNL-ASA
:: ..:: :..:.::: :. : : :. :.
CCDS11 MAVWIQAQQLQGEALHQMQALYGQHFPIEVRHYLSQWIESQAWDS-VDLDNPQENIKATQ
10 20 30 40 50
60 70 80 90 100
pF1KB4 LLSDTVQHLQASVGEQ-GEGSTILQ----HIST-LESIYQRDPLKLVATFRQILQGEKKA
:: ::.:: .. .: :: . .:. : .: :.. :.: :..:: .:.:: .:..
CCDS11 LLEGLVQELQKKAEHQVGEDGFLLKIKLGHYATQLQNTYDRCPMELVRCIRHILYNEQRL
60 70 80 90 100 110
110 120 130
pF1KB4 VMEQ------------------------FRHLPMPFHWKQEELK------------FKTG
: : :..: . . ..::: .. .
CCDS11 VREANNGSSPAGSLADAMSQKHLQINQTFEELRLVTQDTENELKKLQQTQEYFIIQYQES
120 130 140 150 160 170
140 150 160 170 180
pF1KB4 LRRLQHRVGEIHLL--REALQK--GAEAGQVSLHSLIETPANGTGPSEA-LAMLLQETTG
:: .: . : . : .: :.. . . ::::.. .. :. .. :: :.:
CCDS11 LR-IQAQFGPLAQLSPQERLSRETALQQKQVSLEAWLQREAQTLQQYRVELAEKHQKTLQ
180 190 200 210 220 230
190 200 210 220 230 240
pF1KB4 ELEAAKALVLKRIQI-WKRQQQLAGNGAPFEESLAPLQERCESLVDIYSQLQQEVGAA--
:. ....: : :::.:::::::.: : :: :: ::.:..: : .:.. :
CCDS11 LLRKQQTIILDDELIQWKRRQQLAGNGGPPEGSLDVLQSWCEKLAEIIWQNRQQIRRAEH
240 250 260 270 280 290
250 260 270 280 290
pF1KB4 -------GGELEPKTRASLTGRLDEVLRTLVTSCFLVEKQPPQVLKTQTKFQAGVRFLLG
: .: . : ... . ... .:::: :..:::::::::::::: : ::.:.:
CCDS11 LCQQLPIPGPVE-EMLAEVNATITDIISALVTSTFIIEKQPPQVLKTQTKFAATVRLLVG
300 310 320 330 340 350
300 310 320 330 340 350
pF1KB4 LRFLGAPAKPPLVRADMVTEKQARELSVPQGPGAGAESTGEIINNTVPLENSIPGNCCSA
. :.. .:: :.: ...:.::. :. .. .. . .:::.:: .: . ::
CCDS11 GK-LNVHMNPPQVKATIISEQQAK--SLLKNENTRNDYSGEILNNCCVMEYHQATGTLSA
360 370 380 390 400 410
360 370 380 390 400 410
pF1KB4 LFKNLLLKKIKRCERKGTESVTEEKCAVLFSASFTLGPGKLPIQLQALSLPLVVIVHGNQ
:.:. ::.::: .:.:.::::::: ..:: ..:..: ..: .:...::::.::::::.:
CCDS11 HFRNMSLKRIKRSDRRGAESVTEEKFTILFESQFSVGGNELVFQVKTLSLPVVVIVHGSQ
420 430 440 450 460 470
420 430 440 450 460 470
pF1KB4 DNNAKATILWDNAFSEMDRVPFVVAERVPWEKMCETLNLKFMAEVGTNRGLLPEHFLFLA
:::: ::.::::::.: ::::.: ..: : ..::.::.:: ::: .:::: :...:::
CCDS11 DNNATATVLWDNAFAEPGRVPFAVPDKVLWPQLCEALNMKFKAEVQSNRGLTKENLVFLA
480 490 500 510 520 530
480 490 500 510 520 530
pF1KB4 QKIFNDNSLSMEAFQHRSVSWSQFNKEILLGRGFTFWQWFDGVLDLTKRCLRSYWSDRLI
::.::..: .: .. ::::::::.: : ::..:::::::::... :. :. .:.: :
CCDS11 QKLFNNSSSHLEDYSGLSVSWSQFNRENLPGRNYTFWQWFDGVMEVLKKHLKPHWNDGAI
540 550 560 570 580 590
540 550 560 570 580 590
pF1KB4 IGFISKQYVTSLLLNEPDGTFLLRFSDSEIGGITIAHVIRGQDGSPQIENIQPFSAKDLS
.::..:: . .::.:.:::::::::::::::::::: . .:. .. :..::...:.:
CCDS11 LGFVNKQQAHDLLINKPDGTFLLRFSDSEIGGITIAWKFDSQER--MFWNLMPFTTRDFS
600 610 620 630 640 650
600 610 620 630 640 650
pF1KB4 IRSLGDRIRDLAQLKNLYPKKPKDEAFRSHYKP----EQMGKDGRGYVPATIKMTVERDQ
::::.::. :: : ..: .::::.. ..: : .: ::: ::..:
CCDS11 IRSLADRLGDLNYLIYVFPDRPKDEVYSKYYTPVPCESATAKAVDGYVKPQIKQVV----
660 670 680 690 700
660 670 680 690 700
pF1KB4 PLPTPELQMPTMVPSYDLGMAPDSSMSMQLGPDMVPQ----VYPPHSHSIPPYQG-LSPE
::. . : : : . . :.. .: . :: .:: . :. .: .. :
CCDS11 ----PEF----VNASADAGGGSATYMDQAPSPAVCPQAHYNMYPQNPDSVLDTDGDFDLE
710 720 730 740 750 760
710 720 730 740 750 760
pF1KB4 ESVNVLSAFQEPHLQMPPSLGQMSLPFDQPHPQGLLPCQPQEHAVSSPDPLLCSDVTMVE
....: .:
CCDS11 DTMDVARRVEELLGRPMDSQWIPHAQS
770 780
>>CCDS11424.1 STAT5A gene_id:6776|Hs108|chr17 (794 aa)
initn: 1439 init1: 936 opt: 1461 Z-score: 1118.1 bits: 217.8 E(32554): 5.9e-56
Smith-Waterman score: 1562; 39.4% identity (65.3% similar) in 763 aa overlap (22-720:26-766)
10 20 30 40 50
pF1KB4 MSLWGLVSKMPPEKVQRLYVDFPQHLRHLLGDWLESQPWEFLVGSDAFCCNLASAL
:: ..:: :..:.:::::. . .. :. :
CCDS11 MAGWIQAQQLQGDALRQMQVLYGQHFPIEVRHYLAQWIESQPWDAIDLDNPQDRAQATQL
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB4 LSDTVQHLQASVGEQ-GEGSTILQ----HIST-LESIYQRDPLKLVATFRQILQGEKKAV
: ::.:: .. .: :: . .:. : .: :.. :.: ::.:: .:.:: .:.. :
CCDS11 LEGLVQELQKKAEHQVGEDGFLLKIKLGHYATQLQKTYDRCPLELVRCIRHILYNEQRLV
70 80 90 100 110 120
120 130
pF1KB4 MEQ------------------------FRHLPMPFHWKQEELK------------FKTGL
: :..: . . ..::: .. .:
CCDS11 REANNCSSPAGILVDAMSQKHLQINQTFEELRLVTQDTENELKKLQQTQEYFIIQYQESL
130 140 150 160 170 180
140 150 160 170 180
pF1KB4 RRLQHRVGEIHLL--REALQK--GAEAGQVSLHSLIETPANGTGPSEA-LAMLLQETTGE
: .: . ... : .: :.. . . ::::.. .. :. .. :: :.:
CCDS11 R-IQAQFAQLAQLSPQERLSRETALQQKQVSLEAWLQREAQTLQQYRVELAEKHQKTLQL
190 200 210 220 230
190 200 210 220 230 240
pF1KB4 LEAAKALVLKRIQI-WKRQQQLAGNGAPFEESLAPLQERCESLVDIYSQLQQEVGAA---
:. ....: : :::.:::::::.: : :: :: ::.:..: : .:.. :
CCDS11 LRKQQTIILDDELIQWKRRQQLAGNGGPPEGSLDVLQSWCEKLAEIIWQNRQQIRRAEHL
240 250 260 270 280 290
250 260 270 280 290
pF1KB4 ------GGELEPKTRASLTGRLDEVLRTLVTSCFLVEKQPPQVLKTQTKFQAGVRFLLGL
: .: . : ... . ... .:::: :..:::::::::::::: : ::.:.:
CCDS11 CQQLPIPGPVE-EMLAEVNATITDIISALVTSTFIIEKQPPQVLKTQTKFAATVRLLVGG
300 310 320 330 340 350
300 310 320 330 340 350
pF1KB4 RFLGAPAKPPLVRADMVTEKQARELSVPQGPGAGAESTGEIINNTVPLENSIPGNCCSAL
. :.. .:: :.: ...:.::. :. .. .. : .:::.:: .: . ::
CCDS11 K-LNVHMNPPQVKATIISEQQAK--SLLKNENTRNECSGEILNNCCVMEYHQATGTLSAH
360 370 380 390 400 410
360 370 380 390 400 410
pF1KB4 FKNLLLKKIKRCERKGTESVTEEKCAVLFSASFTLGPGKLPIQLQALSLPLVVIVHGNQD
:.:. ::.::: .:.:.::::::: .::: ..:..: ..: .:...::::.::::::.::
CCDS11 FRNMSLKRIKRADRRGAESVTEEKFTVLFESQFSVGSNELVFQVKTLSLPVVVIVHGSQD
420 430 440 450 460 470
420 430 440 450 460 470
pF1KB4 NNAKATILWDNAFSEMDRVPFVVAERVPWEKMCETLNLKFMAEVGTNRGLLPEHFLFLAQ
.:: ::.::::::.: ::::.: ..: : ..::.::.:: ::: .:::: :...::::
CCDS11 HNATATVLWDNAFAEPGRVPFAVPDKVLWPQLCEALNMKFKAEVQSNRGLTKENLVFLAQ
480 490 500 510 520 530
480 490 500 510 520 530
pF1KB4 KIFNDNSLSMEAFQHRSVSWSQFNKEILLGRGFTFWQWFDGVLDLTKRCLRSYWSDRLII
:.::..: .: .. ::::::::.: : : ..:::::::::... :. . .:.: :.
CCDS11 KLFNNSSSHLEDYSGLSVSWSQFNRENLPGWNYTFWQWFDGVMEVLKKHHKPHWNDGAIL
540 550 560 570 580 590
540 550 560 570 580 590
pF1KB4 GFISKQYVTSLLLNEPDGTFLLRFSDSEIGGITIAHVIRGQDGSPQ--IENIQPFSAKDL
::..:: . .::.:.:::::::::::::::::::: . ::. . :..::...:.
CCDS11 GFVNKQQAHDLLINKPDGTFLLRFSDSEIGGITIAWKF----DSPERNLWNLKPFTTRDF
600 610 620 630 640 650
600 610 620 630 640 650
pF1KB4 SIRSLGDRIRDLAQLKNLYPKKPKDEAFRSHYKPEQMGKDGRGYVPATIKMTVERDQPLP
:::::.::. ::. : ..: .::::.: ..: : ..: ::: ::..:
CCDS11 SIRSLADRLGDLSYLIYVFPDRPKDEVFSKYYTPV-LAKAVDGYVKPQIKQVV-------
660 670 680 690 700
660 670 680 690 700 710
pF1KB4 TPELQMPTMVPSYDLGMAPDSSMSMQLGPDMVPQ----VYPPHSHSIPPYQG-LSPEESV
::. . : : : . . :.. .: . :: .:: . . .: .. .:..
CCDS11 -PEF----VNASADAGGSSATYMDQAPSPAVCPQAPYNMYPQNPDHVLDQDGEFDLDETM
710 720 730 740 750
720 730 740 750 760 770
pF1KB4 NVLSAFQEPHLQMPPSLGQMSLPFDQPHPQGLLPCQPQEHAVSSPDPLLCSDVTMVEDSC
.: .:
CCDS11 DVARHVEELLRRPMDSLDSRLSPPAGLFTSARGSLS
760 770 780 790
>>CCDS74066.1 STAT5A gene_id:6776|Hs108|chr17 (763 aa)
initn: 1268 init1: 583 opt: 761 Z-score: 587.8 bits: 119.6 E(32554): 2e-26
Smith-Waterman score: 1341; 35.7% identity (61.5% similar) in 789 aa overlap (1-720:1-735)
10 20 30 40 50
pF1KB4 MSLWGLVSKMPPEKVQRLYVDFPQHL----RHLLGDWLESQPWEFLVGSDAFCCNLASAL
:. : .... . .... : . ::. :: :..:.:::::. . .. :. :
CCDS74 MAGWIQAQQLQGDALRQMQVLYGQHFPIEVRHYLAQWIESQPWDAIDLDNPQDRAQATQL
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB4 LSDTVQHLQASVGEQ-GEGSTILQ----HIST-LESIYQRDPLKLVATFRQILQGEKKAV
: ::.:: .. .: :: . .:. : .: :.. :.: ::.:: .:.:: .:.. :
CCDS74 LEGLVQELQKKAEHQVGEDGFLLKIKLGHYATQLQKTYDRCPLELVRCIRHILYNEQRLV
70 80 90 100 110 120
120 130
pF1KB4 MEQ------------------------FRHLPMPFHWKQEELK------------FKTGL
: :..: . . ..::: .. .:
CCDS74 REANNCSSPAGILVDAMSQKHLQINQTFEELRLVTQDTENELKKLQQTQEYFIIQYQESL
130 140 150 160 170 180
140 150 160 170 180
pF1KB4 RRLQHRVGEIHLL--REALQK--GAEAGQVSLHSLIETPANGTGPSEA-LAMLLQETTGE
: .: . ... : .: :.. . . ::::.. .. :. .. :: :.:
CCDS74 R-IQAQFAQLAQLSPQERLSRETALQQKQVSLEAWLQREAQTLQQYRVELAEKHQKTLQL
190 200 210 220 230
190 200 210 220 230 240
pF1KB4 LEAAKALVL--KRIQIWKRQQQLAGNGAPFEESLAPLQERCESLVDIYSQLQQEVGAA--
:. ....: . :: :::.:::::::.: : :: :: ::.:..: : .:.. :
CCDS74 LRKQQTIILDDELIQ-WKRRQQLAGNGGPPEGSLDVLQSWCEKLAEIIWQNRQQIRRAEH
240 250 260 270 280 290
250 260 270 280 290
pF1KB4 -------GGELEPKTRASLTGRLDEVLRTLVTSCFLVEKQPPQVLKTQTKFQAGVRFLLG
: .: . : ... . ... .:::: :..:::::::::::::: : ::.:.:
CCDS74 LCQQLPIPGPVE-EMLAEVNATITDIISALVTSTFIIEKQPPQVLKTQTKFAATVRLLVG
300 310 320 330 340 350
300 310 320 330 340 350
pF1KB4 LRFLGAPAKPPLVRADMVTEKQARELSVPQGPGAGAESTGEIINNTVPLENSIPGNCCSA
. :.. .:: :.: ...:.::. :. .. .. : .:::.:: .: . ::
CCDS74 GK-LNVHMNPPQVKATIISEQQAK--SLLKNENTRNECSGEILNNCCVMEYHQATGTLSA
360 370 380 390 400 410
360 370 380 390 400 410
pF1KB4 LFKNLLLKKIKRCERKGTESVTEEKCAVLFSASFTLGPGKLPIQLQALSLPLVVIVHGNQ
:.:. ::.::: .:.:.::::::: .::: ..:..: ..: .:...
CCDS74 HFRNMSLKRIKRADRRGAESVTEEKFTVLFESQFSVGSNELVFQVKG-------------
420 430 440 450 460
420 430 440 450 460 470
pF1KB4 DNNAKATILWDNAFSEMDRVPFVVAERVPWEKMCETLNLKFMAEVGTNRGLLPEHFLFLA
::::.: ..: : ..::.::.:: ::: .:::: :...:::
CCDS74 ------------------RVPFAVPDKVLWPQLCEALNMKFKAEVQSNRGLTKENLVFLA
470 480 490 500
480 490 500 510 520 530
pF1KB4 QKIFNDNSLSMEAFQHRSVSWSQFNKEILLGRGFTFWQWFDGVLDLTKRCLRSYWSDRLI
::.::..: .: .. ::::::::.: : : ..:::::::::... :. . .:.: :
CCDS74 QKLFNNSSSHLEDYSGLSVSWSQFNRENLPGWNYTFWQWFDGVMEVLKKHHKPHWNDGAI
510 520 530 540 550 560
540 550 560 570 580 590
pF1KB4 IGFISKQYVTSLLLNEPDGTFLLRFSDSEIGGITIAHVIRGQDGSPQ--IENIQPFSAKD
.::..:: . .::.:.:::::::::::::::::::: . ::. . :..::...:
CCDS74 LGFVNKQQAHDLLINKPDGTFLLRFSDSEIGGITIAW----KFDSPERNLWNLKPFTTRD
570 580 590 600 610
600 610 620 630 640 650
pF1KB4 LSIRSLGDRIRDLAQLKNLYPKKPKDEAFRSHYKPEQMGKDGRGYVPATIKMTVERDQPL
.:::::.::. ::. : ..: .::::.: ..: : ..: ::: ::..:
CCDS74 FSIRSLADRLGDLSYLIYVFPDRPKDEVFSKYYTPV-LAKAVDGYVKPQIKQVV------
620 630 640 650 660 670
660 670 680 690 700 710
pF1KB4 PTPELQMPTMVPSYDLGMAPDSSMSMQLGPDMVPQ----VYPPHSHSIPPYQG-LSPEES
::. . : : : . . :.. .: . :: .:: . . .: .. .:.
CCDS74 --PEF----VNASADAGGSSATYMDQAPSPAVCPQAPYNMYPQNPDHVLDQDGEFDLDET
680 690 700 710 720
720 730 740 750 760 770
pF1KB4 VNVLSAFQEPHLQMPPSLGQMSLPFDQPHPQGLLPCQPQEHAVSSPDPLLCSDVTMVEDS
..: .:
CCDS74 MDVARHVEELLRRPMDSLDSRLSPPAGLFTSARGSLS
730 740 750 760
>>CCDS32657.1 STAT3 gene_id:6774|Hs108|chr17 (769 aa)
initn: 490 init1: 230 opt: 603 Z-score: 468.0 bits: 97.5 E(32554): 9.5e-20
Smith-Waterman score: 724; 29.2% identity (57.4% similar) in 699 aa overlap (13-632:16-690)
10 20 30 40 50
pF1KB4 MSLWGLVSKMPPEKVQRLYVD-FPQHLRHLLGDWLESQPWEFLVGSDAFCCNLASAL
:....:: : ::..::..:. :.::: : . ..... . :
CCDS32 MAQWNQLQQLDTRYLEQLHQLYSDSFPMELRQFLAPWIESQDWAYAASKESHATLVFHNL
10 20 30 40 50 60
60 70 80 90 100
pF1KB4 LSDTVQHLQASVGEQGEGSTILQHI-----STLESIYQRDPL---KLVATF----RQILQ
:.. : : : : :.... :: . :.: : . :. ..:: ..::
CCDS32 LGEIDQ--QYSRFLQ-ESNVLYQHNLRRIKQFLQSRYLEKPMEIARIVARCLWEESRLLQ
70 80 90 100 110
110 120 130 140 150
pF1KB4 GEKKAVME--QFRHLPMPFHWKQEELKFKTGLRRLQHRVGEIHL---LREALQKGAEAGQ
:... : : : ... .. :. ...:: ... . : :: . .
CCDS32 TAATAAQQGGQANH-PTAAVVTEKQQMLEQHLQDVRKRVQDLEQKMKVVENLQDDFDFNY
120 130 140 150 160 170
160 170 180 190
pF1KB4 VSLHSLIETPA-NGTGPS------EALAMLL-----------QETTGELEAA----KALV
.:.: . ::.. : . : ..: .: .: : : :.:.
CCDS32 KTLKSQGDMQDLNGNNQSVTRQKMQQLEQMLTALDQMRRSIVSELAGLLSAMEYVQKTLT
180 190 200 210 220 230
200 210 220 230 240
pF1KB4 LKRIQIWKRQQQLAGNGAP-------FEE---SLAPLQERCESLVDIYSQLQQEVGAAGG
... :::.::.: :.: .:. ::: : . .. . .:::.:. :
CCDS32 DEELADWKRRQQIACIGGPPNICLDRLENWITSLAESQLQTRQQIKKLEELQQKVSYKGD
240 250 260 270 280 290
250 260 270 280 290
pF1KB4 ELEPKTRASLTGRLDEVLRTLVTSCFLVEKQP--------PQVLKTQTKFQAGVRFLLGL
. . : : :. :..:.:. : :.::.:: : :.:: ..: . ::.: .
CCDS32 PIV-QHRPMLEERIVELFRNLMKSAFVVERQPCMPMHPDRPLVIKTGVQFTTKVRLL--V
300 310 320 330 340 350
300 310 320 330 340 350
pF1KB4 RFLGAPAKPPLVRADMVTEKQARELSVPQGPGA-GAESTGEIINNTVPLENSIPGNCCSA
.: : .. . .:.. .... .: . .:. . : .:.: :. ::
CCDS32 KF---PELNYQLKIKVCIDKDSGDVAALRGSRKFNILGTNTKVMN---MEESNNGSL-SA
360 370 380 390 400
360 370 380 390 400 410
pF1KB4 LFKNLLLKKIKRCERKGTES------VTEEKCAVLF-SASFTLGPGKLPIQLQALSLPLV
::.: :.. .:: : . :::: . : . . : : :.:.. :::.:
CCDS32 EFKHLTLRE-QRCGNGGRANCDASLIVTEELHLITFETEVYHQG---LKIDLETHSLPVV
410 420 430 440 450 460
420 430 440 450 460
pF1KB4 VIVHGNQDNNAKATILWDNAFSEMDR-VPFVVAERV-PWEKMCETLNLKFMAEVGTNRGL
:: . : :: :.::: : ... . : : . . :... :.:. .: . :.:::
CCDS32 VISNICQMPNAWASILWYNMLTNNPKNVNFFTKPPIGTWDQVAEVLSWQFSST--TKRGL
470 480 490 500 510 520
470 480 490 500 510 520
pF1KB4 LPEHFLFLAQKIFNDNSLSMEAFQHRSVSWSQFNKEILLGRGFTFWQWFDGVLDLTKRCL
:.. ::.:... . ... . : ..:..: :: . :.::.:: :.:...::.:. .
CCDS32 SIEQLTTLAEKLLGPG-VNYSGCQ---ITWAKFCKENMAGKGFSFWVWLDNIIDLVKKYI
530 540 550 560 570
530 540 550 560 570 580
pF1KB4 RSYWSDRLIIGFISKQYVTSLLLNEPDGTFLLRFSDS-EIGGITIAHVIRGQDGSPQIEN
. :.. :.:::::. ..: ..: ::::::::.: . ::.:.. : . .:. ::..
CCDS32 LALWNEGYIMGFISKERERAILSTKPPGTFLLRFSESSKEGGVTFTWVEKDISGKTQIQS
580 590 600 610 620 630
590 600 610 620 630
pF1KB4 IQPFSAKDLSIRS-----LGDRIRD-----LAQLKNLYPKKPKDEAFRSHYKPEQMGKDG
..:.. ..:. : .: .: : .. : ::: ::.::: .. .::
CCDS32 VEPYTKQQLNNMSFAEIIMGYKIMDATNILVSPLVYLYPDIPKEEAFGKYCRPESQEHPE
640 650 660 670 680 690
640 650 660 670 680 690
pF1KB4 RGYVPATIKMTVERDQPLPTPELQMPTMVPSYDLGMAPDSSMSMQLGPDMVPQVYPPHSH
CCDS32 ADPGAAPYLKTKFICVTPTTCSNTIDLPMSPRTLDSLMQFGNNGEGAEPSAGGQFESLTF
700 710 720 730 740 750
>>CCDS32656.1 STAT3 gene_id:6774|Hs108|chr17 (770 aa)
initn: 490 init1: 230 opt: 603 Z-score: 468.0 bits: 97.5 E(32554): 9.5e-20
Smith-Waterman score: 727; 28.7% identity (56.3% similar) in 753 aa overlap (13-685:16-738)
10 20 30 40 50
pF1KB4 MSLWGLVSKMPPEKVQRLYVD-FPQHLRHLLGDWLESQPWEFLVGSDAFCCNLASAL
:....:: : ::..::..:. :.::: : . ..... . :
CCDS32 MAQWNQLQQLDTRYLEQLHQLYSDSFPMELRQFLAPWIESQDWAYAASKESHATLVFHNL
10 20 30 40 50 60
60 70 80 90 100
pF1KB4 LSDTVQHLQASVGEQGEGSTILQHI-----STLESIYQRDPL---KLVATF----RQILQ
:.. : : : : :.... :: . :.: : . :. ..:: ..::
CCDS32 LGEIDQ--QYSRFLQ-ESNVLYQHNLRRIKQFLQSRYLEKPMEIARIVARCLWEESRLLQ
70 80 90 100 110
110 120 130 140 150
pF1KB4 GEKKAVME--QFRHLPMPFHWKQEELKFKTGLRRLQHRVGEIHL---LREALQKGAEAGQ
:... : : : ... .. :. ...:: ... . : :: . .
CCDS32 TAATAAQQGGQANH-PTAAVVTEKQQMLEQHLQDVRKRVQDLEQKMKVVENLQDDFDFNY
120 130 140 150 160 170
160 170 180 190
pF1KB4 VSLHSLIETPA-NGTGPS------EALAMLL-----------QETTGELEAA----KALV
.:.: . ::.. : . : ..: .: .: : : :.:.
CCDS32 KTLKSQGDMQDLNGNNQSVTRQKMQQLEQMLTALDQMRRSIVSELAGLLSAMEYVQKTLT
180 190 200 210 220 230
200 210 220 230 240
pF1KB4 LKRIQIWKRQQQLAGNGAP-------FEE---SLAPLQERCESLVDIYSQLQQEVGAAGG
... :::.::.: :.: .:. ::: : . .. . .:::.:. :
CCDS32 DEELADWKRRQQIACIGGPPNICLDRLENWITSLAESQLQTRQQIKKLEELQQKVSYKGD
240 250 260 270 280 290
250 260 270 280 290
pF1KB4 ELEPKTRASLTGRLDEVLRTLVTSCFLVEKQP--------PQVLKTQTKFQAGVRFLLGL
. . : : :. :..:.:. : :.::.:: : :.:: ..: . ::.:.
CCDS32 PIV-QHRPMLEERIVELFRNLMKSAFVVERQPCMPMHPDRPLVIKTGVQFTTKVRLLV--
300 310 320 330 340 350
300 310 320 330 340 350
pF1KB4 RFLGAPAKPPLVRADMVTEKQARELSVPQGPGA-GAESTGEIINNTVPLENSIPGNCCSA
.: : .. . .:.. .... .: . .:. . : .:.: :. ::
CCDS32 KF---PELNYQLKIKVCIDKDSGDVAALRGSRKFNILGTNTKVMN---MEESNNGSL-SA
360 370 380 390 400
360 370 380 390 400 410
pF1KB4 LFKNLLLKKIKRCERKGTES------VTEEKCAVLF-SASFTLGPGKLPIQLQALSLPLV
::.: :.. .:: : . :::: . : . . : : :.:.. :::.:
CCDS32 EFKHLTLRE-QRCGNGGRANCDASLIVTEELHLITFETEVYHQG---LKIDLETHSLPVV
410 420 430 440 450 460
420 430 440 450 460
pF1KB4 VIVHGNQDNNAKATILWDNAFSEMDR-VPFVVAERV-PWEKMCETLNLKFMAEVGTNRGL
:: . : :: :.::: : ... . : : . . :... :.:. .: . :.:::
CCDS32 VISNICQMPNAWASILWYNMLTNNPKNVNFFTKPPIGTWDQVAEVLSWQFSST--TKRGL
470 480 490 500 510 520
470 480 490 500 510 520
pF1KB4 LPEHFLFLAQKIFNDNSLSMEAFQHRSVSWSQFNKEILLGRGFTFWQWFDGVLDLTKRCL
:.. ::.:... . ... . : ..:..: :: . :.::.:: :.:...::.:. .
CCDS32 SIEQLTTLAEKLLGPG-VNYSGCQ---ITWAKFCKENMAGKGFSFWVWLDNIIDLVKKYI
530 540 550 560 570
530 540 550 560 570 580
pF1KB4 RSYWSDRLIIGFISKQYVTSLLLNEPDGTFLLRFSDS-EIGGITIAHVIRGQDGSPQIEN
. :.. :.:::::. ..: ..: ::::::::.: . ::.:.. : . .:. ::..
CCDS32 LALWNEGYIMGFISKERERAILSTKPPGTFLLRFSESSKEGGVTFTWVEKDISGKTQIQS
580 590 600 610 620 630
590 600 610 620 630
pF1KB4 IQPFSAKDLSIRS-----LGDRIRD-----LAQLKNLYPKKPKDEAFRSHYKPEQMGKDG
..:.. ..:. : .: .: : .. : ::: ::.::: .. .::. ..
CCDS32 VEPYTKQQLNNMSFAEIIMGYKIMDATNILVSPLVYLYPDIPKEEAFGKYCRPES--QEH
640 650 660 670 680 690
640 650 660 670 680 690
pF1KB4 RGYVPATIKMTVERDQPLPTPELQMPTMVPSYDLGMAPDSSMS-MQLGPDMVPQVYPPHS
:.. .. :: : . :: :.: . : ::.:
CCDS32 PEADPGSAAPYLKTKFICVTP----TTCSNTIDLPMSPRTLDSLMQFGNNGEGAEPSAGG
700 710 720 730 740 750
700 710 720 730 740 750
pF1KB4 HSIPPYQGLSPEESVNVLSAFQEPHLQMPPSLGQMSLPFDQPHPQGLLPCQPQEHAVSSP
CCDS32 QFESLTFDMELTSECATSPM
760 770
>>CCDS59288.1 STAT3 gene_id:6774|Hs108|chr17 (722 aa)
initn: 490 init1: 230 opt: 595 Z-score: 462.3 bits: 96.4 E(32554): 2e-19
Smith-Waterman score: 724; 29.2% identity (57.4% similar) in 699 aa overlap (13-632:16-690)
10 20 30 40 50
pF1KB4 MSLWGLVSKMPPEKVQRLYVD-FPQHLRHLLGDWLESQPWEFLVGSDAFCCNLASAL
:....:: : ::..::..:. :.::: : . ..... . :
CCDS59 MAQWNQLQQLDTRYLEQLHQLYSDSFPMELRQFLAPWIESQDWAYAASKESHATLVFHNL
10 20 30 40 50 60
60 70 80 90 100
pF1KB4 LSDTVQHLQASVGEQGEGSTILQHI-----STLESIYQRDPL---KLVATF----RQILQ
:.. : : : : :.... :: . :.: : . :. ..:: ..::
CCDS59 LGEIDQ--QYSRFLQ-ESNVLYQHNLRRIKQFLQSRYLEKPMEIARIVARCLWEESRLLQ
70 80 90 100 110
110 120 130 140 150
pF1KB4 GEKKAVME--QFRHLPMPFHWKQEELKFKTGLRRLQHRVGEIHL---LREALQKGAEAGQ
:... : : : ... .. :. ...:: ... . : :: . .
CCDS59 TAATAAQQGGQANH-PTAAVVTEKQQMLEQHLQDVRKRVQDLEQKMKVVENLQDDFDFNY
120 130 140 150 160 170
160 170 180 190
pF1KB4 VSLHSLIETPA-NGTGPS------EALAMLL-----------QETTGELEAA----KALV
.:.: . ::.. : . : ..: .: .: : : :.:.
CCDS59 KTLKSQGDMQDLNGNNQSVTRQKMQQLEQMLTALDQMRRSIVSELAGLLSAMEYVQKTLT
180 190 200 210 220 230
200 210 220 230 240
pF1KB4 LKRIQIWKRQQQLAGNGAP-------FEE---SLAPLQERCESLVDIYSQLQQEVGAAGG
... :::.::.: :.: .:. ::: : . .. . .:::.:. :
CCDS59 DEELADWKRRQQIACIGGPPNICLDRLENWITSLAESQLQTRQQIKKLEELQQKVSYKGD
240 250 260 270 280 290
250 260 270 280 290
pF1KB4 ELEPKTRASLTGRLDEVLRTLVTSCFLVEKQP--------PQVLKTQTKFQAGVRFLLGL
. . : : :. :..:.:. : :.::.:: : :.:: ..: . ::.: .
CCDS59 PIV-QHRPMLEERIVELFRNLMKSAFVVERQPCMPMHPDRPLVIKTGVQFTTKVRLL--V
300 310 320 330 340 350
300 310 320 330 340 350
pF1KB4 RFLGAPAKPPLVRADMVTEKQARELSVPQGPGA-GAESTGEIINNTVPLENSIPGNCCSA
.: : .. . .:.. .... .: . .:. . : .:.: :. ::
CCDS59 KF---PELNYQLKIKVCIDKDSGDVAALRGSRKFNILGTNTKVMN---MEESNNGSL-SA
360 370 380 390 400
360 370 380 390 400 410
pF1KB4 LFKNLLLKKIKRCERKGTES------VTEEKCAVLF-SASFTLGPGKLPIQLQALSLPLV
::.: :.. .:: : . :::: . : . . : : :.:.. :::.:
CCDS59 EFKHLTLRE-QRCGNGGRANCDASLIVTEELHLITFETEVYHQG---LKIDLETHSLPVV
410 420 430 440 450 460
420 430 440 450 460
pF1KB4 VIVHGNQDNNAKATILWDNAFSEMDR-VPFVVAERV-PWEKMCETLNLKFMAEVGTNRGL
:: . : :: :.::: : ... . : : . . :... :.:. .: . :.:::
CCDS59 VISNICQMPNAWASILWYNMLTNNPKNVNFFTKPPIGTWDQVAEVLSWQFSST--TKRGL
470 480 490 500 510 520
470 480 490 500 510 520
pF1KB4 LPEHFLFLAQKIFNDNSLSMEAFQHRSVSWSQFNKEILLGRGFTFWQWFDGVLDLTKRCL
:.. ::.:... . ... . : ..:..: :: . :.::.:: :.:...::.:. .
CCDS59 SIEQLTTLAEKLLGPG-VNYSGCQ---ITWAKFCKENMAGKGFSFWVWLDNIIDLVKKYI
530 540 550 560 570
530 540 550 560 570 580
pF1KB4 RSYWSDRLIIGFISKQYVTSLLLNEPDGTFLLRFSDS-EIGGITIAHVIRGQDGSPQIEN
. :.. :.:::::. ..: ..: ::::::::.: . ::.:.. : . .:. ::..
CCDS59 LALWNEGYIMGFISKERERAILSTKPPGTFLLRFSESSKEGGVTFTWVEKDISGKTQIQS
580 590 600 610 620 630
590 600 610 620 630
pF1KB4 IQPFSAKDLSIRS-----LGDRIRD-----LAQLKNLYPKKPKDEAFRSHYKPEQMGKDG
..:.. ..:. : .: .: : .. : ::: ::.::: .. .::
CCDS59 VEPYTKQQLNNMSFAEIIMGYKIMDATNILVSPLVYLYPDIPKEEAFGKYCRPESQEHPE
640 650 660 670 680 690
640 650 660 670 680 690
pF1KB4 RGYVPATIKMTVERDQPLPTPELQMPTMVPSYDLGMAPDSSMSMQLGPDMVPQVYPPHSH
CCDS59 ADPGSAAPYLKTKFICVTPFIDAVWK
700 710 720
>>CCDS2310.1 STAT4 gene_id:6775|Hs108|chr2 (748 aa)
initn: 553 init1: 311 opt: 563 Z-score: 437.9 bits: 91.9 E(32554): 4.5e-18
Smith-Waterman score: 747; 28.1% identity (57.5% similar) in 741 aa overlap (13-669:16-723)
10 20 30 40 50
pF1KB4 MSLWGLVSKMPPEKVQRLYVD-FPQHLRHLLGDWLESQPWEFLVGSDAFCCNLASAL
:.:...: : ::...::::..:.:.: :: .... .:. :
CCDS23 MSQWNQVQQLEIKFLEQVDQFYDDNFPMEIRHLLAQWIENQDWEAASNNET----MATIL
10 20 30 40 50
60 70 80 90 100 110
pF1KB4 LSDTVQHLQASVGE-QGEGSTILQHI-----STLESIYQRDPLKLVATFRQILQGEKKAV
:.. . .:. ..:. . : . .: : ..:.. .. .:....... . :. :.. .
CCDS23 LQNLLIQLDEQLGRVSKEKNLLLIHNLKRIRKVLQGKFHGNPMHVAVVISNCLREERRIL
60 70 80 90 100 110
120 130 140 150 160
pF1KB4 MEQFRHLPMPFHWKQEELKFKTGLRRLQHRVGEIH---LLREALQKGAEAGQ-------V
. :.. . . . . : ..:.:. :. . : : : :
CCDS23 AAANMPVQGPLEKSLQSSSVSERQRNVEHKVAAIKNSVQMTEQDTKYLEDLQDEFDYRYK
120 130 140 150 160 170
170 180 190 200
pF1KB4 SLHSLIETPANGTGPSEALAMLLQETTGELEAAK-------------------ALVLKRI
..... .. :.. .. . . ::: . :. . .......
CCDS23 TIQTMDQSDKNSAMVNQEV-LTLQEMLNSLDFKRKEALSKMTQIIHETDLLMNTMLIEEL
180 190 200 210 220 230
210 220 230 240 250
pF1KB4 QIWKRQQQLAGNGAPFEESLAPLQERC-----ESLVDIYSQL-----QQEVGAAGGELEP
: :::.::.: :.:....: ::. : ::: .. :: :. . :. :
CCDS23 QDWKRRQQIACIGGPLHNGLDQLQN-CFTLLAESLFQLRRQLEKLEEQSTKMTYEGDPIP
240 250 260 270 280 290
260 270 280 290 300
pF1KB4 KTRASLTGRLDEVLRTLVTSCFLVEKQP--------PQVLKTQTKFQAGVRFLLGLRFLG
:. . :. .. .: . :.::.:: : :::: .: . .:.:. : :.
CCDS23 MQRTHMLERVTFLIYNLFKNSFVVERQPCMPTHPQRPLVLKTLIQFTVKLRLLIKLPELN
300 310 320 330 340 350
310 320 330 340 350
pF1KB4 APAKPPLVRADMVTEKQARELS----VPQGPGAGAESTGEIINNTVPLENSIPGNCCSAL
.: :.:.. .:.. :: : : .. : : : :... .:
CCDS23 YQVK---VKASI--DKNVSTLSNRRFVLCGTNVKAMSIEESSNGSLSVE-----------
360 370 380 390
360 370 380 390 400 410
pF1KB4 FKNLLLKKIKRCER-KGTES---VTEEKCAVLFSASFTLGPGKLPIQLQALSLPLVVIVH
:..: :..: ::.:. :::: .. : ... : : :.:.. :::.:.: .
CCDS23 FRHLQPKEMKSSAGGKGNEGCHMVTEELHSITFETQICLYG--LTIDLETSSLPVVMISN
400 410 420 430 440 450
420 430 440 450 460 470
pF1KB4 GNQDNNAKATILWDNAFSEMDRVPFVVAERVP---WEKMCETLNLKFMAEVGTNRGLLPE
.: :: :.:.: :. : : .: . : .. :... .: . :: ::: .
CCDS23 VSQLPNAWASIIWYNV-STNDSQNLVFFNNPPPATLSQLLEVMSWQFSSYVG--RGLNSD
460 470 480 490 500 510
480 490 500 510 520 530
pF1KB4 HFLFLAQKIFNDNSLSMEAFQHRSVSWSQFNKEILLGRGFTFWQWFDGVLDLTKRCLRSY
.. .::.:. ..: : ..:..: :: : :..:::: :....::: :. .
CCDS23 QLHMLAEKLTVQSSYS-----DGHLTWAKFCKEHLPGKSFTFWTWLEAILDLIKKHILPL
520 530 540 550 560
540 550 560 570 580 590
pF1KB4 WSDRLIIGFISKQYVTSLLLNEPDGTFLLRFSDSEIGGITIAHVIRGQDGSPQIENIQPF
: : ..::.::. :: .. ::::::::.:..::::.. : ....: ......:.
CCDS23 WIDGYVMGFVSKEKERLLLKDKMPGTFLLRFSESHLGGITFTWVDHSESGEVRFHSVEPY
570 580 590 600 610 620
600 610 620 630
pF1KB4 SAKDLSIRSLGDRIRD----LAQ------LKNLYPKKPKDEAFRSHY--KPEQMGKD---
. :: ..: .:: .:. :: ::: :::.:: .:: .: ....
CCDS23 NKGRLSALPFADILRDYKVIMAENIPENPLKYLYPDIPKDKAFGKHYSSQPCEVSRPTER
630 640 650 660 670 680
640 650 660 670 680 690
pF1KB4 -GRGYVPAT-IKM-TVERDQPLP-TPELQMPTMVPSYDLGMAPDSSMSMQLGPDMVPQVY
.::::.. : . :.. :. : .: .: : ::
CCDS23 GDKGYVPSVFIPISTIRSDSTEPHSPSDLLP-MSPSVYAVLRENLSPTTIETAMKSPYSA
690 700 710 720 730 740
700 710 720 730 740 750
pF1KB4 PPHSHSIPPYQGLSPEESVNVLSAFQEPHLQMPPSLGQMSLPFDQPHPQGLLPCQPQEHA
CCDS23 E
847 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 15:39:36 2016 done: Thu Nov 3 15:39:37 2016
Total Scan time: 4.310 Total Display time: 0.260
Function used was FASTA [36.3.4 Apr, 2011]