FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB4506, 655 aa
1>>>pF1KB4506 655 - 655 aa - 655 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 11.3170+/-0.00116; mu= -3.5252+/- 0.070
mean_var=490.2077+/-100.678, 0's: 0 Z-trim(115.9): 101 B-trim: 0 in 0/52
Lambda= 0.057927
statistics sampled from 16420 (16519) to 16420 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.774), E-opt: 0.2 (0.507), width: 16
Scan time: 4.210
The best scores are: opt bits E(32554)
CCDS54513.1 EWSR1 gene_id:2130|Hs108|chr22 ( 655) 4722 409.3 8.5e-114
CCDS13851.1 EWSR1 gene_id:2130|Hs108|chr22 ( 656) 4710 408.3 1.7e-113
CCDS13852.2 EWSR1 gene_id:2130|Hs108|chr22 ( 661) 4700 407.5 3.1e-113
CCDS54514.1 EWSR1 gene_id:2130|Hs108|chr22 ( 600) 3583 314.1 3.6e-85
CCDS54512.1 EWSR1 gene_id:2130|Hs108|chr22 ( 354) 2226 200.4 3.5e-51
CCDS10707.1 FUS gene_id:2521|Hs108|chr16 ( 526) 1060 103.2 9.9e-22
CCDS58454.1 FUS gene_id:2521|Hs108|chr16 ( 525) 1059 103.1 1e-21
CCDS59279.1 TAF15 gene_id:8148|Hs108|chr17 ( 589) 998 98.0 3.9e-20
CCDS32623.1 TAF15 gene_id:8148|Hs108|chr17 ( 592) 989 97.3 6.5e-20
>>CCDS54513.1 EWSR1 gene_id:2130|Hs108|chr22 (655 aa)
initn: 4722 init1: 4722 opt: 4722 Z-score: 2156.5 bits: 409.3 E(32554): 8.5e-114
Smith-Waterman score: 4722; 100.0% identity (100.0% similar) in 655 aa overlap (1-655:1-655)
10 20 30 40 50 60
pF1KB4 MASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTAT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 MASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTAT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 YGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 YGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB4 QPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 QPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYP
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB4 MQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 MQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSY
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB4 PPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 PPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNR
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB4 GRGRGGFDRGGMSRGGRGGGRGGMGAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 GRGRGGFDRGGMSRGGRGGGRGGMGAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNS
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB4 AIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 AIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPP
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB4 TAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 TAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPG
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB4 GPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 GPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECN
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB4 QCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 QCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRG
550 560 570 580 590 600
610 620 630 640 650
pF1KB4 GRGMDRGGFGGGRRGGPGGPPGPLMEQMGGRRGGRGGPGKMDKGEHRQERRDRPY
:::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 GRGMDRGGFGGGRRGGPGGPPGPLMEQMGGRRGGRGGPGKMDKGEHRQERRDRPY
610 620 630 640 650
>>CCDS13851.1 EWSR1 gene_id:2130|Hs108|chr22 (656 aa)
initn: 2626 init1: 2508 opt: 4710 Z-score: 2151.0 bits: 408.3 E(32554): 1.7e-113
Smith-Waterman score: 4710; 99.8% identity (99.8% similar) in 656 aa overlap (1-655:1-656)
10 20 30 40 50 60
pF1KB4 MASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTAT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 MASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTAT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 YGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 YGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB4 QPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 QPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYP
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB4 MQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 MQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSY
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB4 PPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 PPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNR
250 260 270 280 290 300
310 320 330 340 350
pF1KB4 GRGRGGFDRGGMSRGGRGGGRGGMG-AGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDN
::::::::::::::::::::::::: ::::::::::::::::::::::::::::::::::
CCDS13 GRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDN
310 320 330 340 350 360
360 370 380 390 400 410
pF1KB4 SAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 SAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDP
370 380 390 400 410 420
420 430 440 450 460 470
pF1KB4 PTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 PTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGP
430 440 450 460 470 480
480 490 500 510 520 530
pF1KB4 GGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTEC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 GGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTEC
490 500 510 520 530 540
540 550 560 570 580 590
pF1KB4 NQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 NQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFR
550 560 570 580 590 600
600 610 620 630 640 650
pF1KB4 GGRGMDRGGFGGGRRGGPGGPPGPLMEQMGGRRGGRGGPGKMDKGEHRQERRDRPY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 GGRGMDRGGFGGGRRGGPGGPPGPLMEQMGGRRGGRGGPGKMDKGEHRQERRDRPY
610 620 630 640 650
>>CCDS13852.2 EWSR1 gene_id:2130|Hs108|chr22 (661 aa)
initn: 4239 init1: 4239 opt: 4700 Z-score: 2146.5 bits: 407.5 E(32554): 3.1e-113
Smith-Waterman score: 4700; 99.1% identity (99.1% similar) in 661 aa overlap (1-655:1-661)
10 20 30 40 50 60
pF1KB4 MASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTAT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 MASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTAT
10 20 30 40 50 60
70 80 90 100 110
pF1KB4 YGQTAYATSYGQPPT------GYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAA
::::::::::::::: :::::::::::::::::::::::::::::::::::::::
CCDS13 YGQTAYATSYGQPPTVEGTSTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAA
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB4 QSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 QSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQ
130 140 150 160 170 180
180 190 200 210 220 230
pF1KB4 VPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 VPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQ
190 200 210 220 230 240
240 250 260 270 280 290
pF1KB4 QPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 QPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSM
250 260 270 280 290 300
300 310 320 330 340 350
pF1KB4 SGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGAGERGGFNKPGGPMDEGPDLDLGPPVDPD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 SGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGAGERGGFNKPGGPMDEGPDLDLGPPVDPD
310 320 330 340 350 360
360 370 380 390 400 410
pF1KB4 EDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 EDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATV
370 380 390 400 410 420
420 430 440 450 460 470
pF1KB4 SYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 SYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPG
430 440 450 460 470 480
480 490 500 510 520 530
pF1KB4 GPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 GPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFA
490 500 510 520 530 540
540 550 560 570 580 590
pF1KB4 WRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 WRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGD
550 560 570 580 590 600
600 610 620 630 640 650
pF1KB4 RGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQMGGRRGGRGGPGKMDKGEHRQERRDRP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 RGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQMGGRRGGRGGPGKMDKGEHRQERRDRP
610 620 630 640 650 660
pF1KB4 Y
:
CCDS13 Y
>>CCDS54514.1 EWSR1 gene_id:2130|Hs108|chr22 (600 aa)
initn: 3429 init1: 2508 opt: 3583 Z-score: 1642.5 bits: 314.1 E(32554): 3.6e-85
Smith-Waterman score: 4183; 91.3% identity (91.3% similar) in 656 aa overlap (1-655:1-600)
10 20 30 40 50 60
pF1KB4 MASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTAT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 MASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTAT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 YGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 YGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB4 QPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYP
:::::::::::::::::
CCDS54 QPAYPAYGQQPAATAPT-------------------------------------------
130
190 200 210 220 230 240
pF1KB4 MQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSY
:::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 -------------SYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSY
140 150 160 170 180
250 260 270 280 290 300
pF1KB4 PPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 PPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNR
190 200 210 220 230 240
310 320 330 340 350
pF1KB4 GRGRGGFDRGGMSRGGRGGGRGGMG-AGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDN
::::::::::::::::::::::::: ::::::::::::::::::::::::::::::::::
CCDS54 GRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDN
250 260 270 280 290 300
360 370 380 390 400 410
pF1KB4 SAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 SAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDP
310 320 330 340 350 360
420 430 440 450 460 470
pF1KB4 PTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 PTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGP
370 380 390 400 410 420
480 490 500 510 520 530
pF1KB4 GGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTEC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 GGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTEC
430 440 450 460 470 480
540 550 560 570 580 590
pF1KB4 NQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 NQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFR
490 500 510 520 530 540
600 610 620 630 640 650
pF1KB4 GGRGMDRGGFGGGRRGGPGGPPGPLMEQMGGRRGGRGGPGKMDKGEHRQERRDRPY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 GGRGMDRGGFGGGRRGGPGGPPGPLMEQMGGRRGGRGGPGKMDKGEHRQERRDRPY
550 560 570 580 590 600
>>CCDS54512.1 EWSR1 gene_id:2130|Hs108|chr22 (354 aa)
initn: 2226 init1: 2226 opt: 2226 Z-score: 1032.3 bits: 200.4 E(32554): 3.5e-51
Smith-Waterman score: 2226; 100.0% identity (100.0% similar) in 325 aa overlap (1-325:1-325)
10 20 30 40 50 60
pF1KB4 MASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTAT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 MASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTAT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 YGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 YGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB4 QPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 QPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYP
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB4 MQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 MQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSY
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB4 PPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 PPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNR
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB4 GRGRGGFDRGGMSRGGRGGGRGGMGAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNS
:::::::::::::::::::::::::
CCDS54 GRGRGGFDRGGMSRGGRGGGRGGMGLQSESLVYTSILKKYPYSVLSRQHNEKWD
310 320 330 340 350
>>CCDS10707.1 FUS gene_id:2521|Hs108|chr16 (526 aa)
initn: 717 init1: 562 opt: 1060 Z-score: 503.6 bits: 103.2 E(32554): 9.9e-22
Smith-Waterman score: 1601; 45.7% identity (64.8% similar) in 665 aa overlap (1-655:1-526)
10 20 30 40 50
pF1KB4 MASTDYSTYSQAAAQQGYSAYTAQPTQGYAQ-TTQAYGQQSYGTYGQPTDVSYTQAQTTA
:::.::. .::. :.:.:: .:: :::.: ..: ::::::. :.: :: :.
CCDS10 MASNDYT--QQAT--QSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTD--------TS
10 20 30 40
60 70 80 90 100 110
pF1KB4 TYGQTAYATSYGQPP-TGYTTPTAPQAYSQPVQGYG-TGAYDTTTATVTTTQASYAAQSA
:::..: .:::: ::: : ..: :::: ::.: . : ..::.
CCDS10 GYGQSSY-SSYGQSQNTGYGTQSTP-------QGYGSTGGYGS----------SQSSQSS
50 60 70 80 90
120 130 140 150 160 170
pF1KB4 YGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPG
:: : .::.:::::: :.:..:.:.. : . :.:. :: :
CCDS10 YGQQSSYPGYGQQPA------------------PSSTSGSYGSSSQS---SSYGQPQ-SG
100 110 120
180 190 200 210 220 230
pF1KB4 SYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPP
:: .:: ::.. .:.::.::..:. :..::::..:...:. :
CCDS10 SYSQQP----------SYGG------QQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGG
130 140 150 160 170
240 250 260 270 280 290
pF1KB4 TSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGP
. :.:.: :..:. ..: : .. :. .. : :::.. : :..:. ::
CCDS10 GG-----GNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRG----GRGRGGSGG
180 190 200 210 220
300 310 320 330 340 350
pF1KB4 DNRGRGRGGFDR--GGM---SRGGRGGGRGGMGAGERGGFNKPGGPMDEGPDLDLGPPVD
. : : ::..: ::. .::: :::::::...:::::: ::: :.: : .
CCDS10 GG-GGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHD-----S
230 240 250 260 270
360 370 380 390 400 410
pF1KB4 PDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDA
...:::..:.::::...::....::.::: :..: ::.::::::..: :.:::: ::.:
CCDS10 EQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEA
280 290 300 310 320 330
420 430 440 450 460 470
pF1KB4 TVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGG
:::..:::.::::..:::::.:.:. .:::.: .. .: ::: : ::: :::
CCDS10 TVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFN--RGGGNGRGGRG-----RGG
340 350 360 370 380 390
480 490 500 510 520 530
pF1KB4 PGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQN
: : :: :: :. :: ::::: : :::. :.:::::.:::: : :.:
CCDS10 PMGRGGYGGG----GSGGGGRGGFPSGG---------GGGGGQQRAGDWKCPNPTCENMN
400 410 420 430
540 550 560 570 580 590
pF1KB4 FAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRG
:.::.::::::::::.: ::: :::: . : :. : :::::
CCDS10 FSWRNECNQCKAPKPDG--------PGG-----GPGGSHMG-------GNYGDDRRGGRG
440 450 460 470
600 610 620 630 640 650
pF1KB4 G-DRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQMGGRRGGRGGPGKMD-KGEHRQER
: ::::.:: :: ::::: ::: :: : ::: : ::::: .:::::.:
CCDS10 GYDRGGYRG-RGGDRGGF----RGGRGG----------GDRGGFG-PGKMDSRGEHRQDR
480 490 500 510 520
pF1KB4 RDRPY
:.:::
CCDS10 RERPY
>>CCDS58454.1 FUS gene_id:2521|Hs108|chr16 (525 aa)
initn: 717 init1: 562 opt: 1059 Z-score: 503.2 bits: 103.1 E(32554): 1e-21
Smith-Waterman score: 1600; 45.5% identity (64.9% similar) in 664 aa overlap (1-655:1-525)
10 20 30 40 50
pF1KB4 MASTDYSTYSQAAAQQGYSAYTAQPTQGYAQ-TTQAYGQQSYGTYGQPTDVSYTQAQTTA
:::.::. .::. :.:.:: .:: :::.: ..: ::::::. :.: :: :.
CCDS58 MASNDYT--QQAT--QSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTD--------TS
10 20 30 40
60 70 80 90 100 110
pF1KB4 TYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYG-TGAYDTTTATVTTTQASYAAQSAY
:::..: .:::: ..: : ..: :::: ::.: . : ..::.:
CCDS58 GYGQSSY-SSYGQSQNSYGTQSTP-------QGYGSTGGYGS----------SQSSQSSY
50 60 70 80 90
120 130 140 150 160 170
pF1KB4 GTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGS
: : .::.:::::: :.:..:.:.. : . :.:. :: ::
CCDS58 GQQSSYPGYGQQPA------------------PSSTSGSYGSSSQS---SSYGQPQ-SGS
100 110 120
180 190 200 210 220 230
pF1KB4 YPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPT
: .:: ::.. .:.::.::..:. :..::::..:...:. :
CCDS58 YSQQP----------SYGG------QQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGG
130 140 150 160 170
240 250 260 270 280 290
pF1KB4 SYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPD
. :.:.: :..:. ..: : .. :. .. : :::.. : :..:. ::
CCDS58 G-----GNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRG----GRGRGGSGGG
180 190 200 210 220
300 310 320 330 340 350
pF1KB4 NRGRGRGGFDR--GGM---SRGGRGGGRGGMGAGERGGFNKPGGPMDEGPDLDLGPPVDP
. : : ::..: ::. .::: :::::::...:::::: ::: :.: : .
CCDS58 G-GGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHD-----SE
230 240 250 260 270
360 370 380 390 400 410
pF1KB4 DEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDAT
...:::..:.::::...::....::.::: :..: ::.::::::..: :.:::: ::.::
CCDS58 QDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEAT
280 290 300 310 320 330
420 430 440 450 460 470
pF1KB4 VSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGP
::..:::.::::..:::::.:.:. .:::.: .. .: ::: : ::: ::::
CCDS58 VSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFN--RGGGNGRGGRG-----RGGP
340 350 360 370 380 390
480 490 500 510 520 530
pF1KB4 GGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNF
: :: :: :. :: ::::: : :::. :.:::::.:::: : :.::
CCDS58 MGRGGYGGG----GSGGGGRGGFPSGG---------GGGGGQQRAGDWKCPNPTCENMNF
400 410 420 430
540 550 560 570 580 590
pF1KB4 AWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGG
.::.::::::::::.: ::: :::: . : :. : ::::::
CCDS58 SWRNECNQCKAPKPDG--------PGG-----GPGGSHMG-------GNYGDDRRGGRGG
440 450 460 470
600 610 620 630 640 650
pF1KB4 -DRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQMGGRRGGRGGPGKMD-KGEHRQERR
::::.:: :: ::::: ::: :: : ::: : ::::: .:::::.::
CCDS58 YDRGGYRG-RGGDRGGF----RGGRGG----------GDRGGFG-PGKMDSRGEHRQDRR
480 490 500 510 520
pF1KB4 DRPY
.:::
CCDS58 ERPY
>>CCDS59279.1 TAF15 gene_id:8148|Hs108|chr17 (589 aa)
initn: 913 init1: 460 opt: 998 Z-score: 475.0 bits: 98.0 E(32554): 3.9e-20
Smith-Waterman score: 1200; 41.4% identity (60.4% similar) in 568 aa overlap (107-650:2-487)
80 90 100 110 120 130
pF1KB4 YTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQ---QPAA
. ..::. ::. : : .: .::. : .
CCDS59 MSDSGSYG-QSG-GEQQSYSTYGNPGSQGYG
10 20
140 150 160 170 180 190
pF1KB4 TAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYP-QVPGSYPMQPVTAPPSYPP
: . .. :..: :. .: :.. . .:.:: .: : .:: .:: . .
CCDS59 QASQSYSGYGQTTDSSYGQNYSG-YSSYGQSYSQSYGGYENQKQSSYSQQPYNNQGQQQN
30 40 50 60 70 80
200 210 220 230 240
pF1KB4 TSYSSTQ---PTSYDQSSYSQQNTYGQPSSYGQ-QSSYGQQSSYGQQPPTSYPPQTGSYS
:..: :::: .:.::..: : :.: : :.:: .::.: : : :::
CCDS59 MESSGSQGGRAPSYDQPDYGQQDSYDQQSGYDQHQGSYDEQSNYDQ--------QHDSYS
90 100 110 120 130 140
250 260 270 280 290 300
pF1KB4 QAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFD
: ..: .: .:.... :: ... ::... :..: :..: ::::::.:
CCDS59 QNQQSYHSQRENYSHHT---QDDRRDVSRYGEDNRGYGG-----SQGG----GRGRGGYD
150 160 170 180
310 320 330 340 350 360
pF1KB4 RGGMSRGGRGGGRGGMGAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLN
. : :: :. :: .::::.. :: : :: : : .:::..:.::::.
CCDS59 KDG--RGPMTGSSGG----DRGGFKNFGGHRDYGPRTDADSESD---NSDNNTIFVQGLG
190 200 210 220 230
370 380 390 400 410 420
pF1KB4 DSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEW
..:. :....:::: :..: ::.::.:::..: ::.::::::.::::..:::.::::..:
CCDS59 EGVSTDQVGEFFKQIGIIKTNKKTGKPMINLYTDKDTGKPKGEATVSFDDPPSAKAAIDW
240 250 260 270 280 290
430 440 450 460 470 480
pF1KB4 FDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGG
::::.:.:. .:::.: ..: . :::: :. :: :: :
CCDS59 FDGKEFHGNIIKVSFATRRPEF--MRGG--------------------GSGGGRRGRGGY
300 310 320 330
490 500 510 520 530 540
pF1KB4 RGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPE
:: :::: :: :.: ..::: ::::.:::.::: :. ::::. :.::
CCDS59 RG--RGGFQGRG-----GDP--------KSGDWVCPNPSCGNMNFARRNSCNQCNEPRPE
340 350 360 370 380
550 560 570 580 590
pF1KB4 GFLPPPFPPPGGD---RGRGGPGGMRG--GRGGLMDRGGPGGMFRGG-RGGDR---GGFR
: ::: :: :: :.:: :::: :::: :: :: :::: ::.
CCDS59 DSR-----PSGGDFRGRGYGGERGYRGRGGRGG--DRGGYGGDRSGGGYGGDRSSGGGYS
390 400 410 420 430
600 610 620 630 640 650
pF1KB4 G-----GRGMDR--GGFGGGRRGGPGGPPGPLMEQMGGRRGGRGGPGKMDKGEHRQERRD
: : : :: ::.:: : :: :: : :: : ::: :.: . .:
CCDS59 GDRSGGGYGGDRSGGGYGGDRGGGYGGDRG------GGYGGDRGGGYGGDRGGYGGDRGG
440 450 460 470 480
pF1KB4 RPY
CCDS59 GYGGDRGGYGGDRGGYGGDRGGYGGDRGGYGGDRSRGGYGGDRGGGSGYGGDRSGGYGGD
490 500 510 520 530 540
>>CCDS32623.1 TAF15 gene_id:8148|Hs108|chr17 (592 aa)
initn: 913 init1: 460 opt: 989 Z-score: 470.9 bits: 97.3 E(32554): 6.5e-20
Smith-Waterman score: 1213; 41.6% identity (60.4% similar) in 570 aa overlap (107-650:2-490)
80 90 100 110 120 130
pF1KB4 YTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQ---QPAA
. ..::. ::. : : .: .::. : .
CCDS32 MSDSGSYG-QSG-GEQQSYSTYGNPGSQGYG
10 20
140 150 160 170 180 190
pF1KB4 TAPTRPQDGNKPTETSQPQSSTG--GYNQPSLGYGQSNYSYP-QVPGSYPMQPVTAPPSY
: . .. :..: :. .: .:.: . ::.:: .: : .:: .:: . .
CCDS32 QASQSYSGYGQTTDSSYGQNYSGYSSYGQSQSGYSQSYGGYENQKQSSYSQQPYNNQGQQ
30 40 50 60 70 80
200 210 220 230 240
pF1KB4 PPTSYSSTQ---PTSYDQSSYSQQNTYGQPSSYGQ-QSSYGQQSSYGQQPPTSYPPQTGS
:..: :::: .:.::..: : :.: : :.:: .::.: : : :
CCDS32 QNMESSGSQGGRAPSYDQPDYGQQDSYDQQSGYDQHQGSYDEQSNYDQ--------QHDS
90 100 110 120 130 140
250 260 270 280 290 300
pF1KB4 YSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGG
::: ..: .: .:.... :: ... ::... :..: :..: ::::::
CCDS32 YSQNQQSYHSQRENYSHHT---QDDRRDVSRYGEDNRGYGG-----SQGG----GRGRGG
150 160 170 180
310 320 330 340 350 360
pF1KB4 FDRGGMSRGGRGGGRGGMGAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQG
.:. : :: :. :: .::::.. :: : :: : : .:::..:.:::
CCDS32 YDKDG--RGPMTGSSGG----DRGGFKNFGGHRDYGPRTDADSESD---NSDNNTIFVQG
190 200 210 220 230 240
370 380 390 400 410 420
pF1KB4 LNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAV
:...:. :....:::: :..: ::.::.:::..: ::.::::::.::::..:::.::::.
CCDS32 LGEGVSTDQVGEFFKQIGIIKTNKKTGKPMINLYTDKDTGKPKGEATVSFDDPPSAKAAI
250 260 270 280 290 300
430 440 450 460 470 480
pF1KB4 EWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRM
.:::::.:.:. .:::.: ..: . :::: :. :: ::
CCDS32 DWFDGKEFHGNIIKVSFATRRPEF--MRGG--------------------GSGGGRRGRG
310 320 330
490 500 510 520 530 540
pF1KB4 GGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPK
: :: :::: :: :.: ..::: ::::.:::.::: :. ::::. :.
CCDS32 GYRG--RGGFQGRG-----GDP--------KSGDWVCPNPSCGNMNFARRNSCNQCNEPR
340 350 360 370 380
550 560 570 580 590
pF1KB4 PEGFLPPPFPPPGGD---RGRGGPGGMRG--GRGGLMDRGGPGGMFRGG-RGGDR---GG
:: : ::: :: :: :.:: :::: :::: :: :: :::: ::
CCDS32 PEDSR-----PSGGDFRGRGYGGERGYRGRGGRGG--DRGGYGGDRSGGGYGGDRSSGGG
390 400 410 420 430
600 610 620 630 640 650
pF1KB4 FRG-----GRGMDR--GGFGGGRRGGPGGPPGPLMEQMGGRRGGRGGPGKMDKGEHRQER
. : : : :: ::.:: : :: :: : :: : ::: :.: . .:
CCDS32 YSGDRSGGGYGGDRSGGGYGGDRGGGYGGDRG------GGYGGDRGGGYGGDRGGYGGDR
440 450 460 470 480 490
pF1KB4 RDRPY
CCDS32 GGGYGGDRGGYGGDRGGYGGDRGGYGGDRGGYGGDRSRGGYGGDRGGGSGYGGDRSGGYG
500 510 520 530 540 550
655 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 03:02:07 2016 done: Fri Nov 4 03:02:08 2016
Total Scan time: 4.210 Total Display time: 0.160
Function used was FASTA [36.3.4 Apr, 2011]