FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB4506, 655 aa 1>>>pF1KB4506 655 - 655 aa - 655 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 11.3170+/-0.00116; mu= -3.5252+/- 0.070 mean_var=490.2077+/-100.678, 0's: 0 Z-trim(115.9): 101 B-trim: 0 in 0/52 Lambda= 0.057927 statistics sampled from 16420 (16519) to 16420 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.774), E-opt: 0.2 (0.507), width: 16 Scan time: 4.210 The best scores are: opt bits E(32554) CCDS54513.1 EWSR1 gene_id:2130|Hs108|chr22 ( 655) 4722 409.3 8.5e-114 CCDS13851.1 EWSR1 gene_id:2130|Hs108|chr22 ( 656) 4710 408.3 1.7e-113 CCDS13852.2 EWSR1 gene_id:2130|Hs108|chr22 ( 661) 4700 407.5 3.1e-113 CCDS54514.1 EWSR1 gene_id:2130|Hs108|chr22 ( 600) 3583 314.1 3.6e-85 CCDS54512.1 EWSR1 gene_id:2130|Hs108|chr22 ( 354) 2226 200.4 3.5e-51 CCDS10707.1 FUS gene_id:2521|Hs108|chr16 ( 526) 1060 103.2 9.9e-22 CCDS58454.1 FUS gene_id:2521|Hs108|chr16 ( 525) 1059 103.1 1e-21 CCDS59279.1 TAF15 gene_id:8148|Hs108|chr17 ( 589) 998 98.0 3.9e-20 CCDS32623.1 TAF15 gene_id:8148|Hs108|chr17 ( 592) 989 97.3 6.5e-20 >>CCDS54513.1 EWSR1 gene_id:2130|Hs108|chr22 (655 aa) initn: 4722 init1: 4722 opt: 4722 Z-score: 2156.5 bits: 409.3 E(32554): 8.5e-114 Smith-Waterman score: 4722; 100.0% identity (100.0% similar) in 655 aa overlap (1-655:1-655) 10 20 30 40 50 60 pF1KB4 MASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTAT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 MASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTAT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB4 YGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 YGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB4 QPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 QPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB4 MQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 MQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSY 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB4 PPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 PPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNR 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB4 GRGRGGFDRGGMSRGGRGGGRGGMGAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 GRGRGGFDRGGMSRGGRGGGRGGMGAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB4 AIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 AIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPP 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB4 TAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 TAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPG 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB4 GPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 GPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECN 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB4 QCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 QCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFRG 550 560 570 580 590 600 610 620 630 640 650 pF1KB4 GRGMDRGGFGGGRRGGPGGPPGPLMEQMGGRRGGRGGPGKMDKGEHRQERRDRPY ::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 GRGMDRGGFGGGRRGGPGGPPGPLMEQMGGRRGGRGGPGKMDKGEHRQERRDRPY 610 620 630 640 650 >>CCDS13851.1 EWSR1 gene_id:2130|Hs108|chr22 (656 aa) initn: 2626 init1: 2508 opt: 4710 Z-score: 2151.0 bits: 408.3 E(32554): 1.7e-113 Smith-Waterman score: 4710; 99.8% identity (99.8% similar) in 656 aa overlap (1-655:1-656) 10 20 30 40 50 60 pF1KB4 MASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTAT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 MASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTAT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB4 YGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 YGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB4 QPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 QPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB4 MQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 MQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSY 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB4 PPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 PPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNR 250 260 270 280 290 300 310 320 330 340 350 pF1KB4 GRGRGGFDRGGMSRGGRGGGRGGMG-AGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDN ::::::::::::::::::::::::: :::::::::::::::::::::::::::::::::: CCDS13 GRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDN 310 320 330 340 350 360 360 370 380 390 400 410 pF1KB4 SAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 SAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDP 370 380 390 400 410 420 420 430 440 450 460 470 pF1KB4 PTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 PTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGP 430 440 450 460 470 480 480 490 500 510 520 530 pF1KB4 GGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTEC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 GGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTEC 490 500 510 520 530 540 540 550 560 570 580 590 pF1KB4 NQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 NQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFR 550 560 570 580 590 600 600 610 620 630 640 650 pF1KB4 GGRGMDRGGFGGGRRGGPGGPPGPLMEQMGGRRGGRGGPGKMDKGEHRQERRDRPY :::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 GGRGMDRGGFGGGRRGGPGGPPGPLMEQMGGRRGGRGGPGKMDKGEHRQERRDRPY 610 620 630 640 650 >>CCDS13852.2 EWSR1 gene_id:2130|Hs108|chr22 (661 aa) initn: 4239 init1: 4239 opt: 4700 Z-score: 2146.5 bits: 407.5 E(32554): 3.1e-113 Smith-Waterman score: 4700; 99.1% identity (99.1% similar) in 661 aa overlap (1-655:1-661) 10 20 30 40 50 60 pF1KB4 MASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTAT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 MASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTAT 10 20 30 40 50 60 70 80 90 100 110 pF1KB4 YGQTAYATSYGQPPT------GYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAA ::::::::::::::: ::::::::::::::::::::::::::::::::::::::: CCDS13 YGQTAYATSYGQPPTVEGTSTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAA 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB4 QSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 QSAYGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQ 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB4 VPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 VPGSYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQ 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB4 QPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 QPPTSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSM 250 260 270 280 290 300 300 310 320 330 340 350 pF1KB4 SGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGAGERGGFNKPGGPMDEGPDLDLGPPVDPD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 SGPDNRGRGRGGFDRGGMSRGGRGGGRGGMGAGERGGFNKPGGPMDEGPDLDLGPPVDPD 310 320 330 340 350 360 360 370 380 390 400 410 pF1KB4 EDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 EDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATV 370 380 390 400 410 420 420 430 440 450 460 470 pF1KB4 SYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 SYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPG 430 440 450 460 470 480 480 490 500 510 520 530 pF1KB4 GPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 GPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFA 490 500 510 520 530 540 540 550 560 570 580 590 pF1KB4 WRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 WRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGD 550 560 570 580 590 600 600 610 620 630 640 650 pF1KB4 RGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQMGGRRGGRGGPGKMDKGEHRQERRDRP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 RGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQMGGRRGGRGGPGKMDKGEHRQERRDRP 610 620 630 640 650 660 pF1KB4 Y : CCDS13 Y >>CCDS54514.1 EWSR1 gene_id:2130|Hs108|chr22 (600 aa) initn: 3429 init1: 2508 opt: 3583 Z-score: 1642.5 bits: 314.1 E(32554): 3.6e-85 Smith-Waterman score: 4183; 91.3% identity (91.3% similar) in 656 aa overlap (1-655:1-600) 10 20 30 40 50 60 pF1KB4 MASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTAT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 MASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTAT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB4 YGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 YGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB4 QPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYP ::::::::::::::::: CCDS54 QPAYPAYGQQPAATAPT------------------------------------------- 130 190 200 210 220 230 240 pF1KB4 MQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSY ::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 -------------SYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSY 140 150 160 170 180 250 260 270 280 290 300 pF1KB4 PPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 PPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNR 190 200 210 220 230 240 310 320 330 340 350 pF1KB4 GRGRGGFDRGGMSRGGRGGGRGGMG-AGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDN ::::::::::::::::::::::::: :::::::::::::::::::::::::::::::::: CCDS54 GRGRGGFDRGGMSRGGRGGGRGGMGSAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDN 250 260 270 280 290 300 360 370 380 390 400 410 pF1KB4 SAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 SAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDP 310 320 330 340 350 360 420 430 440 450 460 470 pF1KB4 PTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 PTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGP 370 380 390 400 410 420 480 490 500 510 520 530 pF1KB4 GGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTEC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 GGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTEC 430 440 450 460 470 480 540 550 560 570 580 590 pF1KB4 NQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 NQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGGDRGGFR 490 500 510 520 530 540 600 610 620 630 640 650 pF1KB4 GGRGMDRGGFGGGRRGGPGGPPGPLMEQMGGRRGGRGGPGKMDKGEHRQERRDRPY :::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 GGRGMDRGGFGGGRRGGPGGPPGPLMEQMGGRRGGRGGPGKMDKGEHRQERRDRPY 550 560 570 580 590 600 >>CCDS54512.1 EWSR1 gene_id:2130|Hs108|chr22 (354 aa) initn: 2226 init1: 2226 opt: 2226 Z-score: 1032.3 bits: 200.4 E(32554): 3.5e-51 Smith-Waterman score: 2226; 100.0% identity (100.0% similar) in 325 aa overlap (1-325:1-325) 10 20 30 40 50 60 pF1KB4 MASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTAT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 MASTDYSTYSQAAAQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTAT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB4 YGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 YGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB4 QPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 QPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB4 MQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 MQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSY 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB4 PPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 PPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNR 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB4 GRGRGGFDRGGMSRGGRGGGRGGMGAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNS ::::::::::::::::::::::::: CCDS54 GRGRGGFDRGGMSRGGRGGGRGGMGLQSESLVYTSILKKYPYSVLSRQHNEKWD 310 320 330 340 350 >>CCDS10707.1 FUS gene_id:2521|Hs108|chr16 (526 aa) initn: 717 init1: 562 opt: 1060 Z-score: 503.6 bits: 103.2 E(32554): 9.9e-22 Smith-Waterman score: 1601; 45.7% identity (64.8% similar) in 665 aa overlap (1-655:1-526) 10 20 30 40 50 pF1KB4 MASTDYSTYSQAAAQQGYSAYTAQPTQGYAQ-TTQAYGQQSYGTYGQPTDVSYTQAQTTA :::.::. .::. :.:.:: .:: :::.: ..: ::::::. :.: :: :. CCDS10 MASNDYT--QQAT--QSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTD--------TS 10 20 30 40 60 70 80 90 100 110 pF1KB4 TYGQTAYATSYGQPP-TGYTTPTAPQAYSQPVQGYG-TGAYDTTTATVTTTQASYAAQSA :::..: .:::: ::: : ..: :::: ::.: . : ..::. CCDS10 GYGQSSY-SSYGQSQNTGYGTQSTP-------QGYGSTGGYGS----------SQSSQSS 50 60 70 80 90 120 130 140 150 160 170 pF1KB4 YGTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPG :: : .::.:::::: :.:..:.:.. : . :.:. :: : CCDS10 YGQQSSYPGYGQQPA------------------PSSTSGSYGSSSQS---SSYGQPQ-SG 100 110 120 180 190 200 210 220 230 pF1KB4 SYPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPP :: .:: ::.. .:.::.::..:. :..::::..:...:. : CCDS10 SYSQQP----------SYGG------QQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGG 130 140 150 160 170 240 250 260 270 280 290 pF1KB4 TSYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGP . :.:.: :..:. ..: : .. :. .. : :::.. : :..:. :: CCDS10 GG-----GNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRG----GRGRGGSGG 180 190 200 210 220 300 310 320 330 340 350 pF1KB4 DNRGRGRGGFDR--GGM---SRGGRGGGRGGMGAGERGGFNKPGGPMDEGPDLDLGPPVD . : : ::..: ::. .::: :::::::...:::::: ::: :.: : . CCDS10 GG-GGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHD-----S 230 240 250 260 270 360 370 380 390 400 410 pF1KB4 PDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDA ...:::..:.::::...::....::.::: :..: ::.::::::..: :.:::: ::.: CCDS10 EQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEA 280 290 300 310 320 330 420 430 440 450 460 470 pF1KB4 TVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGG :::..:::.::::..:::::.:.:. .:::.: .. .: ::: : ::: ::: CCDS10 TVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFN--RGGGNGRGGRG-----RGG 340 350 360 370 380 390 480 490 500 510 520 530 pF1KB4 PGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQN : : :: :: :. :: ::::: : :::. :.:::::.:::: : :.: CCDS10 PMGRGGYGGG----GSGGGGRGGFPSGG---------GGGGGQQRAGDWKCPNPTCENMN 400 410 420 430 540 550 560 570 580 590 pF1KB4 FAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRG :.::.::::::::::.: ::: :::: . : :. : ::::: CCDS10 FSWRNECNQCKAPKPDG--------PGG-----GPGGSHMG-------GNYGDDRRGGRG 440 450 460 470 600 610 620 630 640 650 pF1KB4 G-DRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQMGGRRGGRGGPGKMD-KGEHRQER : ::::.:: :: ::::: ::: :: : ::: : ::::: .:::::.: CCDS10 GYDRGGYRG-RGGDRGGF----RGGRGG----------GDRGGFG-PGKMDSRGEHRQDR 480 490 500 510 520 pF1KB4 RDRPY :.::: CCDS10 RERPY >>CCDS58454.1 FUS gene_id:2521|Hs108|chr16 (525 aa) initn: 717 init1: 562 opt: 1059 Z-score: 503.2 bits: 103.1 E(32554): 1e-21 Smith-Waterman score: 1600; 45.5% identity (64.9% similar) in 664 aa overlap (1-655:1-525) 10 20 30 40 50 pF1KB4 MASTDYSTYSQAAAQQGYSAYTAQPTQGYAQ-TTQAYGQQSYGTYGQPTDVSYTQAQTTA :::.::. .::. :.:.:: .:: :::.: ..: ::::::. :.: :: :. CCDS58 MASNDYT--QQAT--QSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTD--------TS 10 20 30 40 60 70 80 90 100 110 pF1KB4 TYGQTAYATSYGQPPTGYTTPTAPQAYSQPVQGYG-TGAYDTTTATVTTTQASYAAQSAY :::..: .:::: ..: : ..: :::: ::.: . : ..::.: CCDS58 GYGQSSY-SSYGQSQNSYGTQSTP-------QGYGSTGGYGS----------SQSSQSSY 50 60 70 80 90 120 130 140 150 160 170 pF1KB4 GTQPAYPAYGQQPAATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGS : : .::.:::::: :.:..:.:.. : . :.:. :: :: CCDS58 GQQSSYPGYGQQPA------------------PSSTSGSYGSSSQS---SSYGQPQ-SGS 100 110 120 180 190 200 210 220 230 pF1KB4 YPMQPVTAPPSYPPTSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPT : .:: ::.. .:.::.::..:. :..::::..:...:. : CCDS58 YSQQP----------SYGG------QQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGG 130 140 150 160 170 240 250 260 270 280 290 pF1KB4 SYPPQTGSYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPD . :.:.: :..:. ..: : .. :. .. : :::.. : :..:. :: CCDS58 G-----GNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRG----GRGRGGSGGG 180 190 200 210 220 300 310 320 330 340 350 pF1KB4 NRGRGRGGFDR--GGM---SRGGRGGGRGGMGAGERGGFNKPGGPMDEGPDLDLGPPVDP . : : ::..: ::. .::: :::::::...:::::: ::: :.: : . CCDS58 G-GGGGGGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHD-----SE 230 240 250 260 270 360 370 380 390 400 410 pF1KB4 DEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDAT ...:::..:.::::...::....::.::: :..: ::.::::::..: :.:::: ::.:: CCDS58 QDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEAT 280 290 300 310 320 330 420 430 440 450 460 470 pF1KB4 VSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGP ::..:::.::::..:::::.:.:. .:::.: .. .: ::: : ::: :::: CCDS58 VSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFN--RGGGNGRGGRG-----RGGP 340 350 360 370 380 390 480 490 500 510 520 530 pF1KB4 GGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNF : :: :: :. :: ::::: : :::. :.:::::.:::: : :.:: CCDS58 MGRGGYGGG----GSGGGGRGGFPSGG---------GGGGGQQRAGDWKCPNPTCENMNF 400 410 420 430 540 550 560 570 580 590 pF1KB4 AWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGGMRGGRGGLMDRGGPGGMFRGGRGG .::.::::::::::.: ::: :::: . : :. : :::::: CCDS58 SWRNECNQCKAPKPDG--------PGG-----GPGGSHMG-------GNYGDDRRGGRGG 440 450 460 470 600 610 620 630 640 650 pF1KB4 -DRGGFRGGRGMDRGGFGGGRRGGPGGPPGPLMEQMGGRRGGRGGPGKMD-KGEHRQERR ::::.:: :: ::::: ::: :: : ::: : ::::: .:::::.:: CCDS58 YDRGGYRG-RGGDRGGF----RGGRGG----------GDRGGFG-PGKMDSRGEHRQDRR 480 490 500 510 520 pF1KB4 DRPY .::: CCDS58 ERPY >>CCDS59279.1 TAF15 gene_id:8148|Hs108|chr17 (589 aa) initn: 913 init1: 460 opt: 998 Z-score: 475.0 bits: 98.0 E(32554): 3.9e-20 Smith-Waterman score: 1200; 41.4% identity (60.4% similar) in 568 aa overlap (107-650:2-487) 80 90 100 110 120 130 pF1KB4 YTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQ---QPAA . ..::. ::. : : .: .::. : . CCDS59 MSDSGSYG-QSG-GEQQSYSTYGNPGSQGYG 10 20 140 150 160 170 180 190 pF1KB4 TAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYP-QVPGSYPMQPVTAPPSYPP : . .. :..: :. .: :.. . .:.:: .: : .:: .:: . . CCDS59 QASQSYSGYGQTTDSSYGQNYSG-YSSYGQSYSQSYGGYENQKQSSYSQQPYNNQGQQQN 30 40 50 60 70 80 200 210 220 230 240 pF1KB4 TSYSSTQ---PTSYDQSSYSQQNTYGQPSSYGQ-QSSYGQQSSYGQQPPTSYPPQTGSYS :..: :::: .:.::..: : :.: : :.:: .::.: : : ::: CCDS59 MESSGSQGGRAPSYDQPDYGQQDSYDQQSGYDQHQGSYDEQSNYDQ--------QHDSYS 90 100 110 120 130 140 250 260 270 280 290 300 pF1KB4 QAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFD : ..: .: .:.... :: ... ::... :..: :..: ::::::.: CCDS59 QNQQSYHSQRENYSHHT---QDDRRDVSRYGEDNRGYGG-----SQGG----GRGRGGYD 150 160 170 180 310 320 330 340 350 360 pF1KB4 RGGMSRGGRGGGRGGMGAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLN . : :: :. :: .::::.. :: : :: : : .:::..:.::::. CCDS59 KDG--RGPMTGSSGG----DRGGFKNFGGHRDYGPRTDADSESD---NSDNNTIFVQGLG 190 200 210 220 230 370 380 390 400 410 420 pF1KB4 DSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEW ..:. :....:::: :..: ::.::.:::..: ::.::::::.::::..:::.::::..: CCDS59 EGVSTDQVGEFFKQIGIIKTNKKTGKPMINLYTDKDTGKPKGEATVSFDDPPSAKAAIDW 240 250 260 270 280 290 430 440 450 460 470 480 pF1KB4 FDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGG ::::.:.:. .:::.: ..: . :::: :. :: :: : CCDS59 FDGKEFHGNIIKVSFATRRPEF--MRGG--------------------GSGGGRRGRGGY 300 310 320 330 490 500 510 520 530 540 pF1KB4 RGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPE :: :::: :: :.: ..::: ::::.:::.::: :. ::::. :.:: CCDS59 RG--RGGFQGRG-----GDP--------KSGDWVCPNPSCGNMNFARRNSCNQCNEPRPE 340 350 360 370 380 550 560 570 580 590 pF1KB4 GFLPPPFPPPGGD---RGRGGPGGMRG--GRGGLMDRGGPGGMFRGG-RGGDR---GGFR : ::: :: :: :.:: :::: :::: :: :: :::: ::. CCDS59 DSR-----PSGGDFRGRGYGGERGYRGRGGRGG--DRGGYGGDRSGGGYGGDRSSGGGYS 390 400 410 420 430 600 610 620 630 640 650 pF1KB4 G-----GRGMDR--GGFGGGRRGGPGGPPGPLMEQMGGRRGGRGGPGKMDKGEHRQERRD : : : :: ::.:: : :: :: : :: : ::: :.: . .: CCDS59 GDRSGGGYGGDRSGGGYGGDRGGGYGGDRG------GGYGGDRGGGYGGDRGGYGGDRGG 440 450 460 470 480 pF1KB4 RPY CCDS59 GYGGDRGGYGGDRGGYGGDRGGYGGDRGGYGGDRSRGGYGGDRGGGSGYGGDRSGGYGGD 490 500 510 520 530 540 >>CCDS32623.1 TAF15 gene_id:8148|Hs108|chr17 (592 aa) initn: 913 init1: 460 opt: 989 Z-score: 470.9 bits: 97.3 E(32554): 6.5e-20 Smith-Waterman score: 1213; 41.6% identity (60.4% similar) in 570 aa overlap (107-650:2-490) 80 90 100 110 120 130 pF1KB4 YTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQ---QPAA . ..::. ::. : : .: .::. : . CCDS32 MSDSGSYG-QSG-GEQQSYSTYGNPGSQGYG 10 20 140 150 160 170 180 190 pF1KB4 TAPTRPQDGNKPTETSQPQSSTG--GYNQPSLGYGQSNYSYP-QVPGSYPMQPVTAPPSY : . .. :..: :. .: .:.: . ::.:: .: : .:: .:: . . CCDS32 QASQSYSGYGQTTDSSYGQNYSGYSSYGQSQSGYSQSYGGYENQKQSSYSQQPYNNQGQQ 30 40 50 60 70 80 200 210 220 230 240 pF1KB4 PPTSYSSTQ---PTSYDQSSYSQQNTYGQPSSYGQ-QSSYGQQSSYGQQPPTSYPPQTGS :..: :::: .:.::..: : :.: : :.:: .::.: : : : CCDS32 QNMESSGSQGGRAPSYDQPDYGQQDSYDQQSGYDQHQGSYDEQSNYDQ--------QHDS 90 100 110 120 130 140 250 260 270 280 290 300 pF1KB4 YSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGG ::: ..: .: .:.... :: ... ::... :..: :..: :::::: CCDS32 YSQNQQSYHSQRENYSHHT---QDDRRDVSRYGEDNRGYGG-----SQGG----GRGRGG 150 160 170 180 310 320 330 340 350 360 pF1KB4 FDRGGMSRGGRGGGRGGMGAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQG .:. : :: :. :: .::::.. :: : :: : : .:::..:.::: CCDS32 YDKDG--RGPMTGSSGG----DRGGFKNFGGHRDYGPRTDADSESD---NSDNNTIFVQG 190 200 210 220 230 240 370 380 390 400 410 420 pF1KB4 LNDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAV :...:. :....:::: :..: ::.::.:::..: ::.::::::.::::..:::.::::. CCDS32 LGEGVSTDQVGEFFKQIGIIKTNKKTGKPMINLYTDKDTGKPKGEATVSFDDPPSAKAAI 250 260 270 280 290 300 430 440 450 460 470 480 pF1KB4 EWFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRM .:::::.:.:. .:::.: ..: . :::: :. :: :: CCDS32 DWFDGKEFHGNIIKVSFATRRPEF--MRGG--------------------GSGGGRRGRG 310 320 330 490 500 510 520 530 540 pF1KB4 GGRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPK : :: :::: :: :.: ..::: ::::.:::.::: :. ::::. :. CCDS32 GYRG--RGGFQGRG-----GDP--------KSGDWVCPNPSCGNMNFARRNSCNQCNEPR 340 350 360 370 380 550 560 570 580 590 pF1KB4 PEGFLPPPFPPPGGD---RGRGGPGGMRG--GRGGLMDRGGPGGMFRGG-RGGDR---GG :: : ::: :: :: :.:: :::: :::: :: :: :::: :: CCDS32 PEDSR-----PSGGDFRGRGYGGERGYRGRGGRGG--DRGGYGGDRSGGGYGGDRSSGGG 390 400 410 420 430 600 610 620 630 640 650 pF1KB4 FRG-----GRGMDR--GGFGGGRRGGPGGPPGPLMEQMGGRRGGRGGPGKMDKGEHRQER . : : : :: ::.:: : :: :: : :: : ::: :.: . .: CCDS32 YSGDRSGGGYGGDRSGGGYGGDRGGGYGGDRG------GGYGGDRGGGYGGDRGGYGGDR 440 450 460 470 480 490 pF1KB4 RDRPY CCDS32 GGGYGGDRGGYGGDRGGYGGDRGGYGGDRGGYGGDRSRGGYGGDRGGGSGYGGDRSGGYG 500 510 520 530 540 550 655 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 03:02:07 2016 done: Fri Nov 4 03:02:08 2016 Total Scan time: 4.210 Total Display time: 0.160 Function used was FASTA [36.3.4 Apr, 2011]