FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5906, 526 aa 1>>>pF1KB5906 526 - 526 aa - 526 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 10.0556+/-0.00137; mu= 0.6969+/- 0.083 mean_var=460.3733+/-95.446, 0's: 0 Z-trim(113.1): 117 B-trim: 0 in 0/52 Lambda= 0.059775 statistics sampled from 13710 (13813) to 13710 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.712), E-opt: 0.2 (0.424), width: 16 Scan time: 3.350 The best scores are: opt bits E(32554) CCDS10707.1 FUS gene_id:2521|Hs108|chr16 ( 526) 3790 341.5 1.4e-93 CCDS58454.1 FUS gene_id:2521|Hs108|chr16 ( 525) 3767 339.5 5.6e-93 CCDS32623.1 TAF15 gene_id:8148|Hs108|chr17 ( 592) 1214 119.4 1.1e-26 CCDS59279.1 TAF15 gene_id:8148|Hs108|chr17 ( 589) 1202 118.4 2.3e-26 CCDS54514.1 EWSR1 gene_id:2130|Hs108|chr22 ( 600) 1132 112.4 1.6e-24 CCDS54513.1 EWSR1 gene_id:2130|Hs108|chr22 ( 655) 1060 106.2 1.2e-22 CCDS13852.2 EWSR1 gene_id:2130|Hs108|chr22 ( 661) 1060 106.2 1.2e-22 CCDS13851.1 EWSR1 gene_id:2130|Hs108|chr22 ( 656) 1059 106.1 1.3e-22 >>CCDS10707.1 FUS gene_id:2521|Hs108|chr16 (526 aa) initn: 3790 init1: 3790 opt: 3790 Z-score: 1793.4 bits: 341.5 E(32554): 1.4e-93 Smith-Waterman score: 3790; 100.0% identity (100.0% similar) in 526 aa overlap (1-526:1-526) 10 20 30 40 50 60 pF1KB5 MASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQ 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 SQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 SQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 SYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 SYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 QSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 QSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 PRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 PRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIES 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 VADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 VADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 GNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 GNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQ 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB5 QRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGYD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 QRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGYD 430 440 450 460 470 480 490 500 510 520 pF1KB5 RGGYRGRGGDRGGFRGGRGGGDRGGFGPGKMDSRGEHRQDRRERPY :::::::::::::::::::::::::::::::::::::::::::::: CCDS10 RGGYRGRGGDRGGFRGGRGGGDRGGFGPGKMDSRGEHRQDRRERPY 490 500 510 520 >>CCDS58454.1 FUS gene_id:2521|Hs108|chr16 (525 aa) initn: 3353 init1: 3353 opt: 3767 Z-score: 1782.7 bits: 339.5 E(32554): 5.6e-93 Smith-Waterman score: 3767; 99.6% identity (99.8% similar) in 526 aa overlap (1-526:1-525) 10 20 30 40 50 60 pF1KB5 MASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 MASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQ 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 SQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSS :::. ::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 SQNS-YGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSS 70 80 90 100 110 130 140 150 160 170 180 pF1KB5 SYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 SYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQD 120 130 140 150 160 170 190 200 210 220 230 240 pF1KB5 QSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 QSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYE 180 190 200 210 220 230 250 260 270 280 290 300 pF1KB5 PRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 PRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIES 240 250 260 270 280 290 310 320 330 340 350 360 pF1KB5 VADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 VADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFS 300 310 320 330 340 350 370 380 390 400 410 420 pF1KB5 GNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 GNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQ 360 370 380 390 400 410 430 440 450 460 470 480 pF1KB5 QRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGYD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 QRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGYD 420 430 440 450 460 470 490 500 510 520 pF1KB5 RGGYRGRGGDRGGFRGGRGGGDRGGFGPGKMDSRGEHRQDRRERPY :::::::::::::::::::::::::::::::::::::::::::::: CCDS58 RGGYRGRGGDRGGFRGGRGGGDRGGFGPGKMDSRGEHRQDRRERPY 480 490 500 510 520 >>CCDS32623.1 TAF15 gene_id:8148|Hs108|chr17 (592 aa) initn: 693 init1: 693 opt: 1214 Z-score: 592.2 bits: 119.4 E(32554): 1.1e-26 Smith-Waterman score: 1429; 51.0% identity (66.8% similar) in 533 aa overlap (3-521:4-459) 10 20 30 40 50 pF1KB5 MASNDYTQQA--TQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQ--SSY :..: :.. :::..: . .:::.: : ::::::.:.::.: ::: :.: CCDS32 MSDSGSYGQSGGEQQSYSTYGNPGSQGYGQAS------QSYSGYGQTTDSS-YGQNYSGY 10 20 30 40 50 60 70 80 90 100 110 pF1KB5 SSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGS ::::::: .::. :.: ::: ... ::::.:: : . ::: : ::: : CCDS32 SSYGQSQ-SGYS-----QSY---GGYENQK--QSSYSQQP-YNNQGQQQNMES-SGSQG- 60 70 80 90 120 130 140 150 160 170 pF1KB5 SSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQG-YGQQNQYNSSSGGGGGGGGG ... :: .::.:: ::.:: ::..:. :: : .:..:... CCDS32 -GRAPSY---------DQPDYG-QQDSYDQQSGYDQHQGSYDEQSNYDQQHD-------- 100 110 120 130 140 180 190 200 210 220 230 pF1KB5 GNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNR .:.:.:.:. : . .:... :. . ::... :: ::: ::: : CCDS32 -SYSQNQQSYHS---QRENYSHHTQDDRRDVSRYGEDN---RGYGGSQGGG--------R 150 160 170 180 240 250 260 270 280 290 pF1KB5 SSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHD--SEQDNSDNNTIFVQGL . :::. ::: :. :: :::::..::: :: : : : ::.::::::::::::: CCDS32 GRGGYDKDGRGPMTGSSGG----DRGGFKNFGGHRDYGPRTDADSESDNSDNNTIFVQGL 190 200 210 220 230 240 300 310 320 330 340 350 pF1KB5 GENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAID ::.:. ..:...::::::::::::::.::::::::..::: ::::::::::::::::::: CCDS32 GEGVSTDQVGEFFKQIGIIKTNKKTGKPMINLYTDKDTGKPKGEATVSFDDPPSAKAAID 250 260 270 280 290 300 360 370 380 390 400 410 pF1KB5 WFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPS ::::::: :: ::::::::: .: ::::.: : ::::: ::::. : ::: : CCDS32 WFDGKEFHGNIIKVSFATRRPEFMRGGGSGGGRRGRGGYRGRGGFQG-------RGGDP- 310 320 330 340 350 420 430 440 450 460 pF1KB5 GGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDG--PGGGP-GGSHMGGNYG ..::: ::::.: ::::. :: ::::. :.:. :.:: : .::. : CCDS32 ---------KSGDWVCPNPSCGNMNFARRNSCNQCNEPRPEDSRPSGGDFRGRGYGGERG 360 370 380 390 400 470 480 490 500 510 520 pF1KB5 DDRRGGRGGYDRGGYRG--RGGDRGGFRGGRGG--GDRGGFGPGKMDSRGEHRQDRRERP :::::: ::::: : :: :: :.. :: :::.: : : : : . :: CCDS32 YRGRGGRGG-DRGGYGGDRSGGGYGGDRSSGGGYSGDRSGGGYGGDRSGGGYGGDRGGGY 410 420 430 440 450 460 pF1KB5 Y CCDS32 GGDRGGGYGGDRGGGYGGDRGGYGGDRGGGYGGDRGGYGGDRGGYGGDRGGYGGDRGGYG 470 480 490 500 510 520 >>CCDS59279.1 TAF15 gene_id:8148|Hs108|chr17 (589 aa) initn: 699 init1: 699 opt: 1202 Z-score: 586.7 bits: 118.4 E(32554): 2.3e-26 Smith-Waterman score: 1410; 50.3% identity (65.9% similar) in 533 aa overlap (3-521:4-456) 10 20 30 40 50 pF1KB5 MASNDYTQQA--TQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQ--SSY :..: :.. :::..: . .:::.: : ::::::.:.::.: ::: :.: CCDS59 MSDSGSYGQSGGEQQSYSTYGNPGSQGYGQAS------QSYSGYGQTTDSS-YGQNYSGY 10 20 30 40 50 60 70 80 90 100 110 pF1KB5 SSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGS :::::: . .:: :: ... ::::.:: : . ::: : ::: : CCDS59 SSYGQSYSQSYG------------GYENQK--QSSYSQQP-YNNQGQQQNMES-SGSQG- 60 70 80 90 120 130 140 150 160 170 pF1KB5 SSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQG-YGQQNQYNSSSGGGGGGGGG ... :: .::.:: ::.:: ::..:. :: : .:..:... CCDS59 -GRAPSY---------DQPDYG-QQDSYDQQSGYDQHQGSYDEQSNYDQQHD-------- 100 110 120 130 180 190 200 210 220 230 pF1KB5 GNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNR .:.:.:.:. : . .:... :. . ::... :: ::: ::: : CCDS59 -SYSQNQQSYHS---QRENYSHHTQDDRRDVSRYGEDN---RGYGGSQGGG--------R 140 150 160 170 180 240 250 260 270 280 290 pF1KB5 SSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHD--SEQDNSDNNTIFVQGL . :::. ::: :. :: :::::..::: :: : : : ::.::::::::::::: CCDS59 GRGGYDKDGRGPMTGSSGG----DRGGFKNFGGHRDYGPRTDADSESDNSDNNTIFVQGL 190 200 210 220 230 300 310 320 330 340 350 pF1KB5 GENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAID ::.:. ..:...::::::::::::::.::::::::..::: ::::::::::::::::::: CCDS59 GEGVSTDQVGEFFKQIGIIKTNKKTGKPMINLYTDKDTGKPKGEATVSFDDPPSAKAAID 240 250 260 270 280 290 360 370 380 390 400 410 pF1KB5 WFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPS ::::::: :: ::::::::: .: ::::.: : ::::: ::::. : ::: : CCDS59 WFDGKEFHGNIIKVSFATRRPEFMRGGGSGGGRRGRGGYRGRGGFQG-------RGGDP- 300 310 320 330 340 350 420 430 440 450 460 pF1KB5 GGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDG--PGGGP-GGSHMGGNYG ..::: ::::.: ::::. :: ::::. :.:. :.:: : .::. : CCDS59 ---------KSGDWVCPNPSCGNMNFARRNSCNQCNEPRPEDSRPSGGDFRGRGYGGERG 360 370 380 390 400 470 480 490 500 510 520 pF1KB5 DDRRGGRGGYDRGGYRG--RGGDRGGFRGGRGG--GDRGGFGPGKMDSRGEHRQDRRERP :::::: ::::: : :: :: :.. :: :::.: : : : : . :: CCDS59 YRGRGGRGG-DRGGYGGDRSGGGYGGDRSSGGGYSGDRSGGGYGGDRSGGGYGGDRGGGY 410 420 430 440 450 460 pF1KB5 Y CCDS59 GGDRGGGYGGDRGGGYGGDRGGYGGDRGGGYGGDRGGYGGDRGGYGGDRGGYGGDRGGYG 470 480 490 500 510 520 >>CCDS54514.1 EWSR1 gene_id:2130|Hs108|chr22 (600 aa) initn: 684 init1: 529 opt: 1132 Z-score: 554.0 bits: 112.4 E(32554): 1.6e-24 Smith-Waterman score: 1593; 48.5% identity (68.3% similar) in 586 aa overlap (1-515:1-563) 10 20 30 40 pF1KB5 MASNDYTQQ----ATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTD--------TS :::.::. : :.:.:: .:: :::.: ..: ::::::. :.: :: :. CCDS54 MASTDYSTYSQAAAQQGYSAYTAQPTQGYAQ-TTQAYGQQSYGTYGQPTDVSYTQAQTTA 10 20 30 40 50 50 60 70 80 90 pF1KB5 GYGQSSY-SSYGQSQNTGYGTQSTPQGYGS-TGGYGS---------------SQSSQSSY :::..: .:::: ::: : ..::.:.. . :::. : ..::.: CCDS54 TYGQTAYATSYGQPP-TGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAY 60 70 80 90 100 110 100 110 120 130 140 150 pF1KB5 GQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNP : : .::.:::::: .. . :: ::.: .:: : .::::: .:: : .:::::.::. CCDS54 GTQPAYPAYGQQPAATAPT-SY-SSTQPTSYDQ---SSYSQQNTYG-QPSSYGQQSSYGQ 120 130 140 150 160 170 160 170 180 190 200 pF1KB5 PQGYGQQ--NQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYG ..:::: ..: ..: .:.: :..:. ..: : .. :. .. : :: CCDS54 QSSYGQQPPTSYPPQTG---------SYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYG 180 190 200 210 220 210 220 230 240 250 260 pF1KB5 QQDRG----GRGRGGSGGGGGGGG-GGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNK :.. : :..:. :: . : : ::..: ::. :::::::: :. : .:::::: CCDS54 QESGGFSGPGENRSMSGPDNRGRGRGGFDR--GGMSRGGRGGGRGGMGSAG--ERGGFNK 230 240 250 260 270 270 280 290 300 310 pF1KB5 FGGPRDQGSRHD-----SEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQ ::: :.: : . ...:::..:.::::...::....::.::: :..: ::.::: CCDS54 PGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQ 280 290 300 310 320 330 320 330 340 350 360 370 pF1KB5 PMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFN--R :::..: :.:::: ::.::::..:::.::::..:::::.:.:. .:::.: .. .: : CCDS54 PMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMR 340 350 360 370 380 390 380 390 400 410 pF1KB5 GGGNGRGGRG-----RGGPMGRGGYGGG----GSGGGGRGGFPSGG---------GGGGG :: : ::: :::: : :: :: :. :: ::::: : :::. CCDS54 GGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNV 400 410 420 430 440 450 420 430 440 450 460 470 pF1KB5 QQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDG----PGGGPGGSHMGGNYGDDRRGG :.:::::.:::: : :.::.::.::::::::::.: : :::.. :. : ::: CCDS54 QHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGG-MRGG 460 470 480 490 500 510 480 490 500 510 520 pF1KB5 RGG-YDRGG----YRG-RGGDRGGFRGGRGGGDRGGFGPGKMDSRGEHRQDRRERPY ::: .:::: .:: ::::::::::::: :::::: :. . : CCDS54 RGGLMDRGGPGGMFRGGRGGDRGGFRGGRGM-DRGGFGGGRRGGPGGPPGPLMEQMGGRR 520 530 540 550 560 570 CCDS54 GGRGGPGKMDKGEHRQERRDRPY 580 590 600 >>CCDS54513.1 EWSR1 gene_id:2130|Hs108|chr22 (655 aa) initn: 717 init1: 562 opt: 1060 Z-score: 520.0 bits: 106.2 E(32554): 1.2e-22 Smith-Waterman score: 1461; 45.3% identity (66.4% similar) in 583 aa overlap (33-515:44-618) 10 20 30 40 50 60 pF1KB5 SNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSY-SSYGQS ::: . .:.:. :. :::..: .:::: CCDS54 AQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQP 20 30 40 50 60 70 70 80 90 100 pF1KB5 QNTGYGTQSTPQGYGS-TGGYGS---------------SQSSQSSYGQQSSYPGYGQQPA ::: : ..::.:.. . :::. : ..::.:: : .::.:::::: CCDS54 P-TGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPA 80 90 100 110 120 130 110 120 130 pF1KB5 ------------------PSSTSGSYGSSSQS---SSYGQPQ-SGSYSQQP--------- :.:..:.:.. : . :.:. :: ::: .:: CCDS54 ATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPP 140 150 160 170 180 190 140 150 160 170 180 pF1KB5 -SYGG------QQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGG-----GNYGQDQS ::.. .:.::.::..:. :..::::..:...:. : . :.:.: : CCDS54 TSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPS 200 210 220 230 240 250 190 200 210 220 230 pF1KB5 SMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRG----GRGRGGSGGGGGGGG-GGYNRSSG ..:. ..: : .. :. .. : :::.. : :..:. :: . : : ::..: : CCDS54 QYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDR--G 260 270 280 290 300 310 240 250 260 270 280 290 pF1KB5 GYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHD-----SEQDNSDNNTIFVQGL :. .::: :::::::...:::::: ::: :.: : . ...:::..:.:::: CCDS54 GM---SRGGRGGGRGGMGAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGL 320 330 340 350 360 300 310 320 330 340 350 pF1KB5 GENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAID ...::....::.::: :..: ::.::::::..: :.:::: ::.::::..:::.::::.. CCDS54 NDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVE 370 380 390 400 410 420 360 370 380 390 400 pF1KB5 WFDGKEFSGNPIKVSFATRRADFN--RGGGNGRGGRG-----RGGPMGRGGYGGG----G :::::.:.:. .:::.: .. .: ::: : ::: :::: : :: :: : CCDS54 WFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMG 430 440 450 460 470 480 410 420 430 440 450 pF1KB5 SGGGGRGGFPSGG---------GGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKP . :: ::::: : :::. :.:::::.:::: : :.::.::.:::::::::: CCDS54 GRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKP 490 500 510 520 530 540 460 470 480 490 500 pF1KB5 DG----PGGGPGGSHMGGNYGDDRRGGRGG-YDRGG----YRG-RGGDRGGFRGGRGGGD .: : :::.. :. : :::::: .:::: .:: ::::::::::::: : CCDS54 EGFLPPPFPPPGGDRGRGGPGG-MRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGM-D 550 560 570 580 590 600 510 520 pF1KB5 RGGFGPGKMDSRGEHRQDRRERPY ::::: :. . : CCDS54 RGGFGGGRRGGPGGPPGPLMEQMGGRRGGRGGPGKMDKGEHRQERRDRPY 610 620 630 640 650 >>CCDS13852.2 EWSR1 gene_id:2130|Hs108|chr22 (661 aa) initn: 717 init1: 562 opt: 1060 Z-score: 520.0 bits: 106.2 E(32554): 1.2e-22 Smith-Waterman score: 1436; 45.3% identity (65.9% similar) in 581 aa overlap (41-515:52-624) 20 30 40 50 60 pF1KB5 TQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSY-SSYGQ-----SQNT :.:. :. :::..: .:::: . .: CCDS13 TAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTVEGTST 30 40 50 60 70 80 70 80 90 100 pF1KB5 GYGTQSTPQ-------GYGSTGGYGS----------SQSSQSSYGQQSSYPGYGQQPA-- :: : ..:: ::: ::.: . : ..::.:: : .::.:::::: CCDS13 GYTTPTAPQAYSQPVQGYG-TGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAAT 90 100 110 120 130 140 110 120 130 pF1KB5 ----------------PSSTSGSYGSSSQS---SSYGQPQ-SGSYSQQP----------S :.:..:.:.. : . :.:. :: ::: .:: : CCDS13 APTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTS 150 160 170 180 190 200 140 150 160 170 180 pF1KB5 YGG------QQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGG-----GNYGQDQSSM :.. .:.::.::..:. :..::::..:...:. : . :.:.: :.. CCDS13 YSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQY 210 220 230 240 250 260 190 200 210 220 230 pF1KB5 SSGGGSGGGYGNQDQSGGGGSGGYGQQDRG----GRGRGGSGGGGGGGG-GGYNRSSGGY :. ..: : .. :. .. : :::.. : :..:. :: . : : ::..: ::. CCDS13 SQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDR--GGM 270 280 290 300 310 240 250 260 270 280 290 pF1KB5 EPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHD-----SEQDNSDNNTIFVQGLGE .::: :::::::...:::::: ::: :.: : . ...:::..:.::::.. CCDS13 ---SRGGRGGGRGGMGAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLND 320 330 340 350 360 370 300 310 320 330 340 350 pF1KB5 NVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWF .::....::.::: :..: ::.::::::..: :.:::: ::.::::..:::.::::..:: CCDS13 SVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWF 380 390 400 410 420 430 360 370 380 390 400 pF1KB5 DGKEFSGNPIKVSFATRRADFN--RGGGNGRGGRG-----RGGPMGRGGYGGG----GSG :::.:.:. .:::.: .. .: ::: : ::: :::: : :: :: :. CCDS13 DGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGR 440 450 460 470 480 490 410 420 430 440 450 pF1KB5 GGGRGGFPSGG---------GGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDG :: ::::: : :::. :.:::::.:::: : :.::.::.::::::::::.: CCDS13 GGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEG 500 510 520 530 540 550 460 470 480 490 500 pF1KB5 ----PGGGPGGSHMGGNYGDDRRGGRGG-YDRGG----YRG-RGGDRGGFRGGRGGGDRG : :::.. :. : :::::: .:::: .:: ::::::::::::: ::: CCDS13 FLPPPFPPPGGDRGRGGPGG-MRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGM-DRG 560 570 580 590 600 610 510 520 pF1KB5 GFGPGKMDSRGEHRQDRRERPY ::: :. . : CCDS13 GFGGGRRGGPGGPPGPLMEQMGGRRGGRGGPGKMDKGEHRQERRDRPY 620 630 640 650 660 >>CCDS13851.1 EWSR1 gene_id:2130|Hs108|chr22 (656 aa) initn: 684 init1: 529 opt: 1059 Z-score: 519.5 bits: 106.1 E(32554): 1.3e-22 Smith-Waterman score: 1452; 45.2% identity (66.0% similar) in 582 aa overlap (34-515:45-619) 10 20 30 40 50 60 pF1KB5 NDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSY-SSYGQSQ :: . .:.:. :. :::..: .:::: CCDS13 QQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPP 20 30 40 50 60 70 70 80 90 100 pF1KB5 NTGYGTQSTPQGYGS-TGGYGS---------------SQSSQSSYGQQSSYPGYGQQPA- ::: : ..::.:.. . :::. : ..::.:: : .::.:::::: CCDS13 -TGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAA 80 90 100 110 120 130 110 120 130 pF1KB5 -----------------PSSTSGSYGSSSQS---SSYGQPQ-SGSYSQQP---------- :.:..:.:.. : . :.:. :: ::: .:: CCDS13 TAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPT 140 150 160 170 180 190 140 150 160 170 180 pF1KB5 SYGG------QQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGG-----GNYGQDQSS ::.. .:.::.::..:. :..::::..:...:. : . :.:.: :. CCDS13 SYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQ 200 210 220 230 240 250 190 200 210 220 230 pF1KB5 MSSGGGSGGGYGNQDQSGGGGSGGYGQQDRG----GRGRGGSGGGGGGGG-GGYNRSSGG .:. ..: : .. :. .. : :::.. : :..:. :: . : : ::..: :: CCDS13 YSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDR--GG 260 270 280 290 300 310 240 250 260 270 280 290 pF1KB5 YEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHD-----SEQDNSDNNTIFVQGLG . :::::::: :. : .:::::: ::: :.: : . ...:::..:.::::. CCDS13 MSRGGRGGGRGGMGSAG--ERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLN 320 330 340 350 360 300 310 320 330 340 350 pF1KB5 ENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDW ..::....::.::: :..: ::.::::::..: :.:::: ::.::::..:::.::::..: CCDS13 DSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEW 370 380 390 400 410 420 360 370 380 390 400 pF1KB5 FDGKEFSGNPIKVSFATRRADFN--RGGGNGRGGRG-----RGGPMGRGGYGGG----GS ::::.:.:. .:::.: .. .: ::: : ::: :::: : :: :: :. CCDS13 FDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGG 430 440 450 460 470 480 410 420 430 440 450 pF1KB5 GGGGRGGFPSGG---------GGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPD :: ::::: : :::. :.:::::.:::: : :.::.::.::::::::::. CCDS13 RGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPE 490 500 510 520 530 540 460 470 480 490 500 pF1KB5 G----PGGGPGGSHMGGNYGDDRRGGRGG-YDRGG----YRG-RGGDRGGFRGGRGGGDR : : :::.. :. : :::::: .:::: .:: ::::::::::::: :: CCDS13 GFLPPPFPPPGGDRGRGGPGG-MRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGM-DR 550 560 570 580 590 600 510 520 pF1KB5 GGFGPGKMDSRGEHRQDRRERPY :::: :. . : CCDS13 GGFGGGRRGGPGGPPGPLMEQMGGRRGGRGGPGKMDKGEHRQERRDRPY 610 620 630 640 650 526 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 15:30:42 2016 done: Sat Nov 5 15:30:42 2016 Total Scan time: 3.350 Total Display time: 0.090 Function used was FASTA [36.3.4 Apr, 2011]