FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB3911, 454 aa 1>>>pF1KB3911 454 - 454 aa - 454 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.9449+/-0.00108; mu= 14.3555+/- 0.065 mean_var=72.2588+/-14.856, 0's: 0 Z-trim(103.1): 76 B-trim: 351 in 1/47 Lambda= 0.150879 statistics sampled from 7188 (7265) to 7188 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.589), E-opt: 0.2 (0.223), width: 16 Scan time: 2.900 The best scores are: opt bits E(32554) CCDS13575.1 GABPA gene_id:2551|Hs108|chr21 ( 454) 2977 657.6 7.3e-189 CCDS81648.1 ETS1 gene_id:2113|Hs108|chr11 ( 354) 473 112.5 7e-25 CCDS53724.1 ETS1 gene_id:2113|Hs108|chr11 ( 225) 468 111.4 9.9e-25 CCDS8475.1 ETS1 gene_id:2113|Hs108|chr11 ( 441) 468 111.5 1.8e-24 CCDS44767.1 ETS1 gene_id:2113|Hs108|chr11 ( 485) 468 111.5 2e-24 CCDS13659.1 ETS2 gene_id:2114|Hs108|chr21 ( 469) 457 109.1 1e-23 CCDS2428.1 FEV gene_id:54738|Hs108|chr2 ( 238) 406 97.9 1.2e-20 CCDS58789.1 ERG gene_id:2078|Hs108|chr21 ( 363) 408 98.4 1.3e-20 CCDS46649.1 ERG gene_id:2078|Hs108|chr21 ( 387) 408 98.4 1.4e-20 CCDS82674.1 ERG gene_id:2078|Hs108|chr21 ( 455) 408 98.4 1.6e-20 CCDS13657.1 ERG gene_id:2078|Hs108|chr21 ( 462) 408 98.4 1.6e-20 CCDS13658.1 ERG gene_id:2078|Hs108|chr21 ( 479) 408 98.4 1.7e-20 CCDS46648.1 ERG gene_id:2078|Hs108|chr21 ( 486) 408 98.4 1.7e-20 CCDS59230.1 FLI1 gene_id:2313|Hs108|chr11 ( 259) 400 96.6 3.2e-20 CCDS59231.1 FLI1 gene_id:2313|Hs108|chr11 ( 386) 400 96.7 4.6e-20 CCDS53725.1 FLI1 gene_id:2313|Hs108|chr11 ( 419) 400 96.7 4.9e-20 CCDS44768.1 FLI1 gene_id:2313|Hs108|chr11 ( 452) 400 96.7 5.3e-20 CCDS55084.1 ETV1 gene_id:2115|Hs108|chr7 ( 374) 369 89.9 4.8e-18 CCDS55083.1 ETV1 gene_id:2115|Hs108|chr7 ( 419) 369 89.9 5.3e-18 CCDS55085.1 ETV1 gene_id:2115|Hs108|chr7 ( 437) 369 89.9 5.5e-18 CCDS55087.1 ETV1 gene_id:2115|Hs108|chr7 ( 454) 369 89.9 5.7e-18 CCDS55086.1 ETV1 gene_id:2115|Hs108|chr7 ( 459) 369 89.9 5.8e-18 CCDS55088.1 ETV1 gene_id:2115|Hs108|chr7 ( 477) 369 89.9 6e-18 CCDS33906.1 ETV5 gene_id:2119|Hs108|chr3 ( 510) 362 88.4 1.8e-17 CCDS74341.1 ETV2 gene_id:2116|Hs108|chr19 ( 249) 356 87.0 2.4e-17 CCDS32995.2 ETV2 gene_id:2116|Hs108|chr19 ( 342) 356 87.1 3.1e-17 CCDS12600.1 ERF gene_id:2077|Hs108|chr19 ( 548) 358 87.6 3.5e-17 CCDS1164.1 ETV3 gene_id:2117|Hs108|chr1 ( 143) 341 83.7 1.4e-16 CCDS59292.1 ETV4 gene_id:2118|Hs108|chr17 ( 207) 343 84.2 1.4e-16 CCDS1457.1 ELK4 gene_id:2005|Hs108|chr1 ( 405) 344 84.5 2.2e-16 CCDS1456.1 ELK4 gene_id:2005|Hs108|chr1 ( 431) 344 84.5 2.4e-16 CCDS30893.1 ETV3L gene_id:440695|Hs108|chr1 ( 361) 342 84.0 2.7e-16 CCDS58553.1 ETV4 gene_id:2118|Hs108|chr17 ( 445) 343 84.3 2.8e-16 CCDS11465.1 ETV4 gene_id:2118|Hs108|chr17 ( 484) 343 84.3 3e-16 CCDS77281.1 ETV2 gene_id:2116|Hs108|chr19 ( 155) 336 82.6 3.2e-16 CCDS44250.1 ETV3 gene_id:2117|Hs108|chr1 ( 512) 341 83.9 4.3e-16 CCDS9060.1 ELK3 gene_id:2004|Hs108|chr12 ( 407) 339 83.4 4.8e-16 CCDS59165.1 ELK1 gene_id:2002|Hs108|chrX ( 95) 322 79.5 1.7e-15 CCDS55753.1 EHF gene_id:26298|Hs108|chr11 ( 277) 325 80.3 2.8e-15 CCDS14283.1 ELK1 gene_id:2002|Hs108|chrX ( 428) 322 79.7 6.5e-15 CCDS64062.1 ELF2 gene_id:1998|Hs108|chr4 ( 521) 300 74.9 2.1e-13 CCDS3745.1 ELF2 gene_id:1998|Hs108|chr4 ( 533) 300 74.9 2.2e-13 CCDS3744.1 ELF2 gene_id:1998|Hs108|chr4 ( 581) 300 74.9 2.4e-13 CCDS82954.1 ELF2 gene_id:1998|Hs108|chr4 ( 593) 300 74.9 2.4e-13 CCDS64063.1 ELF2 gene_id:1998|Hs108|chr4 ( 504) 288 72.3 1.3e-12 CCDS45043.1 ELF1 gene_id:1997|Hs108|chr13 ( 595) 282 71.0 3.6e-12 CCDS9374.1 ELF1 gene_id:1997|Hs108|chr13 ( 619) 280 70.6 5.1e-12 CCDS14617.1 ELF4 gene_id:2000|Hs108|chrX ( 663) 278 70.2 7.3e-12 >>CCDS13575.1 GABPA gene_id:2551|Hs108|chr21 (454 aa) initn: 2977 init1: 2977 opt: 2977 Z-score: 3504.2 bits: 657.6 E(32554): 7.3e-189 Smith-Waterman score: 2977; 100.0% identity (100.0% similar) in 454 aa overlap (1-454:1-454) 10 20 30 40 50 60 pF1KB3 MTKREAEELIEIEIDGTEKAECTEESIVEQTYAPAECVSQAIDINEPIGNLKKLLEPRLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 MTKREAEELIEIEIDGTEKAECTEESIVEQTYAPAECVSQAIDINEPIGNLKKLLEPRLQ 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB3 CSLDAHEICLQDIQLDPERSLFDQGVKTDGTVQLSVQVISYQGIEPKLNILEIVKPADTV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 CSLDAHEICLQDIQLDPERSLFDQGVKTDGTVQLSVQVISYQGIEPKLNILEIVKPADTV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB3 EVVIDPDAHHAESEAHLVEEAQVITLDGTKHITTISDETSEQVTRWAAALEGYRKEQERL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 EVVIDPDAHHAESEAHLVEEAQVITLDGTKHITTISDETSEQVTRWAAALEGYRKEQERL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB3 GIPYDPIQWSTDQVLHWVVWVMKEFSMTDIDLTTLNISGRELCSLNQEDFFQRVPRGEIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 GIPYDPIQWSTDQVLHWVVWVMKEFSMTDIDLTTLNISGRELCSLNQEDFFQRVPRGEIL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB3 WSHLELLRKYVLASQEQQMNEIVTIDQPVQIIPASVQSATPTTIKVINSSAKAAKVQRAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 WSHLELLRKYVLASQEQQMNEIVTIDQPVQIIPASVQSATPTTIKVINSSAKAAKVQRAP 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB3 RISGEDRSSPGNRTGNNGQIQLWQFLLELLTDKDARDCISWVGDEGEFKLNQPELVAQKW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 RISGEDRSSPGNRTGNNGQIQLWQFLLELLTDKDARDCISWVGDEGEFKLNQPELVAQKW 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB3 GQRKNKPTMNYEKLSRALRYYYDGDMICKVQGKRFVYKFVCDLKTLIGYSAAELNRLVTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 GQRKNKPTMNYEKLSRALRYYYDGDMICKVQGKRFVYKFVCDLKTLIGYSAAELNRLVTE 370 380 390 400 410 420 430 440 450 pF1KB3 CEQKKLAKMQLHGIAQPVTAVALATASLQTEKDN :::::::::::::::::::::::::::::::::: CCDS13 CEQKKLAKMQLHGIAQPVTAVALATASLQTEKDN 430 440 450 >>CCDS81648.1 ETS1 gene_id:2113|Hs108|chr11 (354 aa) initn: 715 init1: 459 opt: 473 Z-score: 560.2 bits: 112.5 E(32554): 7e-25 Smith-Waterman score: 670; 39.6% identity (62.0% similar) in 313 aa overlap (152-418:37-346) 130 140 150 160 170 180 pF1KB3 VVIDPDAHHAESEAHLVEEAQVITLDGTKHITTISDETSEQVTRWAAALEGYRKEQERLG .: : : :. . :.. :. :::.::: CCDS81 LKPTLTIIKTEKVDLELFPSPDMECADVPLLTPSSKEMMSQALK--ATFSGFTKEQQRLG 10 20 30 40 50 60 190 200 210 220 230 pF1KB3 IPYDPIQWSTDQVLHWVVWVMKEFSMTDIDLTTLNISGRELCSLNQEDFFQRVPR--GEI :: :: ::. .: ::.:...:::. .:. . ..: ::.:... :.. .: :.: CCDS81 IPKDPRQWTETHVRDWVMWAVNEFSLKGVDFQKFCMNGAALCALGKDCFLELAPDFVGDI 70 80 90 100 110 120 240 250 260 270 280 pF1KB3 LWSHLELLRKY-VLASQEQQMNEIV-----TID-------QPVQIIPASVQSATPT---- :: :::.:.: : : . .: : : . .: .: : . . :. CCDS81 LWEHLEILQKEDVKPYQVNGVNPAYPESRYTSDYFISYGIEHAQCVPPS-EFSEPSFITE 130 140 150 160 170 180 290 300 310 pF1KB3 ---TIKVINS----SAKAAK-----VQRAP---------------RISGEDRSSPGNRTG :.. :.: : : . . : : .. : : . CCDS81 SYQTLHPISSEELLSLKYENDYPSVILRDPLQTDTLQNDYFAIKQEVVTPDNMCMGRTSR 190 200 210 220 230 240 320 330 340 350 360 370 pF1KB3 NNGQIQLWQFLLELLTDKDARDCISWVGDEGEFKLNQPELVAQKWGQRKNKPTMNYEKLS ..: ::::::::::::::. .. :::.:: ::::..:. ::..::.::::: ::::::: CCDS81 GSGPIQLWQFLLELLTDKSCQSFISWTGDGWEFKLSDPDEVARRWGKRKNKPKMNYEKLS 250 260 270 280 290 300 380 390 400 410 420 430 pF1KB3 RALRYYYDGDMICKVQGKRFVYKFVCDLKTLIGYSAAELNRLVTECEQKKLAKMQLHGIA :.:::::: ..: :. :::.::.:::::..:.::. ::. .. CCDS81 RGLRYYYDKNIIHKTAGKRYVYRFVCDLQSLLGYTPEELHAMLDVKPDADE 310 320 330 340 350 440 450 pF1KB3 QPVTAVALATASLQTEKDN >>CCDS53724.1 ETS1 gene_id:2113|Hs108|chr11 (225 aa) initn: 480 init1: 459 opt: 468 Z-score: 557.5 bits: 111.4 E(32554): 9.9e-25 Smith-Waterman score: 468; 63.8% identity (86.7% similar) in 105 aa overlap (314-418:114-217) 290 300 310 320 330 340 pF1KB3 IKVINSSAKAAKVQRAPRISGEDRSSPGNRTGNNGQIQLWQFLLELLTDKDARDCISWVG ::. : ::::::::::::::. .. :::.: CCDS53 PKGTFKDYVRDRADLNKDKPVIPAAALAGYTGS-GPIQLWQFLLELLTDKSCQSFISWTG 90 100 110 120 130 140 350 360 370 380 390 400 pF1KB3 DEGEFKLNQPELVAQKWGQRKNKPTMNYEKLSRALRYYYDGDMICKVQGKRFVYKFVCDL : ::::..:. ::..::.::::: ::::::::.:::::: ..: :. :::.::.::::: CCDS53 DGWEFKLSDPDEVARRWGKRKNKPKMNYEKLSRGLRYYYDKNIIHKTAGKRYVYRFVCDL 150 160 170 180 190 200 410 420 430 440 450 pF1KB3 KTLIGYSAAELNRLVTECEQKKLAKMQLHGIAQPVTAVALATASLQTEKDN ..:.::. ::. .. CCDS53 QSLLGYTPEELHAMLDVKPDADE 210 220 >>CCDS8475.1 ETS1 gene_id:2113|Hs108|chr11 (441 aa) initn: 715 init1: 459 opt: 468 Z-score: 552.8 bits: 111.5 E(32554): 1.8e-24 Smith-Waterman score: 522; 31.0% identity (51.0% similar) in 400 aa overlap (152-418:37-433) 130 140 150 160 170 180 pF1KB3 VVIDPDAHHAESEAHLVEEAQVITLDGTKHITTISDETSEQVTRWAAALEGYRKEQERLG .: : : :. . :.. :. :::.::: CCDS84 LKPTLTIIKTEKVDLELFPSPDMECADVPLLTPSSKEMMSQALK--ATFSGFTKEQQRLG 10 20 30 40 50 60 190 200 210 220 230 pF1KB3 IPYDPIQWSTDQVLHWVVWVMKEFSMTDIDLTTLNISGRELCSLNQEDFFQRVPR--GEI :: :: ::. .: ::.:...:::. .:. . ..: ::.:... :.. .: :.: CCDS84 IPKDPRQWTETHVRDWVMWAVNEFSLKGVDFQKFCMNGAALCALGKDCFLELAPDFVGDI 70 80 90 100 110 120 240 250 pF1KB3 LWSHLELLRK-----------------------YVLA----------------------- :: :::.:.: : .. CCDS84 LWEHLEILQKEDVKPYQVNGVNPAYPESRYTSDYFISYGIEHAQCVPPSEFSEPSFITES 130 140 150 160 170 180 260 270 280 pF1KB3 -------SQEQQMNEIVTIDQPVQIIPASVQS--------------ATPTTI-------- :.:. .. : : :. .:. .:: .. CCDS84 YQTLHPISSEELLSLKYENDYPSVILRDPLQTDTLQNDYFAIKQEVVTPDNMCMGRTSRG 190 200 210 220 230 240 290 300 310 pF1KB3 ---------------------KVINSSAKAAKVQRAPR---ISGEDRSS--PGNR----- . .:... ..::.: ...:: . :... CCDS84 KLGGQDSFESIESYDSCDRLTQSWSSQSSFNSLQRVPSYDSFDSEDYPAALPNHKPKGTF 250 260 270 280 290 300 320 330 340 pF1KB3 -------------------------TGNNGQIQLWQFLLELLTDKDARDCISWVGDEGEF ::. : ::::::::::::::. .. :::.:: :: CCDS84 KDYVRDRADLNKDKPVIPAAALAGYTGS-GPIQLWQFLLELLTDKSCQSFISWTGDGWEF 310 320 330 340 350 360 350 360 370 380 390 400 pF1KB3 KLNQPELVAQKWGQRKNKPTMNYEKLSRALRYYYDGDMICKVQGKRFVYKFVCDLKTLIG ::..:. ::..::.::::: ::::::::.:::::: ..: :. :::.::.:::::..:.: CCDS84 KLSDPDEVARRWGKRKNKPKMNYEKLSRGLRYYYDKNIIHKTAGKRYVYRFVCDLQSLLG 370 380 390 400 410 420 410 420 430 440 450 pF1KB3 YSAAELNRLVTECEQKKLAKMQLHGIAQPVTAVALATASLQTEKDN :. ::. .. CCDS84 YTPEELHAMLDVKPDADE 430 440 >>CCDS44767.1 ETS1 gene_id:2113|Hs108|chr11 (485 aa) initn: 715 init1: 459 opt: 468 Z-score: 552.1 bits: 111.5 E(32554): 2e-24 Smith-Waterman score: 522; 31.0% identity (51.0% similar) in 400 aa overlap (152-418:81-477) 130 140 150 160 170 180 pF1KB3 VVIDPDAHHAESEAHLVEEAQVITLDGTKHITTISDETSEQVTRWAAALEGYRKEQERLG .: : : :. . :.. :. :::.::: CCDS44 YPFWDEMATQEVPTGLEHCVSDMECADVPLLTPSSKEMMSQALK--ATFSGFTKEQQRLG 60 70 80 90 100 190 200 210 220 230 pF1KB3 IPYDPIQWSTDQVLHWVVWVMKEFSMTDIDLTTLNISGRELCSLNQEDFFQRVPR--GEI :: :: ::. .: ::.:...:::. .:. . ..: ::.:... :.. .: :.: CCDS44 IPKDPRQWTETHVRDWVMWAVNEFSLKGVDFQKFCMNGAALCALGKDCFLELAPDFVGDI 110 120 130 140 150 160 240 250 pF1KB3 LWSHLELLRK-----------------------YVLA----------------------- :: :::.:.: : .. CCDS44 LWEHLEILQKEDVKPYQVNGVNPAYPESRYTSDYFISYGIEHAQCVPPSEFSEPSFITES 170 180 190 200 210 220 260 270 280 pF1KB3 -------SQEQQMNEIVTIDQPVQIIPASVQS--------------ATPTTI-------- :.:. .. : : :. .:. .:: .. CCDS44 YQTLHPISSEELLSLKYENDYPSVILRDPLQTDTLQNDYFAIKQEVVTPDNMCMGRTSRG 230 240 250 260 270 280 290 300 310 pF1KB3 ---------------------KVINSSAKAAKVQRAPR---ISGEDRSS--PGNR----- . .:... ..::.: ...:: . :... CCDS44 KLGGQDSFESIESYDSCDRLTQSWSSQSSFNSLQRVPSYDSFDSEDYPAALPNHKPKGTF 290 300 310 320 330 340 320 330 340 pF1KB3 -------------------------TGNNGQIQLWQFLLELLTDKDARDCISWVGDEGEF ::. : ::::::::::::::. .. :::.:: :: CCDS44 KDYVRDRADLNKDKPVIPAAALAGYTGS-GPIQLWQFLLELLTDKSCQSFISWTGDGWEF 350 360 370 380 390 400 350 360 370 380 390 400 pF1KB3 KLNQPELVAQKWGQRKNKPTMNYEKLSRALRYYYDGDMICKVQGKRFVYKFVCDLKTLIG ::..:. ::..::.::::: ::::::::.:::::: ..: :. :::.::.:::::..:.: CCDS44 KLSDPDEVARRWGKRKNKPKMNYEKLSRGLRYYYDKNIIHKTAGKRYVYRFVCDLQSLLG 410 420 430 440 450 460 410 420 430 440 450 pF1KB3 YSAAELNRLVTECEQKKLAKMQLHGIAQPVTAVALATASLQTEKDN :. ::. .. CCDS44 YTPEELHAMLDVKPDADE 470 480 >>CCDS13659.1 ETS2 gene_id:2114|Hs108|chr21 (469 aa) initn: 730 init1: 448 opt: 457 Z-score: 539.4 bits: 109.1 E(32554): 1e-23 Smith-Waterman score: 552; 32.5% identity (53.4% similar) in 378 aa overlap (168-418:85-461) 140 150 160 170 180 190 pF1KB3 VEEAQVITLDGTKHITTISDETSEQVTRWAAALEGYRKEQERLGIPYDPIQWSTDQVLHW :.. :..:::.::::: .: :: .:: .: CCDS13 GLDSISHDSANCELPLLTPCSKAVMSQALKATFSGFKKEQRRLGIPKNPWLWSEQQVCQW 60 70 80 90 100 110 200 210 220 230 240 250 pF1KB3 VVWVMKEFSMTDIDLTTLNISGRELCSLNQEDFFQRVPR--GEILWSHLELLRKYVLASQ ..:. .:::.....: ....:. ::.:..: :.. .: :.::: ::: . : . CCDS13 LLWATNEFSLVNVNLQRFGMNGQMLCNLGKERFLELAPDFVGDILWEHLEQMIKENQEKT 120 130 140 150 160 170 260 pF1KB3 EQQMNE------------------------------------------------IVTIDQ :.:..: ... .: CCDS13 EDQYEENSHLTSVPHWINSNTLGFGTEQAPYGMQTQNYPKGGLLDSMCPASTPSVLSSEQ 180 190 200 210 220 230 270 280 pF1KB3 PVQIIPASV-------------------------QSATP-----------------TTIK :..: : .:.:: . .. CCDS13 EFQMFPKSRLSSVSVTYCSVSQDFPGSNLNLLTNNSGTPKDHDSPENGADSFESSDSLLQ 240 250 260 270 280 290 290 300 310 pF1KB3 VINSSAKAAKVQRAPRI-SGED---------------------RSSPGNR---------- ::... :::.: . : :: ::.: .. CCDS13 SWNSQSSLLDVQRVPSFESFEDDCSQSLCLNKPTMSFKDYIQERSDPVEQGKPVIPAAVL 300 310 320 330 340 350 320 330 340 350 360 370 pF1KB3 ---TGNNGQIQLWQFLLELLTDKDARDCISWVGDEGEFKLNQPELVAQKWGQRKNKPTMN ::. : :::::::::::.::. .. :::.:: :::: .:. ::..::.::::: :: CCDS13 AGFTGS-GPIQLWQFLLELLSDKSCQSFISWTGDGWEFKLADPDEVARRWGKRKNKPKMN 360 370 380 390 400 410 380 390 400 410 420 430 pF1KB3 YEKLSRALRYYYDGDMICKVQGKRFVYKFVCDLKTLIGYSAAELNRLVTECEQKKLAKMQ ::::::.:::::: ..: :..:::.::.:::::..:.:.. ::. .. CCDS13 YEKLSRGLRYYYDKNIIHKTSGKRYVYRFVCDLQNLLGFTPEELHAILGVQPDTED 420 430 440 450 460 440 450 pF1KB3 LHGIAQPVTAVALATASLQTEKDN >>CCDS2428.1 FEV gene_id:54738|Hs108|chr2 (238 aa) initn: 418 init1: 397 opt: 406 Z-score: 484.2 bits: 97.9 E(32554): 1.2e-20 Smith-Waterman score: 406; 61.5% identity (86.8% similar) in 91 aa overlap (309-399:37-126) 280 290 300 310 320 330 pF1KB3 ATPTTIKVINSSAKAAKVQRAPRISGEDRSSPGNRTGNNGQIQLWQFLLELLTDKDARDC ::. . :. :::::::::::::.:. : CCDS24 SQPLLINMYLPDPVGDGLFKDGKNPSWGPLSPAVQKGS-GQIQLWQFLLELLADRANAGC 10 20 30 40 50 60 340 350 360 370 380 390 pF1KB3 ISWVGDEGEFKLNQPELVAQKWGQRKNKPTMNYEKLSRALRYYYDGDMICKVQGKRFVYK :.: : .:::::..:. ::..::.::.::.:::.::::::::::: ... ::.:::..:. CCDS24 IAWEGGHGEFKLTDPDEVARRWGERKSKPNMNYDKLSRALRYYYDKNIMSKVHGKRYAYR 70 80 90 100 110 120 400 410 420 430 440 450 pF1KB3 FVCDLKTLIGYSAAELNRLVTECEQKKLAKMQLHGIAQPVTAVALATASLQTEKDN : CCDS24 FDFQGLAQACQPPPAHAHAAAAAAAAAAAAQDGALYKLPAGLAPLPFPGLSKLNLMAASA 130 140 150 160 170 180 >>CCDS58789.1 ERG gene_id:2078|Hs108|chr21 (363 aa) initn: 591 init1: 403 opt: 408 Z-score: 483.6 bits: 98.4 E(32554): 1.3e-20 Smith-Waterman score: 587; 39.6% identity (71.0% similar) in 245 aa overlap (177-399:30-274) 150 160 170 180 190 200 pF1KB3 DGTKHITTISDETSEQVTRWAAALEGYRKEQERLGIPYDPIQWSTDQVLHWVVWVMKEFS ..:. .: :: ::::.: .:. :..::.. CCDS58 MVGSPDTVGMNYGSYMEEKHMPPPNMTTNERRVIVPADPTLWSTDHVRQWLEWAVKEYG 10 20 30 40 50 210 220 230 240 250 pF1KB3 MTDIDLTTL-NISGRELCSLNQEDFFQRVPR--GEILWSHLELLRKYVL----------A . :... . ::.:.:::.....:: . .: ..:: :::. ::. : : CCDS58 LPDVNILLFQNIDGKELCKMTKDDFQRLTPSYNADILLSHLHYLRETPLPHLTSDDVDKA 60 70 80 90 100 110 260 270 280 290 300 pF1KB3 SQEQ-QMNEIVTIDQPVQIIPASVQSA----TPTTIKVINSSAKAAKVQ-RAPRISGEDR :.. .. . . : : . :. .. :: . . : . . :.. . :... . CCDS58 LQNSPRLMHARNTDLPYEPPRRSAWTGHGHPTPQSKAAQPSPSTVPKTEDQRPQLDPYQI 120 130 140 150 160 170 310 320 330 340 350 360 pF1KB3 SSP-GNRTGN--NGQIQLWQFLLELLTDKDARDCISWVGDEGEFKLNQPELVAQKWGQRK .: ..: .: .:::::::::::::.:.. .::.: : .::::...:. ::..::.:: CCDS58 LGPTSSRLANPGSGQIQLWQFLLELLSDSSNSSCITWEGTNGEFKMTDPDEVARRWGERK 180 190 200 210 220 230 370 380 390 400 410 420 pF1KB3 NKPTMNYEKLSRALRYYYDGDMICKVQGKRFVYKFVCDLKTLIGYSAAELNRLVTECEQK .::.:::.::::::::::: ... ::.:::..::: CCDS58 SKPNMNYDKLSRALRYYYDKNIMTKVHGKRYAYKFDFHGIAQALQPHPPESSLYKYPSDL 240 250 260 270 280 290 430 440 450 pF1KB3 KLAKMQLHGIAQPVTAVALATASLQTEKDN CCDS58 PYMGSYHAHPQKMNFVAPHPPALPVTSSSFFAAPNPYWNSPTGGIYPNTRLPTSHMPSHL 300 310 320 330 340 350 >>CCDS46649.1 ERG gene_id:2078|Hs108|chr21 (387 aa) initn: 553 init1: 403 opt: 408 Z-score: 483.1 bits: 98.4 E(32554): 1.4e-20 Smith-Waterman score: 546; 36.1% identity (65.1% similar) in 269 aa overlap (177-399:30-298) 150 160 170 180 190 200 pF1KB3 DGTKHITTISDETSEQVTRWAAALEGYRKEQERLGIPYDPIQWSTDQVLHWVVWVMKEFS ..:. .: :: ::::.: .:. :..::.. CCDS46 MVGSPDTVGMNYGSYMEEKHMPPPNMTTNERRVIVPADPTLWSTDHVRQWLEWAVKEYG 10 20 30 40 50 210 220 230 240 250 260 pF1KB3 MTDIDLTTL-NISGRELCSLNQEDFFQRVPR--GEILWSHLELLRKYVLASQEQQMNEIV . :... . ::.:.:::.....:: . .: ..:: :::. ::. : .. . . CCDS46 LPDVNILLFQNIDGKELCKMTKDDFQRLTPSYNADILLSHLHYLRETPLPHLTSDDVDKA 60 70 80 90 100 110 270 280 pF1KB3 TIDQP-----------------VQIIPASVQ---------------SA-------TPTTI ..: ... : ..: :: :: . CCDS46 LQNSPRLMHARNTGGAAFIFPNTSVYPEATQRITTRPDLPYEPPRRSAWTGHGHPTPQSK 120 130 140 150 160 170 290 300 310 320 330 340 pF1KB3 KVINSSAKAAKVQ-RAPRISGEDRSSP-GNRTGN--NGQIQLWQFLLELLTDKDARDCIS . : . . :.. . :... . .: ..: .: .:::::::::::::.:.. .::. CCDS46 AAQPSPSTVPKTEDQRPQLDPYQILGPTSSRLANPGSGQIQLWQFLLELLSDSSNSSCIT 180 190 200 210 220 230 350 360 370 380 390 400 pF1KB3 WVGDEGEFKLNQPELVAQKWGQRKNKPTMNYEKLSRALRYYYDGDMICKVQGKRFVYKFV : : .::::...:. ::..::.::.::.:::.::::::::::: ... ::.:::..::: CCDS46 WEGTNGEFKMTDPDEVARRWGERKSKPNMNYDKLSRALRYYYDKNIMTKVHGKRYAYKFD 240 250 260 270 280 290 410 420 430 440 450 pF1KB3 CDLKTLIGYSAAELNRLVTECEQKKLAKMQLHGIAQPVTAVALATASLQTEKDN CCDS46 FHGIAQALQPHPPESSLYKYPSDLPYMGSYHAHPQKMNFVAPHPPALPVTSSSFFAAPNP 300 310 320 330 340 350 >>CCDS82674.1 ERG gene_id:2078|Hs108|chr21 (455 aa) initn: 623 init1: 403 opt: 408 Z-score: 482.0 bits: 98.4 E(32554): 1.6e-20 Smith-Waterman score: 587; 39.6% identity (71.0% similar) in 245 aa overlap (177-399:122-366) 150 160 170 180 190 200 pF1KB3 DGTKHITTISDETSEQVTRWAAALEGYRKEQERLGIPYDPIQWSTDQVLHWVVWVMKEFS ..:. .: :: ::::.: .:. :..::.. CCDS82 KMVGSPDTVGMNYGSYMEEKHMPPPNMTTNERRVIVPADPTLWSTDHVRQWLEWAVKEYG 100 110 120 130 140 150 210 220 230 240 250 pF1KB3 MTDIDLTTL-NISGRELCSLNQEDFFQRVPR--GEILWSHLELLRKYVL----------A . :... . ::.:.:::.....:: . .: ..:: :::. ::. : : CCDS82 LPDVNILLFQNIDGKELCKMTKDDFQRLTPSYNADILLSHLHYLRETPLPHLTSDDVDKA 160 170 180 190 200 210 260 270 280 290 300 pF1KB3 SQEQ-QMNEIVTIDQPVQIIPASVQSA----TPTTIKVINSSAKAAKVQ-RAPRISGEDR :.. .. . . : : . :. .. :: . . : . . :.. . :... . CCDS82 LQNSPRLMHARNTDLPYEPPRRSAWTGHGHPTPQSKAAQPSPSTVPKTEDQRPQLDPYQI 220 230 240 250 260 270 310 320 330 340 350 360 pF1KB3 SSP-GNRTGN--NGQIQLWQFLLELLTDKDARDCISWVGDEGEFKLNQPELVAQKWGQRK .: ..: .: .:::::::::::::.:.. .::.: : .::::...:. ::..::.:: CCDS82 LGPTSSRLANPGSGQIQLWQFLLELLSDSSNSSCITWEGTNGEFKMTDPDEVARRWGERK 280 290 300 310 320 330 370 380 390 400 410 420 pF1KB3 NKPTMNYEKLSRALRYYYDGDMICKVQGKRFVYKFVCDLKTLIGYSAAELNRLVTECEQK .::.:::.::::::::::: ... ::.:::..::: CCDS82 SKPNMNYDKLSRALRYYYDKNIMTKVHGKRYAYKFDFHGIAQALQPHPPESSLYKYPSDL 340 350 360 370 380 390 430 440 450 pF1KB3 KLAKMQLHGIAQPVTAVALATASLQTEKDN CCDS82 PYMGSYHAHPQKMNFVAPHPPALPVTSSSFFAAPNPYWNSPTGGIYPNTRLPTSHMPSHL 400 410 420 430 440 450 454 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 02:43:27 2016 done: Fri Nov 4 02:43:28 2016 Total Scan time: 2.900 Total Display time: 0.040 Function used was FASTA [36.3.4 Apr, 2011]