FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7786, 512 aa 1>>>pF1KB7786 512 - 512 aa - 512 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.0103+/-0.000822; mu= 2.1174+/- 0.049 mean_var=206.2325+/-41.529, 0's: 0 Z-trim(114.5): 75 B-trim: 2 in 1/54 Lambda= 0.089309 statistics sampled from 14946 (15021) to 14946 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.786), E-opt: 0.2 (0.461), width: 16 Scan time: 4.020 The best scores are: opt bits E(32554) CCDS44250.1 ETV3 gene_id:2117|Hs108|chr1 ( 512) 3546 469.3 4.5e-132 CCDS12600.1 ERF gene_id:2077|Hs108|chr19 ( 548) 962 136.4 7.9e-32 CCDS1164.1 ETV3 gene_id:2117|Hs108|chr1 ( 143) 948 134.2 9.4e-32 CCDS30893.1 ETV3L gene_id:440695|Hs108|chr1 ( 361) 773 111.9 1.2e-24 CCDS77308.1 ERF gene_id:2077|Hs108|chr19 ( 473) 536 81.5 2.4e-15 >>CCDS44250.1 ETV3 gene_id:2117|Hs108|chr1 (512 aa) initn: 3546 init1: 3546 opt: 3546 Z-score: 2484.6 bits: 469.3 E(32554): 4.5e-132 Smith-Waterman score: 3546; 100.0% identity (100.0% similar) in 512 aa overlap (1-512:1-512) 10 20 30 40 50 60 pF1KB7 MKAGCSIVEKPEGGGGYQFPDWAYKTESSPGSRQIQLWHFILELLQKEEFRHVIAWQQGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 MKAGCSIVEKPEGGGGYQFPDWAYKTESSPGSRQIQLWHFILELLQKEEFRHVIAWQQGE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 YGEFVIKDPDEVARLWGRRKCKPQMNYDKLSRALRYYYNKRILHKTKGKRFTYKFNFNKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 YGEFVIKDPDEVARLWGRRKCKPQMNYDKLSRALRYYYNKRILHKTKGKRFTYKFNFNKL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 VMPNYPFINIRSSGVVPQSAPPVPTASSRFHFPPLDTHSPTNDVQPGRFSASSLTASGQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 VMPNYPFINIRSSGVVPQSAPPVPTASSRFHFPPLDTHSPTNDVQPGRFSASSLTASGQE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 SSNGTDRKTELSELEDGSAADWRRGVDPVSSRNAIGGGGIGHQKRKPDIMLPLFARPGMY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 SSNGTDRKTELSELEDGSAADWRRGVDPVSSRNAIGGGGIGHQKRKPDIMLPLFARPGMY 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 PDPHSPFAVSPIPGRGGVLNVPISPALSLTPTIFSYSPSPGLSPFTSSSCFSFNPEEMKH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 PDPHSPFAVSPIPGRGGVLNVPISPALSLTPTIFSYSPSPGLSPFTSSSCFSFNPEEMKH 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 YLHSQACSVFNYHLSPRTFPRYPGLMVPPLQCQMHPEESTQFSIKLQPPPVGRKNRERVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 YLHSQACSVFNYHLSPRTFPRYPGLMVPPLQCQMHPEESTQFSIKLQPPPVGRKNRERVE 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB7 SSEESAPVTTPTMASIPPRIKVEPASEKDPESLRQSAREKEEHTQEEGTVPSRTIEEEKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 SSEESAPVTTPTMASIPPRIKVEPASEKDPESLRQSAREKEEHTQEEGTVPSRTIEEEKG 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB7 TIFARPAAPPIWPSVPISTPSGEPLEVTEDSEDRPGKEPSAPEKKEDALMPPKLRLKRRW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 TIFARPAAPPIWPSVPISTPSGEPLEVTEDSEDRPGKEPSAPEKKEDALMPPKLRLKRRW 430 440 450 460 470 480 490 500 510 pF1KB7 NDDPEARELSKSGKFLWNGSGPQGLATAAADA :::::::::::::::::::::::::::::::: CCDS44 NDDPEARELSKSGKFLWNGSGPQGLATAAADA 490 500 510 >>CCDS12600.1 ERF gene_id:2077|Hs108|chr19 (548 aa) initn: 1060 init1: 480 opt: 962 Z-score: 684.9 bits: 136.4 E(32554): 7.9e-32 Smith-Waterman score: 1324; 45.6% identity (62.0% similar) in 553 aa overlap (10-504:2-502) 10 20 30 40 50 60 pF1KB7 MKAGCSIVEKPEGGGGYQFPDWAYKTESSPGSRQIQLWHFILELLQKEEFRHVIAWQQGE : . :. ::::::: :::::::::::::::::::.:::.. ::::: :. CCDS12 MKTPADTGFAFPDWAYKPESSPGSRQIQLWHFILELLRKEEYQGVIAWQ-GD 10 20 30 40 50 70 80 90 100 110 120 pF1KB7 YGEFVIKDPDEVARLWGRRKCKPQMNYDKLSRALRYYYNKRILHKTKGKRFTYKFNFNKL ::::::::::::::::: :::::::::::::::::::::::::::::::::::::::::: CCDS12 YGEFVIKDPDEVARLWGVRKCKPQMNYDKLSRALRYYYNKRILHKTKGKRFTYKFNFNKL 60 70 80 90 100 110 130 140 150 160 170 pF1KB7 VMPNYPFINIR-SSGVVPQSAPPVPTASSRFHFPPL---DTHSPTNDVQPGRFSASSLTA :. :::::.. ..:.:::::::::...:.:.::: .. :::.: : : : .. CCDS12 VLVNYPFIDVGLAGGAVPQSAPPVPSGGSHFRFPPSTPSEVLSPTED--PRSPPACSSSS 120 130 140 150 160 180 190 200 210 220 230 pF1KB7 SGQESSNGTDR--KTELSELEDGSAA-DWRRGVDPVSSRNAIGGGGIGHQKRKPDIMLP- :. :. . : . .:. ::.. . : :: .: : .: . : :: CCDS12 SSLFSAVVARRLGRGSVSDCSDGTSELEEPLGEDP-RARPP-GPPDLGAFRGPPLARLPH 170 180 190 200 210 220 240 250 260 270 280 pF1KB7 ------LFARPGMYPDPHSPFAVSPIPGRGGVLNVPISPALSLTPTIFSYSPSPGLSPFT .. :: :.: ::: :::. : :..: .:::: .::: ..:.::: :::. CCDS12 DPGVFRVYPRPRGGPEPLSPFPVSPLAGPGSLLPPQLSPALPMTPTHLAYTPSPTLSPMY 230 240 250 260 270 280 290 300 310 320 330 pF1KB7 SS-----------SCFSFNPEEMKHYLHSQACSVFNYHLSPRTFPRYPGLMVP----PLQ : : :::.::.::.::.... ::.:::::::.: .::::.:: : . CCDS12 PSGGGGPSGSGGGSHFSFSPEDMKRYLQAHTQSVYNYHLSPRAFLHYPGLVVPQPQRPDK 290 300 310 320 330 340 340 350 360 370 pF1KB7 CQ---MHPEE--------------STQFSIKLQPPPVGRKNRERVESSEESAPVTTPTMA : : :: :. :..::::::.::..: :.. .: . . . CCDS12 CPLPPMAPETPPVPSSASSSSSSSSSPFKFKLQPPPLGRRQRAAGEKAVAGADKSGGSAG 350 360 370 380 390 400 380 390 400 410 420 pF1KB7 SI------------PPRIKVEPASEKDPESLRQSAREKEEHTQEEGTVPSRTIEEEKGTI .. ::.::::: :: . : . : . ..:. :: : . CCDS12 GLAEGAGALAPPPPPPQIKVEPISEGESEEV-----EVTDISDED---------EEDGEV 410 420 430 440 450 430 440 450 460 470 480 pF1KB7 FARPAAPPIWPSVPISTPSGEPLEVTEDSEDRPGKEPSAPEKKEDALMPPKLRLKRRWND : : ::: : .: .::. :.: . :: :::.::::.. CCDS12 FKTPRAPPAPP---------KP---------EPGEAPGASQ-----CMPLKLRFKRRWSE 460 470 480 490 490 500 510 pF1KB7 DPEARELSKSGKFLWNGSGPQGLATAAADA : . : .:.:: : CCDS12 DCR----------LEGGGGPAGGFEDEGEDKKVRGEGPGEAGGPLTPRRVSSDLQHATAQ 500 510 520 530 540 >>CCDS1164.1 ETV3 gene_id:2117|Hs108|chr1 (143 aa) initn: 948 init1: 948 opt: 948 Z-score: 683.5 bits: 134.2 E(32554): 9.4e-32 Smith-Waterman score: 948; 98.5% identity (99.3% similar) in 136 aa overlap (1-136:1-136) 10 20 30 40 50 60 pF1KB7 MKAGCSIVEKPEGGGGYQFPDWAYKTESSPGSRQIQLWHFILELLQKEEFRHVIAWQQGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MKAGCSIVEKPEGGGGYQFPDWAYKTESSPGSRQIQLWHFILELLQKEEFRHVIAWQQGE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 YGEFVIKDPDEVARLWGRRKCKPQMNYDKLSRALRYYYNKRILHKTKGKRFTYKFNFNKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 YGEFVIKDPDEVARLWGRRKCKPQMNYDKLSRALRYYYNKRILHKTKGKRFTYKFNFNKL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 VMPNYPFINIRSSGVVPQSAPPVPTASSRFHFPPLDTHSPTNDVQPGRFSASSLTASGQE :::::::::::::: . CCDS11 VMPNYPFINIRSSGKIQTLLVGN 130 140 >>CCDS30893.1 ETV3L gene_id:440695|Hs108|chr1 (361 aa) initn: 786 init1: 753 opt: 773 Z-score: 555.9 bits: 111.9 E(32554): 1.2e-24 Smith-Waterman score: 779; 40.6% identity (58.7% similar) in 397 aa overlap (1-384:1-360) 10 20 30 40 50 pF1KB7 MKAGCSIVEKPEGGG----GYQFPDWAYKTESSPGSRQIQLWHFILELLQKEEFRHVIAW :. .: : . : : :::::::.:::::::::::::::::::::::::::::: CCDS30 MHCSCLAEGIPANPGNWISGLAFPDWAYKAESSPGSRQIQLWHFILELLQKEEFRHVIAW 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB7 QQGEYGEFVIKDPDEVARLWGRRKCKPQMNYDKLSRALRYYYNKRILHKTKGKRFTYKFN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 QQGEYGEFVIKDPDEVARLWGRRKCKPQMNYDKLSRALRYYYNKRILHKTKGKRFTYKFN 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB7 FNKLVMPNYPFINIRSSGVVPQSAPPVP------TASSRFHFPPLDTHSPTNDVQPGRFS :.::.. :::. ..: ::: : : : . :. ..: .. :. CCDS30 FSKLIVVNYPLWEVR--------APPSPHLLLGAPALCRPALVPVGVQSEL--LHSMLFA 130 140 150 160 170 180 190 200 210 220 pF1KB7 ASSLTA--SGQESSNGTDRKTELSELEDGSAAD-WRRGVDPVSSRNAIGGGGIGHQKRKP .... .::.. : : : . ::... .: : : : .. . : . : CCDS30 HQAMVEQLTGQQTPRGPP---ETSGDKKGSSSSVYRLGSAPGPCRLGLCCHLGSVQGELP 180 190 200 210 220 230 240 250 260 270 280 pF1KB7 DIMLPLFARPGMYPDPHSPFAVSPIPGRGGVLNVPISPALSLTPTIFSYSPSPGLSPFTS . . . : : :.:. :. :. : : : : . :: : CCDS30 GV--------ASFTPPLPP----PLPSNWTCLSGPFLPPL---P---SEQQLPG--AFKP 230 240 250 260 290 300 310 320 330 340 pF1KB7 SSCFSFNPEEMKHYLHSQACSVFNYHLSPRTFPRYPGLMVPPLQCQMHPEESTQFSIKLQ . . .:. . : . .. :. . : : . : ...: . . :. CCDS30 DILLP-GPRSLPGAWHFPGLPLLA-GLGQGAGERLWLLSLRPEGLEVKPAPMMEAKGGLD 270 280 290 300 310 320 350 360 370 380 390 400 pF1KB7 PPPVGRKNRERVESSEESAPVTTPTMASIPPRIKVEPASEKDPESLRQSAREKEEHTQEE : : . .:....::: .:.:.. .. ..: CCDS30 PREVFCPETRRLKTGEES--LTSPNLENLKAVWPLDPP 330 340 350 360 410 420 430 440 450 460 pF1KB7 GTVPSRTIEEEKGTIFARPAAPPIWPSVPISTPSGEPLEVTEDSEDRPGKEPSAPEKKED >>CCDS77308.1 ERF gene_id:2077|Hs108|chr19 (473 aa) initn: 874 init1: 294 opt: 536 Z-score: 389.2 bits: 81.5 E(32554): 2.4e-15 Smith-Waterman score: 898; 40.2% identity (57.9% similar) in 478 aa overlap (85-504:1-427) 60 70 80 90 100 110 pF1KB7 AWQQGEYGEFVIKDPDEVARLWGRRKCKPQMNYDKLSRALRYYYNKRILHKTKGKRFTYK :::::::::::::::::::::::::::::: CCDS77 MNYDKLSRALRYYYNKRILHKTKGKRFTYK 10 20 30 120 130 140 150 160 170 pF1KB7 FNFNKLVMPNYPFINIR-SSGVVPQSAPPVPTASSRFHFPPL---DTHSPTNDVQPGRFS :::::::. :::::.. ..:.:::::::::...:.:.::: .. :::.: : CCDS77 FNFNKLVLVNYPFIDVGLAGGAVPQSAPPVPSGGSHFRFPPSTPSEVLSPTED--PRSPP 40 50 60 70 80 180 190 200 210 220 pF1KB7 ASSLTASGQESSNGTDR--KTELSELEDGSAA-DWRRGVDPVSSRNAIGGGGIGHQKRKP : : ..:. :. . : . .:. ::.. . : :: .: : .: . : CCDS77 ACSSSSSSLFSAVVARRLGRGSVSDCSDGTSELEEPLGEDP-RARPP-GPPDLGAFRGPP 90 100 110 120 130 140 230 240 250 260 270 280 pF1KB7 DIMLP-------LFARPGMYPDPHSPFAVSPIPGRGGVLNVPISPALSLTPTIFSYSPSP :: .. :: :.: ::: :::. : :..: .:::: .::: ..:.::: CCDS77 LARLPHDPGVFRVYPRPRGGPEPLSPFPVSPLAGPGSLLPPQLSPALPMTPTHLAYTPSP 150 160 170 180 190 200 290 300 310 320 pF1KB7 GLSPFTSS-----------SCFSFNPEEMKHYLHSQACSVFNYHLSPRTFPRYPGLMVP- :::. : : :::.::.::.::.... ::.:::::::.: .::::.:: CCDS77 TLSPMYPSGGGGPSGSGGGSHFSFSPEDMKRYLQAHTQSVYNYHLSPRAFLHYPGLVVPQ 210 220 230 240 250 260 330 340 350 360 pF1KB7 ---PLQCQ---MHPEE--------------STQFSIKLQPPPVGRKNRERVESSEESAPV : .: : :: :. :..::::::.::..: :.. .: CCDS77 PQRPDKCPLPPMAPETPPVPSSASSSSSSSSSPFKFKLQPPPLGRRQRAAGEKAVAGADK 270 280 290 300 310 320 370 380 390 400 410 pF1KB7 TTPTMASI------------PPRIKVEPASEKDPESLRQSAREKEEHTQEEGTVPSRTIE . . ... ::.::::: :: . : . : . ..:. CCDS77 SGGSAGGLAEGAGALAPPPPPPQIKVEPISEGESEEV-----EVTDISDED--------- 330 340 350 360 370 420 430 440 450 460 470 pF1KB7 EEKGTIFARPAAPPIWPSVPISTPSGEPLEVTEDSEDRPGKEPSAPEKKEDALMPPKLRL :: : .: : ::: : .: .::. :.: . :: :::. CCDS77 EEDGEVFKTPRAPPAPP---------KP---------EPGEAPGASQ-----CMPLKLRF 380 390 400 480 490 500 510 pF1KB7 KRRWNDDPEARELSKSGKFLWNGSGPQGLATAAADA ::::..: . : .:.:: : CCDS77 KRRWSEDCR----------LEGGGGPAGGFEDEGEDKKVRGEGPGEAGGPLTPRRVSSDL 410 420 430 440 450 512 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 16:20:32 2016 done: Sat Nov 5 16:20:33 2016 Total Scan time: 4.020 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]