FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB9629, 337 aa 1>>>pF1KB9629 337 - 337 aa - 337 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.4999+/-0.000782; mu= 7.8451+/- 0.048 mean_var=152.1036+/-30.396, 0's: 0 Z-trim(113.6): 45 B-trim: 0 in 0/54 Lambda= 0.103993 statistics sampled from 14210 (14255) to 14210 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.78), E-opt: 0.2 (0.438), width: 16 Scan time: 2.190 The best scores are: opt bits E(32554) CCDS5434.1 NEUROD6 gene_id:63974|Hs108|chr7 ( 337) 2301 356.3 2e-98 CCDS2283.1 NEUROD1 gene_id:4760|Hs108|chr2 ( 356) 1011 162.8 3.9e-40 CCDS8886.1 NEUROD4 gene_id:58158|Hs108|chr12 ( 331) 827 135.2 7.5e-32 CCDS11338.1 NEUROD2 gene_id:4761|Hs108|chr17 ( 382) 788 129.4 4.8e-30 >>CCDS5434.1 NEUROD6 gene_id:63974|Hs108|chr7 (337 aa) initn: 2301 init1: 2301 opt: 2301 Z-score: 1880.4 bits: 356.3 E(32554): 2e-98 Smith-Waterman score: 2301; 100.0% identity (100.0% similar) in 337 aa overlap (1-337:1-337) 10 20 30 40 50 60 pF1KB9 MLTLPFDESVVMPESQMCRKFSRECEDQKQIKKPESFSKQIVLRGKSIKRAPGEETEKEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 MLTLPFDESVVMPESQMCRKFSRECEDQKQIKKPESFSKQIVLRGKSIKRAPGEETEKEE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 EEEDREEEDENGLPRRRGLRKKKTTKLRLERVKFRRQEANARERNRMHGLNDALDNLRKV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 EEEDREEEDENGLPRRRGLRKKKTTKLRLERVKFRRQEANARERNRMHGLNDALDNLRKV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB9 VPCYSKTQKLSKIETLRLAKNYIWALSEILRIGKRPDLLTFVQNLCKGLSQPTTNLVAGC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 VPCYSKTQKLSKIETLRLAKNYIWALSEILRIGKRPDLLTFVQNLCKGLSQPTTNLVAGC 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB9 LQLNARSFLMGQGGEAAHHTRSPYSTFYPPYHSPELTTPPGHGTLDNSKSMKPYNYCSAY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 LQLNARSFLMGQGGEAAHHTRSPYSTFYPPYHSPELTTPPGHGTLDNSKSMKPYNYCSAY 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB9 ESFYESTSPECASPQFEGPLSPPPINYNGIFSLKQEETLDYGKNYNYGMHYCAVPPRGPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 ESFYESTSPECASPQFEGPLSPPPINYNGIFSLKQEETLDYGKNYNYGMHYCAVPPRGPL 250 260 270 280 290 300 310 320 330 pF1KB9 GQGAMFRLPTDSHFPYDLHLRSQSLTMQDELNAVFHN ::::::::::::::::::::::::::::::::::::: CCDS54 GQGAMFRLPTDSHFPYDLHLRSQSLTMQDELNAVFHN 310 320 330 >>CCDS2283.1 NEUROD1 gene_id:4760|Hs108|chr2 (356 aa) initn: 941 init1: 724 opt: 1011 Z-score: 834.1 bits: 162.8 E(32554): 3.9e-40 Smith-Waterman score: 1053; 49.9% identity (71.9% similar) in 359 aa overlap (2-337:1-356) 10 20 30 40 50 pF1KB9 MLTLPFDESVVM--PESQMCRKFSREC----EDQKQIKKPESFSKQIVLRGKSIKRAPGE .: ..:: .: :. : ... :: ..... : :. . . . :.. . : CCDS22 MTKSYSESGLMGEPQPQGPPSWTDECLSSQDEEHEADKKEDDLETMNAEEDSLRNGGEE 10 20 30 40 50 60 70 80 90 100 110 pF1KB9 ETEKE--EEEEDREEEDENGLPRRRGLRKKKTTKLRLERVKFRRQEANARERNRMHGLND : : : ::::..::::.. :.::: .::: :: :::: :.::..::::::::::::: CCDS22 EDEDEDLEEEEEEEEEDDDQKPKRRGPKKKKMTKARLERFKLRRMKANARERNRMHGLNA 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB9 ALDNLRKVVPCYSKTQKLSKIETLRLAKNYIWALSEILRIGKRPDLLTFVQNLCKGLSQP ::::::::::::::::::::::::::::::::::::::: :: :::..:::.:::::::: CCDS22 ALDNLRKVVPCYSKTQKLSKIETLRLAKNYIWALSEILRSGKSPDLVSFVQTLCKGLSQP 120 130 140 150 160 170 180 190 200 210 220 pF1KB9 TTNLVAGCLQLNARSFLMGQGGEAAHHTRSPYSTF--YP-PYHSPELTTPPGHGTLDNSK :::::::::::: :.:: :. . : . ..: .: :.:: : .:: .::.:.:. CCDS22 TTNLVAGCLQLNPRTFLPEQNQDMPPHLPTASASFPVHPYSYQSPGLPSPP-YGTMDSSH 180 190 200 210 220 230 230 240 250 260 270 280 pF1KB9 SMK----PYNYCSAYESFYESTSPECASPQFEGPLSPPPINYNGIFSLKQEETLDYGKNY .. :. : .: : :.:: .:.::.:.:::::: .. :: ::.:.: . .. ::: CCDS22 VFHVKPPPHAYSAALEPFFESPLTDCTSPSFDGPLSPP-LSINGNFSFKHEPSAEFEKNY 240 250 260 270 280 290 290 300 310 320 330 pF1KB9 NYGMHYCAVPPRGPLGQGAMF--------RLPTDSHFPYDLHLRSQSLTMQDELNAVFHN . ::: :. : ..:..: ..: :. . .: : . . . :. .:::.::. CCDS22 AFTMHYPAATLAGAQSHGSIFSGTAAPRCEIPIDNIMSFDSHSHHERV-MSAQLNAIFHD 300 310 320 330 340 350 >>CCDS8886.1 NEUROD4 gene_id:58158|Hs108|chr12 (331 aa) initn: 737 init1: 737 opt: 827 Z-score: 685.4 bits: 135.2 E(32554): 7.5e-32 Smith-Waterman score: 827; 51.3% identity (72.3% similar) in 267 aa overlap (54-318:49-307) 30 40 50 60 70 80 pF1KB9 ECEDQKQIKKPESFSKQIVLRGKSIKRAPGEETEKEEEEEDREEEDENGLPRRRGLRKKK :: .. ::::..::. :. :.::: .::: CCDS88 SWMDKGLGSQNEVKEEESRPGTYGMLSSLTEEHDSIEEEEEEEEDGEK--PKRRGPKKKK 20 30 40 50 60 70 90 100 110 120 130 140 pF1KB9 TTKLRLERVKFRRQEANARERNRMHGLNDALDNLRKVVPCYSKTQKLSKIETLRLAKNYI :: :::: . :: .::::::.:::::::::::::.:.::::::::::::::::::.::: CCDS88 MTKARLERFRARRVKANARERTRMHGLNDALDNLRRVMPCYSKTQKLSKIETLRLARNYI 80 90 100 110 120 130 150 160 170 180 190 200 pF1KB9 WALSEILRIGKRPDLLTFVQNLCKGLSQPTTNLVAGCLQLNARSFLMGQGGEAAHHTRSP :::::.:. :. :. ::. :::::::::.:::::::::. .: :. . . . : CCDS88 WALSEVLETGQTPEGKGFVEMLCKGLSQPTSNLVAGCLQLGPQSVLLEKHEDKSPICDSA 140 150 160 170 180 190 210 220 230 240 250 260 pF1KB9 YSTFYPPYHSPELTTPPGHGTLDNSK-SMKPYNYCSAYESFYESTSPECASPQFEGPLSP :. :.:: : .:: .: ... .:: . : :: . : :.:..: .::::.: CCDS88 ISVHNFNYQSPGLPSPP-YGHMETHLLHLKPQVFKSLGESSFGSHLPDCSTPPYEGPLTP 200 210 220 230 240 250 270 280 290 300 310 320 pF1KB9 PPINYNGIFSLKQEETLDYGKNYNYGMHYCAVPPRGPLGQGAMFRLPTDSHFP-YDLHLR : .. .: :::::. . : :.:.. :: : . :..: . : .. : ::. CCDS88 P-LSISGNFSLKQDGSPDLEKSYSFMPHY----PSSSLSSGHVHSTPFQAGTPRYDVPID 260 270 280 290 300 310 330 pF1KB9 SQSLTMQDELNAVFHN CCDS88 MSYDSYPHHGIGTQLNTVFTE 320 330 >>CCDS11338.1 NEUROD2 gene_id:4761|Hs108|chr17 (382 aa) initn: 1037 init1: 696 opt: 788 Z-score: 652.9 bits: 129.4 E(32554): 4.8e-30 Smith-Waterman score: 1014; 51.7% identity (72.1% similar) in 333 aa overlap (34-337:51-382) 10 20 30 40 50 60 pF1KB9 LPFDESVVMPESQMCRKFSRECEDQKQIKKPESFSKQIVLRGKSIKRAPGEETEKEEE-- : .: . :::. .: :...: : CCDS11 WGDGEDDEPRSDKGDAPPPPPPAPGPGAPGPARAAKPVPLRGEEGTEATLAEVKEEGELG 30 40 50 60 70 80 70 80 90 100 110 pF1KB9 -EEDREEEDENGL-------PRRRGLRKKKTTKLRLERVKFRRQEANARERNRMHGLNDA ::..:::.:.:: :..:: .:.: :: :::: :.:::.:::::::::: :: : CCDS11 GEEEEEEEEEEGLDEAEGERPKKRGPKKRKMTKARLERSKLRRQKANARERNRMHDLNAA 90 100 110 120 130 140 120 130 140 150 160 170 pF1KB9 LDNLRKVVPCYSKTQKLSKIETLRLAKNYIWALSEILRIGKRPDLLTFVQNLCKGLSQPT :::::::::::::::::::::::::::::::::::::: ::::::...::.::::::::: CCDS11 LDNLRKVVPCYSKTQKLSKIETLRLAKNYIWALSEILRSGKRPDLVSYVQTLCKGLSQPT 150 160 170 180 190 200 180 190 200 210 220 pF1KB9 TNLVAGCLQLNARSFLMGQGGEAA---HHTRSPYSTFYPPYHSPELTTPPGH--GTLDN- :::::::::::.:.:: ::...: : . .:.. :: .:. . : : . CCDS11 TNLVAGCLQLNSRNFLTEQGADGAGRFHGSGGPFAMHPYPYPCSRLAGAQCQAAGGLGGG 210 220 230 240 250 260 230 240 250 260 270 280 pF1KB9 -SKSMKPYNYCSAYESFYEST-----SPECASPQFEGPLSPPPINYNGIFSLKQEETLDY ..... ..::.:::..: .. ::. : ..::::::: . :: :::::. . :. CCDS11 AAHALRTHGYCAAYETLYAAAGGGGASPDYNSSEYEGPLSPP-LCLNGNFSLKQDSSPDH 270 280 290 300 310 290 300 310 320 330 pF1KB9 GKNYNYGMHYCAVPPRGPLGQGAMFR-------LPTDSHFPYDLHLRSQSLTMQDELNAV :.:.:.::: :.: : :.: .: . ... . ::.::. . : .:::: CCDS11 EKSYHYSMHYSALPGSRPTGHGLVFGSSAVRGGVHSENLLSYDMHLHHDRGPMYEELNAF 320 330 340 350 360 370 pF1KB9 FHN ::: CCDS11 FHN 380 337 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 17:49:13 2016 done: Fri Nov 4 17:49:14 2016 Total Scan time: 2.190 Total Display time: -0.010 Function used was FASTA [36.3.4 Apr, 2011]