FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5244, 356 aa 1>>>pF1KB5244 356 - 356 aa - 356 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.8499+/-0.00089; mu= 3.9335+/- 0.054 mean_var=274.5804+/-55.100, 0's: 0 Z-trim(115.7): 30 B-trim: 0 in 0/54 Lambda= 0.077400 statistics sampled from 16210 (16236) to 16210 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.803), E-opt: 0.2 (0.499), width: 16 Scan time: 2.880 The best scores are: opt bits E(32554) CCDS2283.1 NEUROD1 gene_id:4760|Hs108|chr2 ( 356) 2432 284.1 1.2e-76 CCDS8886.1 NEUROD4 gene_id:58158|Hs108|chr12 ( 331) 1102 135.6 6e-32 CCDS11338.1 NEUROD2 gene_id:4761|Hs108|chr17 ( 382) 1092 134.5 1.4e-31 CCDS5434.1 NEUROD6 gene_id:63974|Hs108|chr7 ( 337) 1011 125.4 6.9e-29 >>CCDS2283.1 NEUROD1 gene_id:4760|Hs108|chr2 (356 aa) initn: 2432 init1: 2432 opt: 2432 Z-score: 1489.3 bits: 284.1 E(32554): 1.2e-76 Smith-Waterman score: 2432; 99.7% identity (100.0% similar) in 356 aa overlap (1-356:1-356) 10 20 30 40 50 60 pF1KB5 MTKSYSESGLMGEPQPQGPPSWTDECLSSQDEEHEADKKEDDLEAMNAEEDSLRNGGEEE ::::::::::::::::::::::::::::::::::::::::::::.::::::::::::::: CCDS22 MTKSYSESGLMGEPQPQGPPSWTDECLSSQDEEHEADKKEDDLETMNAEEDSLRNGGEEE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 DEDEDLEEEEEEEEEDDDQKPKRRGPKKKKMTKARLERFKLRRMKANARERNRMHGLNAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS22 DEDEDLEEEEEEEEEDDDQKPKRRGPKKKKMTKARLERFKLRRMKANARERNRMHGLNAA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 LDNLRKVVPCYSKTQKLSKIETLRLAKNYIWALSEILRSGKSPDLVSFVQTLCKGLSQPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS22 LDNLRKVVPCYSKTQKLSKIETLRLAKNYIWALSEILRSGKSPDLVSFVQTLCKGLSQPT 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 TNLVAGCLQLNPRTFLPEQNQDMPPHLPTASASFPVHPYSYQSPGLPSPPYGTMDSSHVF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS22 TNLVAGCLQLNPRTFLPEQNQDMPPHLPTASASFPVHPYSYQSPGLPSPPYGTMDSSHVF 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 HVKPPPHAYSAALEPFFESPLTDCTSPSFDGPLSPPLSINGNFSFKHEPSAEFEKNYAFT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS22 HVKPPPHAYSAALEPFFESPLTDCTSPSFDGPLSPPLSINGNFSFKHEPSAEFEKNYAFT 250 260 270 280 290 300 310 320 330 340 350 pF1KB5 MHYPAATLAGAQSHGSIFSGTAAPRCEIPIDNIMSFDSHSHHERVMSAQLNAIFHD :::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS22 MHYPAATLAGAQSHGSIFSGTAAPRCEIPIDNIMSFDSHSHHERVMSAQLNAIFHD 310 320 330 340 350 >>CCDS8886.1 NEUROD4 gene_id:58158|Hs108|chr12 (331 aa) initn: 1187 init1: 714 opt: 1102 Z-score: 687.1 bits: 135.6 E(32554): 6e-32 Smith-Waterman score: 1207; 52.9% identity (77.9% similar) in 357 aa overlap (1-354:1-329) 10 20 30 40 50 pF1KB5 MTKSYSESGLMGEPQPQGPPSWTDECLSSQDEEHEADKKEDD---LEAMNAEEDSLRNGG :.:.. .: ::: . ::: :. :.::.: .: ... : ... :.::. CCDS88 MSKTFVKSKEMGEL--VNTPSWMDKGLGSQNEVKEEESRPGTYGMLSSLTEEHDSI---- 10 20 30 40 50 60 70 80 90 100 110 pF1KB5 EEEDEDEDLEEEEEEEEEDDDQKPKRRGPKKKKMTKARLERFKLRRMKANARERNRMHGL :::::::.: .::::::::::::::::::::. ::.:::::::.::::: CCDS88 -----------EEEEEEEEDGEKPKRRGPKKKKMTKARLERFRARRVKANARERTRMHGL 60 70 80 90 100 120 130 140 150 160 170 pF1KB5 NAALDNLRKVVPCYSKTQKLSKIETLRLAKNYIWALSEILRSGKSPDLVSFVQTLCKGLS : ::::::.:.::::::::::::::::::.::::::::.:..:..:. .::. :::::: CCDS88 NDALDNLRRVMPCYSKTQKLSKIETLRLARNYIWALSEVLETGQTPEGKGFVEMLCKGLS 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB5 QPTTNLVAGCLQLNPRTFLPEQNQDMPPHLPTASASFPVHPYSYQSPGLPSPPYGTMDSS :::.:::::::::.:.. : :...: : .: . :: ..:::::::::::: :.. CCDS88 QPTSNLVAGCLQLGPQSVLLEKHEDKSPICDSA---ISVHNFNYQSPGLPSPPYGHMET- 170 180 190 200 210 240 250 260 270 280 290 pF1KB5 HVFHVKPPPHAYSAALEPFFESPLTDCTSPSFDGPLSPPLSINGNFSFKHEPSAEFEKNY :..:.: :..... : : : : ::..: ..:::.:::::.::::.:.. : ..::.: CCDS88 HLLHLK--PQVFKSLGESSFGSHLPDCSTPPYEGPLTPPLSISGNFSLKQDGSPDLEKSY 220 230 240 250 260 270 300 310 320 330 340 350 pF1KB5 AFTMHYPAATLAGAQSHGSIFSGTAAPRCEIPIDNIMSFDSHSHHERVMSAQLNAIFHD .: :::...:.... :.. :.. ..:: ..::: ::.::. :: ...:::..: CCDS88 SFMPHYPSSSLSSGHVHSTPFQA-GTPRYDVPID--MSYDSYPHHG--IGTQLNTVFTE 280 290 300 310 320 330 >>CCDS11338.1 NEUROD2 gene_id:4761|Hs108|chr17 (382 aa) initn: 1075 init1: 811 opt: 1092 Z-score: 680.3 bits: 134.5 E(32554): 1.4e-31 Smith-Waterman score: 1092; 51.5% identity (69.5% similar) in 361 aa overlap (6-356:31-382) 10 20 30 pF1KB5 MTKSYSESGLMGEPQPQGP-PSWTDECLSSQDEEH :..: : : .: :. ... CCDS11 MLTRLFSEPGLLSDVPKFASWGDGEDDEPRSDKGDAPPPPPPAPGPGAPGPARAAKPVPL 10 20 30 40 50 60 40 50 60 70 80 90 pF1KB5 EADKKEDDLEAMNAEEDSLRNGGEEEDEDEDLEEEEEEEEEDDDQKPKRRGPKKKKMTKA .... . : :: : :::::.: ::::: .: . ..::.:::::.::::: CCDS11 RGEEGTEATLAEVKEEGEL--GGEEEEE----EEEEEGLDEAEGERPKKRGPKKRKMTKA 70 80 90 100 110 100 110 120 130 140 150 pF1KB5 RLERFKLRRMKANARERNRMHGLNAALDNLRKVVPCYSKTQKLSKIETLRLAKNYIWALS :::: ::::.::::::::::: :::::::::::::::::::::::::::::::::::::: CCDS11 RLERSKLRRQKANARERNRMHDLNAALDNLRKVVPCYSKTQKLSKIETLRLAKNYIWALS 120 130 140 150 160 170 160 170 180 190 200 210 pF1KB5 EILRSGKSPDLVSFVQTLCKGLSQPTTNLVAGCLQLNPRTFLPEQNQDMPPHLPTASASF ::::::: :::::.::::::::::::::::::::::: :.:: ::. : .. ... : CCDS11 EILRSGKRPDLVSYVQTLCKGLSQPTTNLVAGCLQLNSRNFLTEQGADGAGRFHGSGGPF 180 190 200 210 220 230 220 230 240 250 260 270 pF1KB5 PVHPYSYQSP---GLPSPPYGTMDSSHVFHVKPPPHAYSAALEPFFESPLTDCTSPSFD- .::: : : : . .. . .. :.: :: : .. . .::... CCDS11 AMHPYPYPCSRLAGAQCQAAGGLGGGAAHALRT--HGYCAAYETLYAAAGGGGASPDYNS 240 250 260 270 280 290 280 290 300 310 320 pF1KB5 ----GPLSPPLSINGNFSFKHEPSAEFEKNYAFTMHYPAATLAGAQSHGSIFSGTAAPRC ::::::: .:::::.:.. : . ::.: ..::: : . .:: .: :..: : CCDS11 SEYEGPLSPPLCLNGNFSLKQDSSPDHEKSYHYSMHYSALPGSRPTGHGLVF-GSSAVRG 300 310 320 330 340 350 330 340 350 pF1KB5 EIPIDNIMSFDSHSHHER-VMSAQLNAIFHD . .:..:.: : ::.: : .:::.::. CCDS11 GVHSENLLSYDMHLHHDRGPMYEELNAFFHN 360 370 380 >>CCDS5434.1 NEUROD6 gene_id:63974|Hs108|chr7 (337 aa) initn: 941 init1: 724 opt: 1011 Z-score: 632.1 bits: 125.4 E(32554): 6.9e-29 Smith-Waterman score: 1053; 49.9% identity (71.9% similar) in 359 aa overlap (1-356:2-337) 10 20 30 40 50 pF1KB5 MTKSYSESGLMGEPQPQGPPSWTDECLSSQDEEHEADKKEDDLEAMNAEEDSLRNGGEE .: ..:: .: :. : ... :: ..... : :. . . . :.. . : CCDS54 MLTLPFDESVVM--PESQMCRKFSREC----EDQKQIKKPESFSKQIVLRGKSIKRAPGE 10 20 30 40 50 60 70 80 90 100 110 pF1KB5 EDEDEDLEEEEEEEEEDDDQKPKRRGPKKKKMTKARLERFKLRRMKANARERNRMHGLNA : : : ::::..::::.. :.::: .::: :: :::: :.::..::::::::::::: CCDS54 ETEKE--EEEEDREEEDENGLPRRRGLRKKKTTKLRLERVKFRRQEANARERNRMHGLND 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB5 ALDNLRKVVPCYSKTQKLSKIETLRLAKNYIWALSEILRSGKSPDLVSFVQTLCKGLSQP ::::::::::::::::::::::::::::::::::::::: :: :::..:::.:::::::: CCDS54 ALDNLRKVVPCYSKTQKLSKIETLRLAKNYIWALSEILRIGKRPDLLTFVQNLCKGLSQP 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB5 TTNLVAGCLQLNPRTFLPEQNQDMPPHLPTASASFPVHPYSYQSPGLPSPP-YGTMDSSH :::::::::::: :.:: :. . : . ..: .: :.:: : .:: .::.:.:. CCDS54 TTNLVAGCLQLNARSFLMGQGGEAAHHTRSPYSTF--YP-PYHSPELTTPPGHGTLDNSK 180 190 200 210 220 240 250 260 270 280 290 pF1KB5 VFHVKPPPHAYSAALEPFFESPLTDCTSPSFDGPLSPP-LSINGNFSFKHEPSAEFEKNY .. :. : .: : :.:: .:.::.:.:::::: .. :: ::.:.: . .. ::: CCDS54 SMK----PYNYCSAYESFYESTSPECASPQFEGPLSPPPINYNGIFSLKQEETLDYGKNY 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB5 AFTMHYPAATLAGAQSHGSIFSGTAAPRCEIPIDNIMSFDSHSHHERV-MSAQLNAIFHD . ::: :. : ..:..: ..: :. . .: : . . . :. .:::.::. CCDS54 NYGMHYCAVPPRGPLGQGAMF--------RLPTDSHFPYDLHLRSQSLTMQDELNAVFHN 290 300 310 320 330 356 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 16:25:58 2016 done: Thu Nov 3 16:25:59 2016 Total Scan time: 2.880 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]