FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB9628, 331 aa 1>>>pF1KB9628 331 - 331 aa - 331 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.3894+/-0.000754; mu= 8.5863+/- 0.046 mean_var=145.0325+/-29.956, 0's: 0 Z-trim(114.0): 45 B-trim: 621 in 1/55 Lambda= 0.106498 statistics sampled from 14563 (14608) to 14563 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.788), E-opt: 0.2 (0.449), width: 16 Scan time: 3.010 The best scores are: opt bits E(32554) CCDS8886.1 NEUROD4 gene_id:58158|Hs108|chr12 ( 331) 2245 355.8 2.9e-98 CCDS2283.1 NEUROD1 gene_id:4760|Hs108|chr2 ( 356) 1102 180.2 2.2e-45 CCDS5434.1 NEUROD6 gene_id:63974|Hs108|chr7 ( 337) 827 137.9 1.1e-32 CCDS11338.1 NEUROD2 gene_id:4761|Hs108|chr17 ( 382) 653 111.2 1.4e-24 >>CCDS8886.1 NEUROD4 gene_id:58158|Hs108|chr12 (331 aa) initn: 2245 init1: 2245 opt: 2245 Z-score: 1877.7 bits: 355.8 E(32554): 2.9e-98 Smith-Waterman score: 2245; 100.0% identity (100.0% similar) in 331 aa overlap (1-331:1-331) 10 20 30 40 50 60 pF1KB9 MSKTFVKSKEMGELVNTPSWMDKGLGSQNEVKEEESRPGTYGMLSSLTEEHDSIEEEEEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 MSKTFVKSKEMGELVNTPSWMDKGLGSQNEVKEEESRPGTYGMLSSLTEEHDSIEEEEEE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 EEDGEKPKRRGPKKKKMTKARLERFRARRVKANARERTRMHGLNDALDNLRRVMPCYSKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 EEDGEKPKRRGPKKKKMTKARLERFRARRVKANARERTRMHGLNDALDNLRRVMPCYSKT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB9 QKLSKIETLRLARNYIWALSEVLETGQTPEGKGFVEMLCKGLSQPTSNLVAGCLQLGPQS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 QKLSKIETLRLARNYIWALSEVLETGQTPEGKGFVEMLCKGLSQPTSNLVAGCLQLGPQS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB9 VLLEKHEDKSPICDSAISVHNFNYQSPGLPSPPYGHMETHLLHLKPQVFKSLGESSFGSH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 VLLEKHEDKSPICDSAISVHNFNYQSPGLPSPPYGHMETHLLHLKPQVFKSLGESSFGSH 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB9 LPDCSTPPYEGPLTPPLSISGNFSLKQDGSPDLEKSYSFMPHYPSSSLSSGHVHSTPFQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 LPDCSTPPYEGPLTPPLSISGNFSLKQDGSPDLEKSYSFMPHYPSSSLSSGHVHSTPFQA 250 260 270 280 290 300 310 320 330 pF1KB9 GTPRYDVPIDMSYDSYPHHGIGTQLNTVFTE ::::::::::::::::::::::::::::::: CCDS88 GTPRYDVPIDMSYDSYPHHGIGTQLNTVFTE 310 320 330 >>CCDS2283.1 NEUROD1 gene_id:4760|Hs108|chr2 (356 aa) initn: 1210 init1: 714 opt: 1102 Z-score: 928.1 bits: 180.2 E(32554): 2.2e-45 Smith-Waterman score: 1208; 53.4% identity (77.4% similar) in 358 aa overlap (1-329:1-354) 10 20 30 40 50 pF1KB9 MSKTFVKSKEMGELV--NTPSWMDKGLGSQNEVKEEESRPGTYGMLSSLTEEHDSI---- :.:.. .: ::: . ::: :. :.::.: .: ... : ... :.::. CCDS22 MTKSYSESGLMGEPQPQGPPSWTDECLSSQDEEHEADKKEDD---LETMNAEEDSLRNGG 10 20 30 40 50 60 70 80 90 100 pF1KB9 -----------EEEEEEEEDGEKPKRRGPKKKKMTKARLERFRARRVKANARERTRMHGL :::::::.: .::::::::::::::::::::. ::.:::::::.::::: CCDS22 EEEDEDEDLEEEEEEEEEDDDQKPKRRGPKKKKMTKARLERFKLRRMKANARERNRMHGL 60 70 80 90 100 110 110 120 130 140 150 160 pF1KB9 NDALDNLRRVMPCYSKTQKLSKIETLRLARNYIWALSEVLETGQTPEGKGFVEMLCKGLS : ::::::.:.::::::::::::::::::.::::::::.:..:..:. .::. :::::: CCDS22 NAALDNLRKVVPCYSKTQKLSKIETLRLAKNYIWALSEILRSGKSPDLVSFVQTLCKGLS 120 130 140 150 160 170 170 180 190 200 210 pF1KB9 QPTSNLVAGCLQLGPQSVLLEKHEDKSPICDSA---ISVHNFNYQSPGLPSPPYGHMET- :::.:::::::::.:.. : :...: : .: . :: ..:::::::::::: :.. CCDS22 QPTTNLVAGCLQLNPRTFLPEQNQDMPPHLPTASASFPVHPYSYQSPGLPSPPYGTMDSS 180 190 200 210 220 230 220 230 240 250 260 270 pF1KB9 HLLHLKP--QVFKSLGESSFGSHLPDCSTPPYEGPLTPPLSISGNFSLKQDGSPDLEKSY :..:.:: ..... : : : : ::..: ..:::.:::::.::::.:.. : ..::.: CCDS22 HVFHVKPPPHAYSAALEPFFESPLTDCTSPSFDGPLSPPLSINGNFSFKHEPSAEFEKNY 240 250 260 270 280 290 280 290 300 310 320 330 pF1KB9 SFMPHYPSSSLSSGHVHSTPFQAGT--PRYDVPID--MSYDSYPHHG--IGTQLNTVFTE .: :::...:.... :.. : .:: :: ..::: ::.::. :: ...:::..: CCDS22 AFTMHYPAATLAGAQSHGSIF-SGTAAPRCEIPIDNIMSFDSHSHHERVMSAQLNAIFHD 300 310 320 330 340 350 >>CCDS5434.1 NEUROD6 gene_id:63974|Hs108|chr7 (337 aa) initn: 737 init1: 737 opt: 827 Z-score: 700.1 bits: 137.9 E(32554): 1.1e-32 Smith-Waterman score: 827; 51.3% identity (72.3% similar) in 267 aa overlap (49-307:54-318) 20 30 40 50 60 70 pF1KB9 SWMDKGLGSQNEVKEEESRPGTYGMLSSLTEEHDSIEEEEEEEEDGEK--PKRRGPKKKK :: .. ::::..::. :. :.::: .::: CCDS54 ECEDQKQIKKPESFSKQIVLRGKSIKRAPGEETEKEEEEEDREEEDENGLPRRRGLRKKK 30 40 50 60 70 80 80 90 100 110 120 130 pF1KB9 MTKARLERFRARRVKANARERTRMHGLNDALDNLRRVMPCYSKTQKLSKIETLRLARNYI :: :::: . :: .::::::.:::::::::::::.:.::::::::::::::::::.::: CCDS54 TTKLRLERVKFRRQEANARERNRMHGLNDALDNLRKVVPCYSKTQKLSKIETLRLAKNYI 90 100 110 120 130 140 140 150 160 170 180 190 pF1KB9 WALSEVLETGQTPEGKGFVEMLCKGLSQPTSNLVAGCLQLGPQSVLLEKHEDKSPICDSA :::::.:. :. :. ::. :::::::::.:::::::::. .: :. . . . : CCDS54 WALSEILRIGKRPDLLTFVQNLCKGLSQPTTNLVAGCLQLNARSFLMGQGGEAAHHTRSP 150 160 170 180 190 200 200 210 220 230 240 250 pF1KB9 ISVHNFNYQSPGLPSPP-YGHMETHLLHLKPQVFKSLGESSFGSHLPDCSTPPYEGPLTP :. :.:: : .:: .: ... .:: . : :: . : :.:..: .::::.: CCDS54 YSTFYPPYHSPELTTPPGHGTLDNSK-SMKPYNYCSAYESFYESTSPECASPQFEGPLSP 210 220 230 240 250 260 260 270 280 290 300 310 pF1KB9 P-LSISGNFSLKQDGSPDLEKSYSFMPHY----PSSSLSSGHVHSTPFQAGTPRYDVPID : .. .: :::::. . : :.:.. :: : . :..: . : .. : ::. CCDS54 PPINYNGIFSLKQEETLDYGKNYNYGMHYCAVPPRGPLGQGAMFRLPTDSHFP-YDLHLR 270 280 290 300 310 320 320 330 pF1KB9 MSYDSYPHHGIGTQLNTVFTE CCDS54 SQSLTMQDELNAVFHN 330 >>CCDS11338.1 NEUROD2 gene_id:4761|Hs108|chr17 (382 aa) initn: 926 init1: 642 opt: 653 Z-score: 554.9 bits: 111.2 E(32554): 1.4e-24 Smith-Waterman score: 849; 48.4% identity (67.7% similar) in 316 aa overlap (39-329:65-380) 10 20 30 40 50 60 pF1KB9 KEMGELVNTPSWMDKGLGSQNEVKEEESRPGTYGMLSSLTEEHD-SIEEEEEEEED---- :: . :. . :: . . ::::::::. CCDS11 DAPPPPPPAPGPGAPGPARAAKPVPLRGEEGTEATLAEVKEEGELGGEEEEEEEEEEGLD 40 50 60 70 80 90 70 80 90 100 110 120 pF1KB9 ---GEKPKRRGPKKKKMTKARLERFRARRVKANARERTRMHGLNDALDNLRRVMPCYSKT ::.::.:::::.::::::::: . :: :::::::.::: :: ::::::.:.:::::: CCDS11 EAEGERPKKRGPKKRKMTKARLERSKLRRQKANARERNRMHDLNAALDNLRKVVPCYSKT 100 110 120 130 140 150 130 140 150 160 170 180 pF1KB9 QKLSKIETLRLARNYIWALSEVLETGQTPEGKGFVEMLCKGLSQPTSNLVAGCLQLGPQS ::::::::::::.::::::::.:..:. :. ..:. :::::::::.:::::::::. .. CCDS11 QKLSKIETLRLAKNYIWALSEILRSGKRPDLVSYVQTLCKGLSQPTTNLVAGCLQLNSRN 160 170 180 190 200 210 190 200 210 220 pF1KB9 VLLEKHEDKSPICDSA---ISVHNFNYQSPGLPSPP------YGHMETHLL--HLKPQVF : :. : . .. ...: . : : . : .: : : .. CCDS11 FLTEQGADGAGRFHGSGGPFAMHPYPYPCSRLAGAQCQAAGGLGGGAAHALRTHGYCAAY 220 230 240 250 260 270 230 240 250 260 270 280 pF1KB9 KSL-GESSFGSHLPDCSTPPYEGPLTPPLSISGNFSLKQDGSPDLEKSYSFMPHYPSSSL ..: . .. :. :: .. :::::.::: ..::::::::.::: :::: . :: . CCDS11 ETLYAAAGGGGASPDYNSSEYEGPLSPPLCLNGNFSLKQDSSPDHEKSYHYSMHYSALPG 280 290 300 310 320 330 290 300 310 320 330 pF1KB9 SSGHVHSTPFQAGTPRYDVPID--MSYDSYPHHGIGT---QLNTVFTE : :. : ... : : . .::: . :: : .::. : CCDS11 SRPTGHGLVFGSSAVRGGVHSENLLSYDMHLHHDRGPMYEELNAFFHN 340 350 360 370 380 331 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 17:48:39 2016 done: Fri Nov 4 17:48:39 2016 Total Scan time: 3.010 Total Display time: 0.000 Function used was FASTA [36.3.4 Apr, 2011]