FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB6884, 201 aa 1>>>pF1KB6884 201 - 201 aa - 201 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.3785+/-0.000666; mu= 12.8572+/- 0.040 mean_var=62.4288+/-12.260, 0's: 0 Z-trim(109.9): 31 B-trim: 0 in 0/53 Lambda= 0.162324 statistics sampled from 11158 (11186) to 11158 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.732), E-opt: 0.2 (0.344), width: 16 Scan time: 2.020 The best scores are: opt bits E(32554) CCDS8381.1 TAGLN gene_id:6876|Hs108|chr11 ( 201) 1353 324.8 2.2e-89 CCDS33816.1 TAGLN3 gene_id:29114|Hs108|chr3 ( 199) 940 228.1 2.8e-60 CCDS1189.1 TAGLN2 gene_id:8407|Hs108|chr1 ( 199) 919 223.2 8.4e-59 CCDS60314.1 TAGLN2 gene_id:8407|Hs108|chr1 ( 220) 919 223.2 9.2e-59 CCDS65592.1 CNN3 gene_id:1266|Hs108|chr1 ( 288) 374 95.6 3.1e-20 CCDS30775.1 CNN3 gene_id:1266|Hs108|chr1 ( 329) 374 95.7 3.4e-20 CCDS12053.1 CNN2 gene_id:1265|Hs108|chr19 ( 309) 323 83.7 1.3e-16 CCDS77238.1 CNN1 gene_id:1264|Hs108|chr19 ( 247) 301 78.5 3.7e-15 CCDS12054.1 CNN2 gene_id:1265|Hs108|chr19 ( 270) 251 66.8 1.4e-11 >>CCDS8381.1 TAGLN gene_id:6876|Hs108|chr11 (201 aa) initn: 1353 init1: 1353 opt: 1353 Z-score: 1718.4 bits: 324.8 E(32554): 2.2e-89 Smith-Waterman score: 1353; 100.0% identity (100.0% similar) in 201 aa overlap (1-201:1-201) 10 20 30 40 50 60 pF1KB6 MANKGPSYGMSREVQSKIEKKYDEELEERLVEWIIVQCGPDVGRPDRGRLGFQVWLKNGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 MANKGPSYGMSREVQSKIEKKYDEELEERLVEWIIVQCGPDVGRPDRGRLGFQVWLKNGV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB6 ILSKLVNSLYPDGSKPVKVPENPPSMVFKQMEQVAQFLKAAEDYGVIKTDMFQTVDLFEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 ILSKLVNSLYPDGSKPVKVPENPPSMVFKQMEQVAQFLKAAEDYGVIKTDMFQTVDLFEG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB6 KDMAAVQRTLMALGSLAVTKNDGHYRGDPNWFMKKAQEHKREFTESQLQEGKHVIGLQMG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 KDMAAVQRTLMALGSLAVTKNDGHYRGDPNWFMKKAQEHKREFTESQLQEGKHVIGLQMG 130 140 150 160 170 180 190 200 pF1KB6 SNRGASQAGMTGYGRPRQIIS ::::::::::::::::::::: CCDS83 SNRGASQAGMTGYGRPRQIIS 190 200 >>CCDS33816.1 TAGLN3 gene_id:29114|Hs108|chr3 (199 aa) initn: 929 init1: 591 opt: 940 Z-score: 1195.7 bits: 228.1 E(32554): 2.8e-60 Smith-Waterman score: 940; 67.7% identity (88.1% similar) in 201 aa overlap (1-200:1-199) 10 20 30 40 50 60 pF1KB6 MANKGPSYGMSREVQSKIEKKYDEELEERLVEWIIVQCGPDVGRPDRGRLGFQVWLKNGV :::.:::::.::::: :::.::: .::..::.:::.::. :. .: :: :: :: .:. CCDS33 MANRGPSYGLSREVQEKIEQKYDADLENKLVDWIILQCAEDIEHPPPGRAHFQKWLMDGT 10 20 30 40 50 60 70 80 90 100 110 pF1KB6 ILSKLVNSLYPDGSKPV-KVPENPPSMVFKQMEQVAQFLKAAEDYGVIKTDMFQTVDLFE .: ::.::::: :..:. :. :. .:.::::::..::::::: ::: ::.::::::.: CCDS33 VLCKLINSLYPPGQEPIPKISES--KMAFKQMEQISQFLKAAETYGVRTTDIFQTVDLWE 70 80 90 100 110 120 130 140 150 160 170 pF1KB6 GKDMAAVQRTLMALGSLAVTKNDGHYRGDPNWFMKKAQEHKREFTESQLQEGKHVIGLQM ::::::::::::::::.::::.:: :::.:.:: .:::...: :.: ::..:..:::::: CCDS33 GKDMAAVQRTLMALGSVAVTKDDGCYRGEPSWFHRKAQQNRRGFSEEQLRQGQNVIGLQM 120 130 140 150 160 170 180 190 200 pF1KB6 GSNRGASQAGMTGYGRPRQIIS :::.::::::::::: ::::. CCDS33 GSNKGASQAGMTGYGMPRQIM 180 190 >>CCDS1189.1 TAGLN2 gene_id:8407|Hs108|chr1 (199 aa) initn: 930 init1: 567 opt: 919 Z-score: 1169.1 bits: 223.2 E(32554): 8.4e-59 Smith-Waterman score: 919; 65.0% identity (87.5% similar) in 200 aa overlap (1-200:1-199) 10 20 30 40 50 60 pF1KB6 MANKGPSYGMSREVQSKIEKKYDEELEERLVEWIIVQCGPDVGRPDRGRLGFQVWLKNGV :::.::.::.:::::.::::.:: .::. :..:: .:: :::::. :: .:: :::.:. CCDS11 MANRGPAYGLSREVQQKIEKQYDADLEQILIQWITTQCRKDVGRPQPGRENFQNWLKDGT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB6 ILSKLVNSLYPDGSKPVKVPENPPSMVFKQMEQVAQFLKAAEDYGVIKTDMFQTVDLFEG .: .:.:.:::.:. ::: . .:.::::::..:::.::: ::. ::.::::::.:: CCDS11 VLCELINALYPEGQAPVKKIQAS-TMAFKQMEQISQFLQAAERYGINTTDIFQTVDLWEG 70 80 90 100 110 130 140 150 160 170 180 pF1KB6 KDMAAVQRTLMALGSLAVTKNDGHYRGDPNWFMKKAQEHKREFTESQLQEGKHVIGLQMG :.:: :::::: ::.:::...:: . :::::: ::..:. :.:...::::::.::::::: CCDS11 KNMACVQRTLMNLGGLAVARDDGLFSGDPNWFPKKSKENPRNFSDNQLQEGKNVIGLQMG 120 130 140 150 160 170 190 200 pF1KB6 SNRGASQAGMTGYGRPRQIIS .::::::::::::: ::::. CCDS11 TNRGASQAGMTGYGMPRQIL 180 190 >>CCDS60314.1 TAGLN2 gene_id:8407|Hs108|chr1 (220 aa) initn: 914 init1: 567 opt: 919 Z-score: 1168.5 bits: 223.2 E(32554): 9.2e-59 Smith-Waterman score: 919; 65.0% identity (87.5% similar) in 200 aa overlap (1-200:22-220) 10 20 30 pF1KB6 MANKGPSYGMSREVQSKIEKKYDEELEERLVEWIIVQCG :::.::.::.:::::.::::.:: .::. :..:: .:: CCDS60 MSAFSLALALVSSPQPPPPIGMANRGPAYGLSREVQQKIEKQYDADLEQILIQWITTQCR 10 20 30 40 50 60 40 50 60 70 80 90 pF1KB6 PDVGRPDRGRLGFQVWLKNGVILSKLVNSLYPDGSKPVKVPENPPSMVFKQMEQVAQFLK :::::. :: .:: :::.:..: .:.:.:::.:. ::: . .:.::::::..:::. CCDS60 KDVGRPQPGRENFQNWLKDGTVLCELINALYPEGQAPVKKIQAS-TMAFKQMEQISQFLQ 70 80 90 100 110 100 110 120 130 140 150 pF1KB6 AAEDYGVIKTDMFQTVDLFEGKDMAAVQRTLMALGSLAVTKNDGHYRGDPNWFMKKAQEH ::: ::. ::.::::::.:::.:: :::::: ::.:::...:: . :::::: ::..:. CCDS60 AAERYGINTTDIFQTVDLWEGKNMACVQRTLMNLGGLAVARDDGLFSGDPNWFPKKSKEN 120 130 140 150 160 170 160 170 180 190 200 pF1KB6 KREFTESQLQEGKHVIGLQMGSNRGASQAGMTGYGRPRQIIS :.:...::::::.:::::::.::::::::::::: ::::. CCDS60 PRNFSDNQLQEGKNVIGLQMGTNRGASQAGMTGYGMPRQIL 180 190 200 210 220 >>CCDS65592.1 CNN3 gene_id:1266|Hs108|chr1 (288 aa) initn: 497 init1: 161 opt: 374 Z-score: 476.9 bits: 95.6 E(32554): 3.1e-20 Smith-Waterman score: 374; 44.6% identity (73.0% similar) in 148 aa overlap (52-199:7-147) 30 40 50 60 70 80 pF1KB6 YDEELEERLVEWIIVQCGPDVGRPDRGRLGFQVWLKNGVILSKLVNSLYPDGSKPVKVPE ::. ::.:.:: .:.:.: : . : : CCDS65 MSIGPNFQLGLKDGIILCELINKLQPGSVKKV---- 10 20 30 90 100 110 120 130 140 pF1KB6 NPPSMVFKQMEQVAQFLKAAEDYGVIKTDMFQTVDLFEGKDMAAVQRTLMALGSLAVTKN : :. . :.:....:.:: . ::. :.:.. ::::. .:. :: ::.::..:: ::. CCDS65 NESSLNWPQLENIGNFIKAIQAYGMKPHDIFEANDLFENGNMTQVQTTLVALAGLAKTKG 40 50 60 70 80 90 150 160 170 180 190 200 pF1KB6 DGHYRGDPNWFMKKAQEHKREFTESQLQEGKHVIGLQMGSNRGASQAGMTGYGRPRQIIS : : . .: :... :.: :..:. :. :::::::.:. :::::::.:: :.. CCDS65 -FHTTIDIG--VKYAEKQTRRFDEGKLKAGQSVIGLQMGTNKCASQAGMTAYGTRRHLYD 100 110 120 130 140 CCDS65 PKMQTDKPFDQTTISLQMGTNKGASQAGMLAPGTRRDIYDQKLTLQPVDNSTISLQMGTN 150 160 170 180 190 200 >>CCDS30775.1 CNN3 gene_id:1266|Hs108|chr1 (329 aa) initn: 619 init1: 161 opt: 374 Z-score: 475.9 bits: 95.7 E(32554): 3.4e-20 Smith-Waterman score: 496; 45.2% identity (71.6% similar) in 197 aa overlap (3-199:5-188) 10 20 30 40 50 pF1KB6 MANKGPSYGMSREVQSKIEKKYDEELEERLVEWIIVQCGPDVGRPDRGRLGFQVWLKN :::::::.: ::..:: .:::.. :: : .:: : ..: :. ::. ::. CCDS30 MTHFNKGPSYGLSAEVKNKIASKYDHQAEEDLRNWIEEVTGMSIG-PN-----FQLGLKD 10 20 30 40 50 60 70 80 90 100 110 pF1KB6 GVILSKLVNSLYPDGSKPVKVPENPPSMVFKQMEQVAQFLKAAEDYGVIKTDMFQTVDLF :.:: .:.:.: : . : : : :. . :.:....:.:: . ::. :.:.. ::: CCDS30 GIILCELINKLQPGSVKKV----NESSLNWPQLENIGNFIKAIQAYGMKPHDIFEANDLF 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB6 EGKDMAAVQRTLMALGSLAVTKNDGHYRGDPNWFMKKAQEHKREFTESQLQEGKHVIGLQ :. .:. :: ::.::..:: ::. : : . .: :... :.: :..:. :. ::::: CCDS30 ENGNMTQVQTTLVALAGLAKTKG-FHTTIDIG--VKYAEKQTRRFDEGKLKAGQSVIGLQ 120 130 140 150 160 180 190 200 pF1KB6 MGSNRGASQAGMTGYGRPRQIIS ::.:. :::::::.:: :.. CCDS30 MGTNKCASQAGMTAYGTRRHLYDPKMQTDKPFDQTTISLQMGTNKGASQAGMLAPGTRRD 170 180 190 200 210 220 >>CCDS12053.1 CNN2 gene_id:1265|Hs108|chr19 (309 aa) initn: 469 init1: 139 opt: 323 Z-score: 411.8 bits: 83.7 E(32554): 1.3e-16 Smith-Waterman score: 434; 41.6% identity (70.1% similar) in 197 aa overlap (3-199:7-190) 10 20 30 40 50 pF1KB6 MANKGPSYGMSREVQSKIEKKYDEELEERLVEWIIVQCGPDVGRPDRGRLGFQVWL :::::::.: ::.... .::: . : .: :: : ..: :: :: : CCDS12 MSSTQFNKGPSYGLSAEVKNRLLSKYDPQKEAELRTWIEGLTGLSIG-PD-----FQKGL 10 20 30 40 50 60 70 80 90 100 110 pF1KB6 KNGVILSKLVNSLYPDGSKPVKVPENPPSMVFKQMEQVAQFLKAAEDYGVIKTDMFQTVD :.:.:: :.:.: : :: : :. : . ..:.:....:.:: .::. .:.:.. : CCDS12 KDGTILCTLMNKLQP-GSVP-KI--NRSMQNWHQLENLSNFIKAMVSYGMNPVDLFEAND 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB6 LFEGKDMAAVQRTLMALGSLAVTKNDGHYRGDPNWFMKKAQEHKREFTESQLQEGKHVIG :::. .:. :: .:.::.. : :: : : . .: .....:.: .. .. :. ::: CCDS12 LFESGNMTQVQVSLLALAGKAKTK--GLQSG-VDIGVKYSEKQERNFDDATMKAGQCVIG 120 130 140 150 160 180 190 200 pF1KB6 LQMGSNRGASQAGMTGYGRPRQIIS ::::.:. :::.:::.:: :.. CCDS12 LQMGTNKCASQSGMTAYGTRRHLYDPKNHILPPMDHSTISLQMGTNKCASQVGMTAPGTR 170 180 190 200 210 220 >>CCDS77238.1 CNN1 gene_id:1264|Hs108|chr19 (247 aa) initn: 345 init1: 128 opt: 301 Z-score: 385.5 bits: 78.5 E(32554): 3.7e-15 Smith-Waterman score: 349; 40.3% identity (72.2% similar) in 144 aa overlap (56-199:4-138) 30 40 50 60 70 80 pF1KB6 LEERLVEWIIVQCGPDVGRPDRGRLGFQVWLKNGVILSKLVNSLYPDGSKPVKVPENPPS ::.:.:: ...:.: : . : . : . CCDS77 MDGLKDGIILCEFINKLQPGSVKKI----NEST 10 20 90 100 110 120 130 140 pF1KB6 MVFKQMEQVAQFLKAAEDYGVIKTDMFQTVDLFEGKDMAAVQRTLMALGSLAVTKNDGHY . ..:.:....:.:: ::: :.:.. ::::. . . :: ::.::.:.: ::.. CCDS77 QNWHQLENIGNFIKAITKYGVKPHDIFEANDLFENTNHTQVQSTLLALASMAKTKGNKVN 30 40 50 60 70 80 150 160 170 180 190 200 pF1KB6 RGDPNWFMKKAQEHKREFTESQLQEGKHVIGLQMGSNRGASQAGMTGYGRPRQIIS : .: :....:.: ..:.::...::::::.:. ::: :::.:: :.. CCDS77 VG-----VKYAEKQERKFEPGKLREGRNIIGLQMGTNKFASQQGMTAYGTRRHLYDPKLG 90 100 110 120 130 140 CCDS77 TDQPLDQATISLQMGTNKGASQAGMTAPGTKRQIFEPGLGMEHCDTLNVSLQMGSNKGAS 150 160 170 180 190 200 >>CCDS12054.1 CNN2 gene_id:1265|Hs108|chr19 (270 aa) initn: 429 init1: 129 opt: 251 Z-score: 321.6 bits: 66.8 E(32554): 1.4e-11 Smith-Waterman score: 362; 38.4% identity (64.6% similar) in 198 aa overlap (3-199:7-191) 10 20 30 40 50 pF1KB6 MANKGPSYGMSREVQSKIEKKYDEELEERLVEWIIVQCGPDVGRPDRGRLGFQVWL :::::::.: ::.... .::: . : .: :: : ..: :: :: : CCDS12 MSSTQFNKGPSYGLSAEVKNRLLSKYDPQKEAELRTWIEGLTGLSIG-PD-----FQKGL 10 20 30 40 50 60 70 80 90 100 110 pF1KB6 KNGVILSKLVNSLYPDGSKPVKVPENPPSMVFKQMEQVAQFLKAAEDYGVIKTDMFQTVD :.:.:: :.:.: : :: : :. : . ..:.:....:.:: .::. .:.:.. : CCDS12 KDGTILCTLMNKLQP-GSVP-KI--NRSMQNWHQLENLSNFIKAMVSYGMNPVDLFEAND 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB6 LFEGKDMAAVQRTLMALGSLAVTKNDGHYRGDPNWFMKKAQEHKREFTESQLQEGKH-VI :::. .:. :: .:.::.. :.. . : . .. : . . : : .: CCDS12 LFESGNMTQVQVSLLALAGKMGTNKCASQSGMTAYGTRR---HLYDPKNHILPPMDHSTI 120 130 140 150 160 180 190 200 pF1KB6 GLQMGSNRGASQAGMTGYGRPRQIIS .::::.:. :::.:::. : :.: CCDS12 SLQMGTNKCASQVGMTAPGTRRHIYDTKLGTDKCDNSSMSLQMGYTQGANQSGQVFGLGR 170 180 190 200 210 220 201 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 14:02:36 2016 done: Fri Nov 4 14:02:36 2016 Total Scan time: 2.020 Total Display time: -0.010 Function used was FASTA [36.3.4 Apr, 2011]