FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB6884, 201 aa
1>>>pF1KB6884 201 - 201 aa - 201 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.3785+/-0.000666; mu= 12.8572+/- 0.040
mean_var=62.4288+/-12.260, 0's: 0 Z-trim(109.9): 31 B-trim: 0 in 0/53
Lambda= 0.162324
statistics sampled from 11158 (11186) to 11158 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.732), E-opt: 0.2 (0.344), width: 16
Scan time: 2.020
The best scores are: opt bits E(32554)
CCDS8381.1 TAGLN gene_id:6876|Hs108|chr11 ( 201) 1353 324.8 2.2e-89
CCDS33816.1 TAGLN3 gene_id:29114|Hs108|chr3 ( 199) 940 228.1 2.8e-60
CCDS1189.1 TAGLN2 gene_id:8407|Hs108|chr1 ( 199) 919 223.2 8.4e-59
CCDS60314.1 TAGLN2 gene_id:8407|Hs108|chr1 ( 220) 919 223.2 9.2e-59
CCDS65592.1 CNN3 gene_id:1266|Hs108|chr1 ( 288) 374 95.6 3.1e-20
CCDS30775.1 CNN3 gene_id:1266|Hs108|chr1 ( 329) 374 95.7 3.4e-20
CCDS12053.1 CNN2 gene_id:1265|Hs108|chr19 ( 309) 323 83.7 1.3e-16
CCDS77238.1 CNN1 gene_id:1264|Hs108|chr19 ( 247) 301 78.5 3.7e-15
CCDS12054.1 CNN2 gene_id:1265|Hs108|chr19 ( 270) 251 66.8 1.4e-11
>>CCDS8381.1 TAGLN gene_id:6876|Hs108|chr11 (201 aa)
initn: 1353 init1: 1353 opt: 1353 Z-score: 1718.4 bits: 324.8 E(32554): 2.2e-89
Smith-Waterman score: 1353; 100.0% identity (100.0% similar) in 201 aa overlap (1-201:1-201)
10 20 30 40 50 60
pF1KB6 MANKGPSYGMSREVQSKIEKKYDEELEERLVEWIIVQCGPDVGRPDRGRLGFQVWLKNGV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 MANKGPSYGMSREVQSKIEKKYDEELEERLVEWIIVQCGPDVGRPDRGRLGFQVWLKNGV
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB6 ILSKLVNSLYPDGSKPVKVPENPPSMVFKQMEQVAQFLKAAEDYGVIKTDMFQTVDLFEG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 ILSKLVNSLYPDGSKPVKVPENPPSMVFKQMEQVAQFLKAAEDYGVIKTDMFQTVDLFEG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB6 KDMAAVQRTLMALGSLAVTKNDGHYRGDPNWFMKKAQEHKREFTESQLQEGKHVIGLQMG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 KDMAAVQRTLMALGSLAVTKNDGHYRGDPNWFMKKAQEHKREFTESQLQEGKHVIGLQMG
130 140 150 160 170 180
190 200
pF1KB6 SNRGASQAGMTGYGRPRQIIS
:::::::::::::::::::::
CCDS83 SNRGASQAGMTGYGRPRQIIS
190 200
>>CCDS33816.1 TAGLN3 gene_id:29114|Hs108|chr3 (199 aa)
initn: 929 init1: 591 opt: 940 Z-score: 1195.7 bits: 228.1 E(32554): 2.8e-60
Smith-Waterman score: 940; 67.7% identity (88.1% similar) in 201 aa overlap (1-200:1-199)
10 20 30 40 50 60
pF1KB6 MANKGPSYGMSREVQSKIEKKYDEELEERLVEWIIVQCGPDVGRPDRGRLGFQVWLKNGV
:::.:::::.::::: :::.::: .::..::.:::.::. :. .: :: :: :: .:.
CCDS33 MANRGPSYGLSREVQEKIEQKYDADLENKLVDWIILQCAEDIEHPPPGRAHFQKWLMDGT
10 20 30 40 50 60
70 80 90 100 110
pF1KB6 ILSKLVNSLYPDGSKPV-KVPENPPSMVFKQMEQVAQFLKAAEDYGVIKTDMFQTVDLFE
.: ::.::::: :..:. :. :. .:.::::::..::::::: ::: ::.::::::.:
CCDS33 VLCKLINSLYPPGQEPIPKISES--KMAFKQMEQISQFLKAAETYGVRTTDIFQTVDLWE
70 80 90 100 110
120 130 140 150 160 170
pF1KB6 GKDMAAVQRTLMALGSLAVTKNDGHYRGDPNWFMKKAQEHKREFTESQLQEGKHVIGLQM
::::::::::::::::.::::.:: :::.:.:: .:::...: :.: ::..:..::::::
CCDS33 GKDMAAVQRTLMALGSVAVTKDDGCYRGEPSWFHRKAQQNRRGFSEEQLRQGQNVIGLQM
120 130 140 150 160 170
180 190 200
pF1KB6 GSNRGASQAGMTGYGRPRQIIS
:::.::::::::::: ::::.
CCDS33 GSNKGASQAGMTGYGMPRQIM
180 190
>>CCDS1189.1 TAGLN2 gene_id:8407|Hs108|chr1 (199 aa)
initn: 930 init1: 567 opt: 919 Z-score: 1169.1 bits: 223.2 E(32554): 8.4e-59
Smith-Waterman score: 919; 65.0% identity (87.5% similar) in 200 aa overlap (1-200:1-199)
10 20 30 40 50 60
pF1KB6 MANKGPSYGMSREVQSKIEKKYDEELEERLVEWIIVQCGPDVGRPDRGRLGFQVWLKNGV
:::.::.::.:::::.::::.:: .::. :..:: .:: :::::. :: .:: :::.:.
CCDS11 MANRGPAYGLSREVQQKIEKQYDADLEQILIQWITTQCRKDVGRPQPGRENFQNWLKDGT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB6 ILSKLVNSLYPDGSKPVKVPENPPSMVFKQMEQVAQFLKAAEDYGVIKTDMFQTVDLFEG
.: .:.:.:::.:. ::: . .:.::::::..:::.::: ::. ::.::::::.::
CCDS11 VLCELINALYPEGQAPVKKIQAS-TMAFKQMEQISQFLQAAERYGINTTDIFQTVDLWEG
70 80 90 100 110
130 140 150 160 170 180
pF1KB6 KDMAAVQRTLMALGSLAVTKNDGHYRGDPNWFMKKAQEHKREFTESQLQEGKHVIGLQMG
:.:: :::::: ::.:::...:: . :::::: ::..:. :.:...::::::.:::::::
CCDS11 KNMACVQRTLMNLGGLAVARDDGLFSGDPNWFPKKSKENPRNFSDNQLQEGKNVIGLQMG
120 130 140 150 160 170
190 200
pF1KB6 SNRGASQAGMTGYGRPRQIIS
.::::::::::::: ::::.
CCDS11 TNRGASQAGMTGYGMPRQIL
180 190
>>CCDS60314.1 TAGLN2 gene_id:8407|Hs108|chr1 (220 aa)
initn: 914 init1: 567 opt: 919 Z-score: 1168.5 bits: 223.2 E(32554): 9.2e-59
Smith-Waterman score: 919; 65.0% identity (87.5% similar) in 200 aa overlap (1-200:22-220)
10 20 30
pF1KB6 MANKGPSYGMSREVQSKIEKKYDEELEERLVEWIIVQCG
:::.::.::.:::::.::::.:: .::. :..:: .::
CCDS60 MSAFSLALALVSSPQPPPPIGMANRGPAYGLSREVQQKIEKQYDADLEQILIQWITTQCR
10 20 30 40 50 60
40 50 60 70 80 90
pF1KB6 PDVGRPDRGRLGFQVWLKNGVILSKLVNSLYPDGSKPVKVPENPPSMVFKQMEQVAQFLK
:::::. :: .:: :::.:..: .:.:.:::.:. ::: . .:.::::::..:::.
CCDS60 KDVGRPQPGRENFQNWLKDGTVLCELINALYPEGQAPVKKIQAS-TMAFKQMEQISQFLQ
70 80 90 100 110
100 110 120 130 140 150
pF1KB6 AAEDYGVIKTDMFQTVDLFEGKDMAAVQRTLMALGSLAVTKNDGHYRGDPNWFMKKAQEH
::: ::. ::.::::::.:::.:: :::::: ::.:::...:: . :::::: ::..:.
CCDS60 AAERYGINTTDIFQTVDLWEGKNMACVQRTLMNLGGLAVARDDGLFSGDPNWFPKKSKEN
120 130 140 150 160 170
160 170 180 190 200
pF1KB6 KREFTESQLQEGKHVIGLQMGSNRGASQAGMTGYGRPRQIIS
:.:...::::::.:::::::.::::::::::::: ::::.
CCDS60 PRNFSDNQLQEGKNVIGLQMGTNRGASQAGMTGYGMPRQIL
180 190 200 210 220
>>CCDS65592.1 CNN3 gene_id:1266|Hs108|chr1 (288 aa)
initn: 497 init1: 161 opt: 374 Z-score: 476.9 bits: 95.6 E(32554): 3.1e-20
Smith-Waterman score: 374; 44.6% identity (73.0% similar) in 148 aa overlap (52-199:7-147)
30 40 50 60 70 80
pF1KB6 YDEELEERLVEWIIVQCGPDVGRPDRGRLGFQVWLKNGVILSKLVNSLYPDGSKPVKVPE
::. ::.:.:: .:.:.: : . : :
CCDS65 MSIGPNFQLGLKDGIILCELINKLQPGSVKKV----
10 20 30
90 100 110 120 130 140
pF1KB6 NPPSMVFKQMEQVAQFLKAAEDYGVIKTDMFQTVDLFEGKDMAAVQRTLMALGSLAVTKN
: :. . :.:....:.:: . ::. :.:.. ::::. .:. :: ::.::..:: ::.
CCDS65 NESSLNWPQLENIGNFIKAIQAYGMKPHDIFEANDLFENGNMTQVQTTLVALAGLAKTKG
40 50 60 70 80 90
150 160 170 180 190 200
pF1KB6 DGHYRGDPNWFMKKAQEHKREFTESQLQEGKHVIGLQMGSNRGASQAGMTGYGRPRQIIS
: : . .: :... :.: :..:. :. :::::::.:. :::::::.:: :..
CCDS65 -FHTTIDIG--VKYAEKQTRRFDEGKLKAGQSVIGLQMGTNKCASQAGMTAYGTRRHLYD
100 110 120 130 140
CCDS65 PKMQTDKPFDQTTISLQMGTNKGASQAGMLAPGTRRDIYDQKLTLQPVDNSTISLQMGTN
150 160 170 180 190 200
>>CCDS30775.1 CNN3 gene_id:1266|Hs108|chr1 (329 aa)
initn: 619 init1: 161 opt: 374 Z-score: 475.9 bits: 95.7 E(32554): 3.4e-20
Smith-Waterman score: 496; 45.2% identity (71.6% similar) in 197 aa overlap (3-199:5-188)
10 20 30 40 50
pF1KB6 MANKGPSYGMSREVQSKIEKKYDEELEERLVEWIIVQCGPDVGRPDRGRLGFQVWLKN
:::::::.: ::..:: .:::.. :: : .:: : ..: :. ::. ::.
CCDS30 MTHFNKGPSYGLSAEVKNKIASKYDHQAEEDLRNWIEEVTGMSIG-PN-----FQLGLKD
10 20 30 40 50
60 70 80 90 100 110
pF1KB6 GVILSKLVNSLYPDGSKPVKVPENPPSMVFKQMEQVAQFLKAAEDYGVIKTDMFQTVDLF
:.:: .:.:.: : . : : : :. . :.:....:.:: . ::. :.:.. :::
CCDS30 GIILCELINKLQPGSVKKV----NESSLNWPQLENIGNFIKAIQAYGMKPHDIFEANDLF
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB6 EGKDMAAVQRTLMALGSLAVTKNDGHYRGDPNWFMKKAQEHKREFTESQLQEGKHVIGLQ
:. .:. :: ::.::..:: ::. : : . .: :... :.: :..:. :. :::::
CCDS30 ENGNMTQVQTTLVALAGLAKTKG-FHTTIDIG--VKYAEKQTRRFDEGKLKAGQSVIGLQ
120 130 140 150 160
180 190 200
pF1KB6 MGSNRGASQAGMTGYGRPRQIIS
::.:. :::::::.:: :..
CCDS30 MGTNKCASQAGMTAYGTRRHLYDPKMQTDKPFDQTTISLQMGTNKGASQAGMLAPGTRRD
170 180 190 200 210 220
>>CCDS12053.1 CNN2 gene_id:1265|Hs108|chr19 (309 aa)
initn: 469 init1: 139 opt: 323 Z-score: 411.8 bits: 83.7 E(32554): 1.3e-16
Smith-Waterman score: 434; 41.6% identity (70.1% similar) in 197 aa overlap (3-199:7-190)
10 20 30 40 50
pF1KB6 MANKGPSYGMSREVQSKIEKKYDEELEERLVEWIIVQCGPDVGRPDRGRLGFQVWL
:::::::.: ::.... .::: . : .: :: : ..: :: :: :
CCDS12 MSSTQFNKGPSYGLSAEVKNRLLSKYDPQKEAELRTWIEGLTGLSIG-PD-----FQKGL
10 20 30 40 50
60 70 80 90 100 110
pF1KB6 KNGVILSKLVNSLYPDGSKPVKVPENPPSMVFKQMEQVAQFLKAAEDYGVIKTDMFQTVD
:.:.:: :.:.: : :: : :. : . ..:.:....:.:: .::. .:.:.. :
CCDS12 KDGTILCTLMNKLQP-GSVP-KI--NRSMQNWHQLENLSNFIKAMVSYGMNPVDLFEAND
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB6 LFEGKDMAAVQRTLMALGSLAVTKNDGHYRGDPNWFMKKAQEHKREFTESQLQEGKHVIG
:::. .:. :: .:.::.. : :: : : . .: .....:.: .. .. :. :::
CCDS12 LFESGNMTQVQVSLLALAGKAKTK--GLQSG-VDIGVKYSEKQERNFDDATMKAGQCVIG
120 130 140 150 160
180 190 200
pF1KB6 LQMGSNRGASQAGMTGYGRPRQIIS
::::.:. :::.:::.:: :..
CCDS12 LQMGTNKCASQSGMTAYGTRRHLYDPKNHILPPMDHSTISLQMGTNKCASQVGMTAPGTR
170 180 190 200 210 220
>>CCDS77238.1 CNN1 gene_id:1264|Hs108|chr19 (247 aa)
initn: 345 init1: 128 opt: 301 Z-score: 385.5 bits: 78.5 E(32554): 3.7e-15
Smith-Waterman score: 349; 40.3% identity (72.2% similar) in 144 aa overlap (56-199:4-138)
30 40 50 60 70 80
pF1KB6 LEERLVEWIIVQCGPDVGRPDRGRLGFQVWLKNGVILSKLVNSLYPDGSKPVKVPENPPS
::.:.:: ...:.: : . : . : .
CCDS77 MDGLKDGIILCEFINKLQPGSVKKI----NEST
10 20
90 100 110 120 130 140
pF1KB6 MVFKQMEQVAQFLKAAEDYGVIKTDMFQTVDLFEGKDMAAVQRTLMALGSLAVTKNDGHY
. ..:.:....:.:: ::: :.:.. ::::. . . :: ::.::.:.: ::..
CCDS77 QNWHQLENIGNFIKAITKYGVKPHDIFEANDLFENTNHTQVQSTLLALASMAKTKGNKVN
30 40 50 60 70 80
150 160 170 180 190 200
pF1KB6 RGDPNWFMKKAQEHKREFTESQLQEGKHVIGLQMGSNRGASQAGMTGYGRPRQIIS
: .: :....:.: ..:.::...::::::.:. ::: :::.:: :..
CCDS77 VG-----VKYAEKQERKFEPGKLREGRNIIGLQMGTNKFASQQGMTAYGTRRHLYDPKLG
90 100 110 120 130 140
CCDS77 TDQPLDQATISLQMGTNKGASQAGMTAPGTKRQIFEPGLGMEHCDTLNVSLQMGSNKGAS
150 160 170 180 190 200
>>CCDS12054.1 CNN2 gene_id:1265|Hs108|chr19 (270 aa)
initn: 429 init1: 129 opt: 251 Z-score: 321.6 bits: 66.8 E(32554): 1.4e-11
Smith-Waterman score: 362; 38.4% identity (64.6% similar) in 198 aa overlap (3-199:7-191)
10 20 30 40 50
pF1KB6 MANKGPSYGMSREVQSKIEKKYDEELEERLVEWIIVQCGPDVGRPDRGRLGFQVWL
:::::::.: ::.... .::: . : .: :: : ..: :: :: :
CCDS12 MSSTQFNKGPSYGLSAEVKNRLLSKYDPQKEAELRTWIEGLTGLSIG-PD-----FQKGL
10 20 30 40 50
60 70 80 90 100 110
pF1KB6 KNGVILSKLVNSLYPDGSKPVKVPENPPSMVFKQMEQVAQFLKAAEDYGVIKTDMFQTVD
:.:.:: :.:.: : :: : :. : . ..:.:....:.:: .::. .:.:.. :
CCDS12 KDGTILCTLMNKLQP-GSVP-KI--NRSMQNWHQLENLSNFIKAMVSYGMNPVDLFEAND
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB6 LFEGKDMAAVQRTLMALGSLAVTKNDGHYRGDPNWFMKKAQEHKREFTESQLQEGKH-VI
:::. .:. :: .:.::.. :.. . : . .. : . . : : .:
CCDS12 LFESGNMTQVQVSLLALAGKMGTNKCASQSGMTAYGTRR---HLYDPKNHILPPMDHSTI
120 130 140 150 160
180 190 200
pF1KB6 GLQMGSNRGASQAGMTGYGRPRQIIS
.::::.:. :::.:::. : :.:
CCDS12 SLQMGTNKCASQVGMTAPGTRRHIYDTKLGTDKCDNSSMSLQMGYTQGANQSGQVFGLGR
170 180 190 200 210 220
201 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 14:02:36 2016 done: Fri Nov 4 14:02:36 2016
Total Scan time: 2.020 Total Display time: -0.010
Function used was FASTA [36.3.4 Apr, 2011]