FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB7552, 268 aa
1>>>pF1KB7552 268 - 268 aa - 268 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.8721+/-0.000829; mu= 4.6721+/- 0.050
mean_var=201.5314+/-41.806, 0's: 0 Z-trim(114.9): 896 B-trim: 11 in 1/50
Lambda= 0.090345
statistics sampled from 14448 (15438) to 14448 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.794), E-opt: 0.2 (0.474), width: 16
Scan time: 2.740
The best scores are: opt bits E(32554)
CCDS6146.1 SNAI2 gene_id:6591|Hs108|chr8 ( 268) 1876 256.2 1.7e-68
CCDS13423.1 SNAI1 gene_id:6615|Hs108|chr20 ( 264) 903 129.4 2.6e-30
CCDS32505.1 SNAI3 gene_id:333929|Hs108|chr16 ( 292) 837 120.8 1.1e-27
CCDS13006.1 SCRT2 gene_id:85508|Hs108|chr20 ( 307) 605 90.6 1.4e-18
CCDS6421.1 SCRT1 gene_id:83482|Hs108|chr8 ( 348) 599 89.9 2.7e-18
CCDS54214.1 ZNF177 gene_id:7730|Hs108|chr19 ( 481) 427 67.6 1.9e-11
CCDS35075.1 ZNF782 gene_id:158431|Hs108|chr9 ( 699) 428 67.9 2.2e-11
CCDS76957.1 ZNF18 gene_id:7566|Hs108|chr17 ( 548) 419 66.6 4.3e-11
CCDS32568.1 ZNF18 gene_id:7566|Hs108|chr17 ( 549) 419 66.6 4.3e-11
CCDS42496.1 ZNF846 gene_id:162993|Hs108|chr19 ( 533) 417 66.3 5e-11
CCDS45988.1 ZNF44 gene_id:51710|Hs108|chr19 ( 615) 418 66.5 5.1e-11
CCDS54223.1 ZNF44 gene_id:51710|Hs108|chr19 ( 663) 418 66.6 5.3e-11
CCDS7923.1 ZNF408 gene_id:79797|Hs108|chr11 ( 720) 416 66.3 6.8e-11
CCDS12214.1 ZNF560 gene_id:147741|Hs108|chr19 ( 790) 416 66.4 7.2e-11
CCDS12212.1 ZNF177 gene_id:7730|Hs108|chr19 ( 321) 406 64.7 9.4e-11
>>CCDS6146.1 SNAI2 gene_id:6591|Hs108|chr8 (268 aa)
initn: 1876 init1: 1876 opt: 1876 Z-score: 1343.0 bits: 256.2 E(32554): 1.7e-68
Smith-Waterman score: 1876; 100.0% identity (100.0% similar) in 268 aa overlap (1-268:1-268)
10 20 30 40 50 60
pF1KB7 MPRSFLVKKHFNASKKPNYSELDTHTVIISPYLYESYSMPVIPQPEILSSGAYSPITVWT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 MPRSFLVKKHFNASKKPNYSELDTHTVIISPYLYESYSMPVIPQPEILSSGAYSPITVWT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 TAAPFHAQLPNGLSPLSGYSSSLGRVSPPPPSDTSSKDHSGSESPISDEEERLQSKLSDP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 TAAPFHAQLPNGLSPLSGYSSSLGRVSPPPPSDTSSKDHSGSESPISDEEERLQSKLSDP
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 HAIEAEKFQCNLCNKTYSTFSGLAKHKQLHCDAQSRKSFSCKYCDKEYVSLGALKMHIRT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 HAIEAEKFQCNLCNKTYSTFSGLAKHKQLHCDAQSRKSFSCKYCDKEYVSLGALKMHIRT
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 HTLPCVCKICGKAFSRPWLLQGHIRTHTGEKPFSCPHCNRAFADRSNLRAHLQTHSDVKK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 HTLPCVCKICGKAFSRPWLLQGHIRTHTGEKPFSCPHCNRAFADRSNLRAHLQTHSDVKK
190 200 210 220 230 240
250 260
pF1KB7 YQCKNCSKTFSRMSLLHKHEESGCCVAH
::::::::::::::::::::::::::::
CCDS61 YQCKNCSKTFSRMSLLHKHEESGCCVAH
250 260
>>CCDS13423.1 SNAI1 gene_id:6615|Hs108|chr20 (264 aa)
initn: 921 init1: 745 opt: 903 Z-score: 657.7 bits: 129.4 E(32554): 2.6e-30
Smith-Waterman score: 903; 54.4% identity (71.5% similar) in 274 aa overlap (1-264:1-259)
10 20 30 40 50
pF1KB7 MPRSFLVKKHFNASKKPNYSEL-DTHT--VIISPYLYESYSMPVIPQPEILSSGAYSPIT
:::::::.: . ..::::::: :.. .. .:: ... . .:: ::::. : :.
CCDS13 MPRSFLVRKPSDPNRKPNYSELQDSNPEFTFQQPY-DQAHLLAAIPPPEILNPTASLPML
10 20 30 40 50
60 70 80 90 100 110
pF1KB7 VWTTAAPFHAQLPNGLSPLSGYSSSLGRVSPPPP-SDTSSKDHSGSESPISDEEERLQSK
.: .. .:: : . . : : ::. :: .: : :: : ..:
CCDS13 IWDSVLAPQAQ-PIAWASLRLQESP--RVAELTSLSDEDSGKGSQPPSPPSPAPSSFSS-
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB7 LSDPHAIEAEKFQCNLCNKTYSTFSGLAK-HKQLHC-----DAQSRKSFSCKYCDKEYVS
.. ..::: .:..: ::.. ::: : :.::.:.::::.:::.:
CCDS13 -TSVSSLEAE---------AYAAFPGLGQVPKQLAQLSEAKDLQARKAFNCKYCNKEYLS
120 130 140 150 160
180 190 200 210 220 230
pF1KB7 LGALKMHIRTHTLPCVCKICGKAFSRPWLLQGHIRTHTGEKPFSCPHCNRAFADRSNLRA
:::::::::.::::::: ::::::::::::::.::::::::::::::.:::::::::::
CCDS13 LGALKMHIRSHTLPCVCGTCGKAFSRPWLLQGHVRTHTGEKPFSCPHCSRAFADRSNLRA
170 180 190 200 210 220
240 250 260
pF1KB7 HLQTHSDVKKYQCKNCSKTFSRMSLLHKHEESGCCVAH
:::::::::::::. :..:::::::::::.::::
CCDS13 HLQTHSDVKKYQCQACARTFSRMSLLHKHQESGCSGCPR
230 240 250 260
>>CCDS32505.1 SNAI3 gene_id:333929|Hs108|chr16 (292 aa)
initn: 862 init1: 814 opt: 837 Z-score: 610.6 bits: 120.8 E(32554): 1.1e-27
Smith-Waterman score: 879; 51.4% identity (67.7% similar) in 294 aa overlap (1-265:1-289)
10 20 30 40
pF1KB7 MPRSFLVKKHFNASKKPNYSELDTHTVI----------ISPYL---YESYSMPV-IPQPE
:::::::: : .. . ::: .:.:. : . : : :. :.: .:::
CCDS32 MPRSFLVKTH-SSHRVPNYRRLETQREINGACSACGGLVVPLLPRDKEAPSVPGDLPQPW
10 20 30 40 50
50 60 70 80 90 100
pF1KB7 ILSSGAYSPITVWTTAAPFHAQLPNGLSPL--SGYSSSLGRVSPPPPSDTSSKDHSGSES
:: : . :.. .: .::. : : . .:.. : .: : .: .
CCDS32 DRSS-AVACISLPLLPRIEEALGASGLDALEVSEVDPRASRAAIVPLKD--SLNHL-NLP
60 70 80 90 100 110
110 120 130 140 150
pF1KB7 PISDEEERLQSKLS-DPHA-----IEAEK-------FQCNLCNKTYSTFSGLAKHKQLHC
:. : . :. : :. . ::. :.: :.: : :..:::.:.::::
CCDS32 PLLVLPTRWSPTLGPDRHGAPEKLLGAERMPRAPGGFECFHCHKPYHTLAGLARHRQLHC
120 130 140 150 160 170
160 170 180 190 200 210
pF1KB7 DAQSRKSFSCKYCDKEYVSLGALKMHIRTHTLPCVCKICGKAFSRPWLLQGHIRTHTGEK
: . :.::::::::.::::::::::::::::.:::::::::::::::::.:::::::
CCDS32 HLQVGRVFTCKYCDKEYTSLGALKMHIRTHTLPCTCKICGKAFSRPWLLQGHVRTHTGEK
180 190 200 210 220 230
220 230 240 250 260
pF1KB7 PFSCPHCNRAFADRSNLRAHLQTHSDVKKYQCKNCSKTFSRMSLLHKHEESGCCVAH
:..: ::.::::::::::::::::::.:::.:. :.::::::::: .:::::::
CCDS32 PYACSHCSRAFADRSNLRAHLQTHSDAKKYRCRRCTKTFSRMSLLARHEESGCCPGP
240 250 260 270 280 290
>>CCDS13006.1 SCRT2 gene_id:85508|Hs108|chr20 (307 aa)
initn: 810 init1: 582 opt: 605 Z-score: 446.9 bits: 90.6 E(32554): 1.4e-18
Smith-Waterman score: 614; 39.5% identity (59.9% similar) in 299 aa overlap (1-267:1-294)
10 20 30 40
pF1KB7 MPRSFLVKK----HFNAS--KKPNYSELDTHTVIIS---PYLYESYSMPVIP-------Q
::::::::: :. : :.: :.: :. . : ..:. .: :
CCDS13 MPRSFLVKKIKGDGFQCSGVPAPTYHPLETAYVLPGARGPPGDNGYAPHRLPPSSYDADQ
10 20 30 40 50 60
50 60 70 80 90
pF1KB7 PEILSSGAYSPITVWTTAAPFHAQLPNGLSPLSGYSSSLGRVSPPPPSDTSSKDH-----
: . : .. ::: . . :. :: :. :. : . .:. : :
CCDS13 KPGLELAPAEP--AYPPAAPEEYSDPE--SPQSSLSARYFR-GEAAVTDSYSMDAFFISD
70 80 90 100 110
100 110 120 130 140
pF1KB7 ---------SGSESPISDEEERLQSKL--SDPHAIEAEKFQCNLCNKTYSTFSGLAKHKQ
.:... : . .. . .: ... : :.:::.: :.:..:::
CCDS13 GRSRRRRGGGGGDAGGSGDAGGAGGRAGRAGAQAGGGHRHACAECGKTYATSSNLSRHKQ
120 130 140 150 160 170
150 160 170 180 190 200
pF1KB7 LHCDAQSRKSFSCKYCDKEYVSLGALKMHIRTHTLPCVCKICGKAFSRPWLLQGHIRTHT
: . .:. . .: : : :::. :: ::. ::.: : .::::::::::::::.:.::
CCDS13 THRSLDSQLARKCPTCGKAYVSMPALAMHLLTHNLRHKCGVCGKAFSRPWLLQGHMRSHT
180 190 200 210 220 230
210 220 230 240 250 260
pF1KB7 GEKPFSCPHCNRAFADRSNLRAHLQTHSDVKKYQCKNCSKTFSRMSLLHKHEESGCCVAH
:::::.: ::..:::::::::::.:::: :.:.:..:.:.:. : :::: :..: :
CCDS13 GEKPFGCAHCGKAFADRSNLRAHMQTHSAFKHYRCRQCDKSFALKSYLHKHCEAACAKAA
240 250 260 270 280 290
CCDS13 EPPPPTPAGPAS
300
>>CCDS6421.1 SCRT1 gene_id:83482|Hs108|chr8 (348 aa)
initn: 794 init1: 575 opt: 599 Z-score: 442.0 bits: 89.9 E(32554): 2.7e-18
Smith-Waterman score: 599; 58.0% identity (78.3% similar) in 138 aa overlap (127-264:190-327)
100 110 120 130 140 150
pF1KB7 KDHSGSESPISDEEERLQSKLSDPHAIEAEKFQCNLCNKTYSTFSGLAKHKQLHCDAQSR
. :. :.:::.: :.:..::: : . .:.
CCDS64 LGSGPGGRGGTRAGAGTEARAGPGAAGAGGRHACGECGKTYATSSNLSRHKQTHRSLDSQ
160 170 180 190 200 210
160 170 180 190 200 210
pF1KB7 KSFSCKYCDKEYVSLGALKMHIRTHTLPCVCKICGKAFSRPWLLQGHIRTHTGEKPFSCP
. : : : :::. :. ::. :: : : .::::::::::::::.:.:::::::.:
CCDS64 LARRCPTCGKVYVSMPAMAMHLLTHDLRHKCGVCGKAFSRPWLLQGHMRSHTGEKPFGCA
220 230 240 250 260 270
220 230 240 250 260
pF1KB7 HCNRAFADRSNLRAHLQTHSDVKKYQCKNCSKTFSRMSLLHKHEESGCCVAH
::..:::::::::::.:::: :..::: :.:.:. : :.:: ::.:
CCDS64 HCGKAFADRSNLRAHMQTHSAFKHFQCKRCKKSFALKSYLNKHYESACFKGGAGGPAAPA
280 290 300 310 320 330
CCDS64 PPQLSPVQA
340
>>CCDS54214.1 ZNF177 gene_id:7730|Hs108|chr19 (481 aa)
initn: 793 init1: 289 opt: 427 Z-score: 319.1 bits: 67.6 E(32554): 1.9e-11
Smith-Waterman score: 427; 34.8% identity (63.7% similar) in 204 aa overlap (68-263:224-420)
40 50 60 70 80 90
pF1KB7 SMPVIPQPEILSSGAYSPITVWTTAAPFHAQLPNGLSPLSGYSSSLGRVSPPPPSDTSSK
:.:.: . . :. :..:: ...
CCDS54 HLRTPTGQKFQEYEQCDMSFSLHSSCSVREQIPTGEK--GDECSDYGKISPLSVHTKTGS
200 210 220 230 240 250
100 110 120 130 140 150
pF1KB7 DHSGSESPISDEEERLQSKLSDPHAIEAEK----FQCNLCNKTYSTFSGLAKHKQLHCDA
. : : ...:. . . :: . ..... ..:. :.:.. :.: :: . :
CCDS54 VEEGLEC--NEHEKTFTDPLSLQNCVRTHSGEMPYECSDCGKAFIFQSSLKKHMRSHT--
260 270 280 290 300
160 170 180 190 200 210
pF1KB7 QSRKSFSCKYCDKEYVSLGALKMHIRTHT--LPCVCKICGKAFSRPWLLQGHIRTHTGEK
..: . : .: : . . . :..: :::: : :: :::::. : :: :.:::::::
CCDS54 -GEKPYECDHCGKSFSQSSHLNVHKRTHTGEKPYDCKECGKAFTVPSSLQKHVRTHTGEK
310 320 330 340 350 360
220 230 240 250 260
pF1KB7 PFSCPHCNRAFADRSNLRAHLQTHSDVKKYQCKNCSKTFSRMSLL--HKHEESGCCVAH
:. : :..:: :.:.:. : ..:. : :.:..:.:.:: : : ::. ..:
CCDS54 PYECSDCGKAFIDQSSLKKHTRSHTGEKPYECNQCGKSFSTGSYLIVHKRTHTGEKTYEC
370 380 390 400 410 420
CCDS54 KECGKAFRNSSCLRVHVRTHTGEKPYKCIQCEKAFSTSTNLIMHKRIHNGQKLHE
430 440 450 460 470 480
>>CCDS35075.1 ZNF782 gene_id:158431|Hs108|chr9 (699 aa)
initn: 2196 init1: 287 opt: 428 Z-score: 317.7 bits: 67.9 E(32554): 2.2e-11
Smith-Waterman score: 428; 43.8% identity (72.3% similar) in 137 aa overlap (128-262:478-611)
100 110 120 130 140 150
pF1KB7 DHSGSESPISDEEERLQSKLSDPHAIEAEKFQCNLCNKTYSTFSGLAKHKQLHCDAQSRK
:.:: :.:..: .::: .:.. : ...
CCDS35 KPFECHECGKSFNYKSILIVHQRTHTGEKPFECNECGKSFSHMSGLRNHRRTHT---GER
450 460 470 480 490 500
160 170 180 190 200 210
pF1KB7 SFSCKYCDKEYVSLGALKMHIRTHT--LPCVCKICGKAFSRPWLLQGHIRTHTGEKPFSC
..: : : . ..:. : :::: : :. :::::.. :.:: : ::::::..:
CCDS35 PYKCDECGKAFKLKSGLRKHHRTHTGEKPYKCNQCGKAFGQKSQLRGHHRIHTGEKPYKC
510 520 530 540 550 560
220 230 240 250 260
pF1KB7 PHCNRAFADRSNLRAHLQTHSDVKKYQCKNCSKTFSRMSLLHKHEESGCCVAH
::..::...::::.: .::. : :::..:.::: . : :. :...
CCDS35 NHCGEAFSQKSNLRVHHRTHTGEKPYQCEECGKTFRQKSNLRGHQRTHTGEKPYECNECG
570 580 590 600 610 620
CCDS35 KAFSEKSVLRKHQRTHTGEKPYNCNQCGEAFSQKSNLRVHQRTHTGEKPYKCDKCGRTFS
630 640 650 660 670 680
>>CCDS76957.1 ZNF18 gene_id:7566|Hs108|chr17 (548 aa)
initn: 629 init1: 282 opt: 419 Z-score: 312.7 bits: 66.6 E(32554): 4.3e-11
Smith-Waterman score: 419; 38.1% identity (59.8% similar) in 194 aa overlap (73-262:358-540)
50 60 70 80 90 100
pF1KB7 PQPEILSSGAYSPITVWTTAAPFHAQLPNGLSPLSGYS-SSLGRVSPPPPSDTSSKDHSG
::: : ..::. : : :::
CCDS76 FTEDEPGCFGEGENLPEALQNIQDEGTGEQLSPQERISEKQLGQHLPNP--------HSG
330 340 350 360 370
110 120 130 140 150 160
pF1KB7 SESPISDEEERLQSKLSDPHAIEAEKFQ-CNLCNKTYSTFSGLAKHKQLHCDAQSRKSFS
: . ::.: :. ..:.: :.:. : :.::. : : :.. : .. :.
CCDS76 EMSTMWLEEKRETSQKGQPRAPMAQKLPTCRECGKTFYRNSQLIFHQRTHT---GETYFQ
380 390 400 410 420 430
170 180 190 200 210
pF1KB7 CKYCDKEYVSLGALKMHIRTHT--LPCVCKICGKAFSRPWLLQGHIRTHTGEKPFSCPHC
: : : .. . . : :::: :: : :::.:: :. : . ::::::..:: :
CCDS76 CTICKKAFLRSSDFVKHQRTHTGEKPCKCDYCGKGFSDFSGLRHHEKIHTGEKPYKCPIC
440 450 460 470 480 490
220 230 240 250 260
pF1KB7 NRAFADRSNLRAHLQTHSDVKKYQCKNCSKTFSRMSLLHKHEESGCCVAH
...: .:::. : ..:. : :.:..:.:.:: : : ::..:
CCDS76 EKSFIQRSNFNRHQRVHTGEKPYKCSHCGKSFSWSSSLDKHQRSHLGKKPFQ
500 510 520 530 540
>>CCDS32568.1 ZNF18 gene_id:7566|Hs108|chr17 (549 aa)
initn: 629 init1: 282 opt: 419 Z-score: 312.7 bits: 66.6 E(32554): 4.3e-11
Smith-Waterman score: 419; 38.1% identity (59.8% similar) in 194 aa overlap (73-262:359-541)
50 60 70 80 90 100
pF1KB7 PQPEILSSGAYSPITVWTTAAPFHAQLPNGLSPLSGYS-SSLGRVSPPPPSDTSSKDHSG
::: : ..::. : : :::
CCDS32 FTEDEPGCFGEGENLPEALQNIQDEGTGEQLSPQERISEKQLGQHLPNP--------HSG
330 340 350 360 370 380
110 120 130 140 150 160
pF1KB7 SESPISDEEERLQSKLSDPHAIEAEKFQ-CNLCNKTYSTFSGLAKHKQLHCDAQSRKSFS
: . ::.: :. ..:.: :.:. : :.::. : : :.. : .. :.
CCDS32 EMSTMWLEEKRETSQKGQPRAPMAQKLPTCRECGKTFYRNSQLIFHQRTHT---GETYFQ
390 400 410 420 430
170 180 190 200 210
pF1KB7 CKYCDKEYVSLGALKMHIRTHT--LPCVCKICGKAFSRPWLLQGHIRTHTGEKPFSCPHC
: : : .. . . : :::: :: : :::.:: :. : . ::::::..:: :
CCDS32 CTICKKAFLRSSDFVKHQRTHTGEKPCKCDYCGKGFSDFSGLRHHEKIHTGEKPYKCPIC
440 450 460 470 480 490
220 230 240 250 260
pF1KB7 NRAFADRSNLRAHLQTHSDVKKYQCKNCSKTFSRMSLLHKHEESGCCVAH
...: .:::. : ..:. : :.:..:.:.:: : : ::..:
CCDS32 EKSFIQRSNFNRHQRVHTGEKPYKCSHCGKSFSWSSSLDKHQRSHLGKKPFQ
500 510 520 530 540
>>CCDS42496.1 ZNF846 gene_id:162993|Hs108|chr19 (533 aa)
initn: 2016 init1: 289 opt: 417 Z-score: 311.5 bits: 66.3 E(32554): 5e-11
Smith-Waterman score: 417; 40.7% identity (71.4% similar) in 140 aa overlap (128-265:394-530)
100 110 120 130 140 150
pF1KB7 DHSGSESPISDEEERLQSKLSDPHAIEAEKFQCNLCNKTYSTFSGLAKHKQLHCDAQSRK
..:. :.:.... : :..: ..: ..:
CCDS42 KLYLCKACGKAFTRSSGLVLHMRTHTGEKPYECKECGKAFNNSSMLSQHVRIHT---GEK
370 380 390 400 410 420
160 170 180 190 200 210
pF1KB7 SFSCKYCDKEYVSLGALKMHIRTHT--LPCVCKICGKAFSRPWLLQGHIRTHTGEKPFSC
. :: : : ... ..:. :.:::: : :: :::::.: :. :.::::::::..:
CCDS42 PYECKECGKAFTQSSGLSTHLRTHTGEKACECKECGKAFARSTNLNMHMRTHTGEKPYAC
430 440 450 460 470 480
220 230 240 250 260
pF1KB7 PHCNRAFADRSNLRAHLQTHSDVKKYQCKNCSKTFSRMSLLHKHEESGCCVAH
.:..:: . : .: .::. .: :.::.:.:.:.. : : :: .. :
CCDS42 KECGKAFRYSTYLNVHTRTHTGAKPYECKKCGKNFTQSSALAKHLRTKACEKT
490 500 510 520 530
268 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 08:39:32 2016 done: Fri Nov 4 08:39:33 2016
Total Scan time: 2.740 Total Display time: 0.010
Function used was FASTA [36.3.4 Apr, 2011]