FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7552, 268 aa 1>>>pF1KB7552 268 - 268 aa - 268 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.8721+/-0.000829; mu= 4.6721+/- 0.050 mean_var=201.5314+/-41.806, 0's: 0 Z-trim(114.9): 896 B-trim: 11 in 1/50 Lambda= 0.090345 statistics sampled from 14448 (15438) to 14448 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.794), E-opt: 0.2 (0.474), width: 16 Scan time: 2.740 The best scores are: opt bits E(32554) CCDS6146.1 SNAI2 gene_id:6591|Hs108|chr8 ( 268) 1876 256.2 1.7e-68 CCDS13423.1 SNAI1 gene_id:6615|Hs108|chr20 ( 264) 903 129.4 2.6e-30 CCDS32505.1 SNAI3 gene_id:333929|Hs108|chr16 ( 292) 837 120.8 1.1e-27 CCDS13006.1 SCRT2 gene_id:85508|Hs108|chr20 ( 307) 605 90.6 1.4e-18 CCDS6421.1 SCRT1 gene_id:83482|Hs108|chr8 ( 348) 599 89.9 2.7e-18 CCDS54214.1 ZNF177 gene_id:7730|Hs108|chr19 ( 481) 427 67.6 1.9e-11 CCDS35075.1 ZNF782 gene_id:158431|Hs108|chr9 ( 699) 428 67.9 2.2e-11 CCDS76957.1 ZNF18 gene_id:7566|Hs108|chr17 ( 548) 419 66.6 4.3e-11 CCDS32568.1 ZNF18 gene_id:7566|Hs108|chr17 ( 549) 419 66.6 4.3e-11 CCDS42496.1 ZNF846 gene_id:162993|Hs108|chr19 ( 533) 417 66.3 5e-11 CCDS45988.1 ZNF44 gene_id:51710|Hs108|chr19 ( 615) 418 66.5 5.1e-11 CCDS54223.1 ZNF44 gene_id:51710|Hs108|chr19 ( 663) 418 66.6 5.3e-11 CCDS7923.1 ZNF408 gene_id:79797|Hs108|chr11 ( 720) 416 66.3 6.8e-11 CCDS12214.1 ZNF560 gene_id:147741|Hs108|chr19 ( 790) 416 66.4 7.2e-11 CCDS12212.1 ZNF177 gene_id:7730|Hs108|chr19 ( 321) 406 64.7 9.4e-11 >>CCDS6146.1 SNAI2 gene_id:6591|Hs108|chr8 (268 aa) initn: 1876 init1: 1876 opt: 1876 Z-score: 1343.0 bits: 256.2 E(32554): 1.7e-68 Smith-Waterman score: 1876; 100.0% identity (100.0% similar) in 268 aa overlap (1-268:1-268) 10 20 30 40 50 60 pF1KB7 MPRSFLVKKHFNASKKPNYSELDTHTVIISPYLYESYSMPVIPQPEILSSGAYSPITVWT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 MPRSFLVKKHFNASKKPNYSELDTHTVIISPYLYESYSMPVIPQPEILSSGAYSPITVWT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 TAAPFHAQLPNGLSPLSGYSSSLGRVSPPPPSDTSSKDHSGSESPISDEEERLQSKLSDP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 TAAPFHAQLPNGLSPLSGYSSSLGRVSPPPPSDTSSKDHSGSESPISDEEERLQSKLSDP 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 HAIEAEKFQCNLCNKTYSTFSGLAKHKQLHCDAQSRKSFSCKYCDKEYVSLGALKMHIRT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 HAIEAEKFQCNLCNKTYSTFSGLAKHKQLHCDAQSRKSFSCKYCDKEYVSLGALKMHIRT 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 HTLPCVCKICGKAFSRPWLLQGHIRTHTGEKPFSCPHCNRAFADRSNLRAHLQTHSDVKK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 HTLPCVCKICGKAFSRPWLLQGHIRTHTGEKPFSCPHCNRAFADRSNLRAHLQTHSDVKK 190 200 210 220 230 240 250 260 pF1KB7 YQCKNCSKTFSRMSLLHKHEESGCCVAH :::::::::::::::::::::::::::: CCDS61 YQCKNCSKTFSRMSLLHKHEESGCCVAH 250 260 >>CCDS13423.1 SNAI1 gene_id:6615|Hs108|chr20 (264 aa) initn: 921 init1: 745 opt: 903 Z-score: 657.7 bits: 129.4 E(32554): 2.6e-30 Smith-Waterman score: 903; 54.4% identity (71.5% similar) in 274 aa overlap (1-264:1-259) 10 20 30 40 50 pF1KB7 MPRSFLVKKHFNASKKPNYSEL-DTHT--VIISPYLYESYSMPVIPQPEILSSGAYSPIT :::::::.: . ..::::::: :.. .. .:: ... . .:: ::::. : :. CCDS13 MPRSFLVRKPSDPNRKPNYSELQDSNPEFTFQQPY-DQAHLLAAIPPPEILNPTASLPML 10 20 30 40 50 60 70 80 90 100 110 pF1KB7 VWTTAAPFHAQLPNGLSPLSGYSSSLGRVSPPPP-SDTSSKDHSGSESPISDEEERLQSK .: .. .:: : . . : : ::. :: .: : :: : ..: CCDS13 IWDSVLAPQAQ-PIAWASLRLQESP--RVAELTSLSDEDSGKGSQPPSPPSPAPSSFSS- 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB7 LSDPHAIEAEKFQCNLCNKTYSTFSGLAK-HKQLHC-----DAQSRKSFSCKYCDKEYVS .. ..::: .:..: ::.. ::: : :.::.:.::::.:::.: CCDS13 -TSVSSLEAE---------AYAAFPGLGQVPKQLAQLSEAKDLQARKAFNCKYCNKEYLS 120 130 140 150 160 180 190 200 210 220 230 pF1KB7 LGALKMHIRTHTLPCVCKICGKAFSRPWLLQGHIRTHTGEKPFSCPHCNRAFADRSNLRA :::::::::.::::::: ::::::::::::::.::::::::::::::.::::::::::: CCDS13 LGALKMHIRSHTLPCVCGTCGKAFSRPWLLQGHVRTHTGEKPFSCPHCSRAFADRSNLRA 170 180 190 200 210 220 240 250 260 pF1KB7 HLQTHSDVKKYQCKNCSKTFSRMSLLHKHEESGCCVAH :::::::::::::. :..:::::::::::.:::: CCDS13 HLQTHSDVKKYQCQACARTFSRMSLLHKHQESGCSGCPR 230 240 250 260 >>CCDS32505.1 SNAI3 gene_id:333929|Hs108|chr16 (292 aa) initn: 862 init1: 814 opt: 837 Z-score: 610.6 bits: 120.8 E(32554): 1.1e-27 Smith-Waterman score: 879; 51.4% identity (67.7% similar) in 294 aa overlap (1-265:1-289) 10 20 30 40 pF1KB7 MPRSFLVKKHFNASKKPNYSELDTHTVI----------ISPYL---YESYSMPV-IPQPE :::::::: : .. . ::: .:.:. : . : : :. :.: .::: CCDS32 MPRSFLVKTH-SSHRVPNYRRLETQREINGACSACGGLVVPLLPRDKEAPSVPGDLPQPW 10 20 30 40 50 50 60 70 80 90 100 pF1KB7 ILSSGAYSPITVWTTAAPFHAQLPNGLSPL--SGYSSSLGRVSPPPPSDTSSKDHSGSES :: : . :.. .: .::. : : . .:.. : .: : .: . CCDS32 DRSS-AVACISLPLLPRIEEALGASGLDALEVSEVDPRASRAAIVPLKD--SLNHL-NLP 60 70 80 90 100 110 110 120 130 140 150 pF1KB7 PISDEEERLQSKLS-DPHA-----IEAEK-------FQCNLCNKTYSTFSGLAKHKQLHC :. : . :. : :. . ::. :.: :.: : :..:::.:.:::: CCDS32 PLLVLPTRWSPTLGPDRHGAPEKLLGAERMPRAPGGFECFHCHKPYHTLAGLARHRQLHC 120 130 140 150 160 170 160 170 180 190 200 210 pF1KB7 DAQSRKSFSCKYCDKEYVSLGALKMHIRTHTLPCVCKICGKAFSRPWLLQGHIRTHTGEK : . :.::::::::.::::::::::::::::.:::::::::::::::::.::::::: CCDS32 HLQVGRVFTCKYCDKEYTSLGALKMHIRTHTLPCTCKICGKAFSRPWLLQGHVRTHTGEK 180 190 200 210 220 230 220 230 240 250 260 pF1KB7 PFSCPHCNRAFADRSNLRAHLQTHSDVKKYQCKNCSKTFSRMSLLHKHEESGCCVAH :..: ::.::::::::::::::::::.:::.:. :.::::::::: .::::::: CCDS32 PYACSHCSRAFADRSNLRAHLQTHSDAKKYRCRRCTKTFSRMSLLARHEESGCCPGP 240 250 260 270 280 290 >>CCDS13006.1 SCRT2 gene_id:85508|Hs108|chr20 (307 aa) initn: 810 init1: 582 opt: 605 Z-score: 446.9 bits: 90.6 E(32554): 1.4e-18 Smith-Waterman score: 614; 39.5% identity (59.9% similar) in 299 aa overlap (1-267:1-294) 10 20 30 40 pF1KB7 MPRSFLVKK----HFNAS--KKPNYSELDTHTVIIS---PYLYESYSMPVIP-------Q ::::::::: :. : :.: :.: :. . : ..:. .: : CCDS13 MPRSFLVKKIKGDGFQCSGVPAPTYHPLETAYVLPGARGPPGDNGYAPHRLPPSSYDADQ 10 20 30 40 50 60 50 60 70 80 90 pF1KB7 PEILSSGAYSPITVWTTAAPFHAQLPNGLSPLSGYSSSLGRVSPPPPSDTSSKDH----- : . : .. ::: . . :. :: :. :. : . .:. : : CCDS13 KPGLELAPAEP--AYPPAAPEEYSDPE--SPQSSLSARYFR-GEAAVTDSYSMDAFFISD 70 80 90 100 110 100 110 120 130 140 pF1KB7 ---------SGSESPISDEEERLQSKL--SDPHAIEAEKFQCNLCNKTYSTFSGLAKHKQ .:... : . .. . .: ... : :.:::.: :.:..::: CCDS13 GRSRRRRGGGGGDAGGSGDAGGAGGRAGRAGAQAGGGHRHACAECGKTYATSSNLSRHKQ 120 130 140 150 160 170 150 160 170 180 190 200 pF1KB7 LHCDAQSRKSFSCKYCDKEYVSLGALKMHIRTHTLPCVCKICGKAFSRPWLLQGHIRTHT : . .:. . .: : : :::. :: ::. ::.: : .::::::::::::::.:.:: CCDS13 THRSLDSQLARKCPTCGKAYVSMPALAMHLLTHNLRHKCGVCGKAFSRPWLLQGHMRSHT 180 190 200 210 220 230 210 220 230 240 250 260 pF1KB7 GEKPFSCPHCNRAFADRSNLRAHLQTHSDVKKYQCKNCSKTFSRMSLLHKHEESGCCVAH :::::.: ::..:::::::::::.:::: :.:.:..:.:.:. : :::: :..: : CCDS13 GEKPFGCAHCGKAFADRSNLRAHMQTHSAFKHYRCRQCDKSFALKSYLHKHCEAACAKAA 240 250 260 270 280 290 CCDS13 EPPPPTPAGPAS 300 >>CCDS6421.1 SCRT1 gene_id:83482|Hs108|chr8 (348 aa) initn: 794 init1: 575 opt: 599 Z-score: 442.0 bits: 89.9 E(32554): 2.7e-18 Smith-Waterman score: 599; 58.0% identity (78.3% similar) in 138 aa overlap (127-264:190-327) 100 110 120 130 140 150 pF1KB7 KDHSGSESPISDEEERLQSKLSDPHAIEAEKFQCNLCNKTYSTFSGLAKHKQLHCDAQSR . :. :.:::.: :.:..::: : . .:. CCDS64 LGSGPGGRGGTRAGAGTEARAGPGAAGAGGRHACGECGKTYATSSNLSRHKQTHRSLDSQ 160 170 180 190 200 210 160 170 180 190 200 210 pF1KB7 KSFSCKYCDKEYVSLGALKMHIRTHTLPCVCKICGKAFSRPWLLQGHIRTHTGEKPFSCP . : : : :::. :. ::. :: : : .::::::::::::::.:.:::::::.: CCDS64 LARRCPTCGKVYVSMPAMAMHLLTHDLRHKCGVCGKAFSRPWLLQGHMRSHTGEKPFGCA 220 230 240 250 260 270 220 230 240 250 260 pF1KB7 HCNRAFADRSNLRAHLQTHSDVKKYQCKNCSKTFSRMSLLHKHEESGCCVAH ::..:::::::::::.:::: :..::: :.:.:. : :.:: ::.: CCDS64 HCGKAFADRSNLRAHMQTHSAFKHFQCKRCKKSFALKSYLNKHYESACFKGGAGGPAAPA 280 290 300 310 320 330 CCDS64 PPQLSPVQA 340 >>CCDS54214.1 ZNF177 gene_id:7730|Hs108|chr19 (481 aa) initn: 793 init1: 289 opt: 427 Z-score: 319.1 bits: 67.6 E(32554): 1.9e-11 Smith-Waterman score: 427; 34.8% identity (63.7% similar) in 204 aa overlap (68-263:224-420) 40 50 60 70 80 90 pF1KB7 SMPVIPQPEILSSGAYSPITVWTTAAPFHAQLPNGLSPLSGYSSSLGRVSPPPPSDTSSK :.:.: . . :. :..:: ... CCDS54 HLRTPTGQKFQEYEQCDMSFSLHSSCSVREQIPTGEK--GDECSDYGKISPLSVHTKTGS 200 210 220 230 240 250 100 110 120 130 140 150 pF1KB7 DHSGSESPISDEEERLQSKLSDPHAIEAEK----FQCNLCNKTYSTFSGLAKHKQLHCDA . : : ...:. . . :: . ..... ..:. :.:.. :.: :: . : CCDS54 VEEGLEC--NEHEKTFTDPLSLQNCVRTHSGEMPYECSDCGKAFIFQSSLKKHMRSHT-- 260 270 280 290 300 160 170 180 190 200 210 pF1KB7 QSRKSFSCKYCDKEYVSLGALKMHIRTHT--LPCVCKICGKAFSRPWLLQGHIRTHTGEK ..: . : .: : . . . :..: :::: : :: :::::. : :: :.::::::: CCDS54 -GEKPYECDHCGKSFSQSSHLNVHKRTHTGEKPYDCKECGKAFTVPSSLQKHVRTHTGEK 310 320 330 340 350 360 220 230 240 250 260 pF1KB7 PFSCPHCNRAFADRSNLRAHLQTHSDVKKYQCKNCSKTFSRMSLL--HKHEESGCCVAH :. : :..:: :.:.:. : ..:. : :.:..:.:.:: : : ::. ..: CCDS54 PYECSDCGKAFIDQSSLKKHTRSHTGEKPYECNQCGKSFSTGSYLIVHKRTHTGEKTYEC 370 380 390 400 410 420 CCDS54 KECGKAFRNSSCLRVHVRTHTGEKPYKCIQCEKAFSTSTNLIMHKRIHNGQKLHE 430 440 450 460 470 480 >>CCDS35075.1 ZNF782 gene_id:158431|Hs108|chr9 (699 aa) initn: 2196 init1: 287 opt: 428 Z-score: 317.7 bits: 67.9 E(32554): 2.2e-11 Smith-Waterman score: 428; 43.8% identity (72.3% similar) in 137 aa overlap (128-262:478-611) 100 110 120 130 140 150 pF1KB7 DHSGSESPISDEEERLQSKLSDPHAIEAEKFQCNLCNKTYSTFSGLAKHKQLHCDAQSRK :.:: :.:..: .::: .:.. : ... CCDS35 KPFECHECGKSFNYKSILIVHQRTHTGEKPFECNECGKSFSHMSGLRNHRRTHT---GER 450 460 470 480 490 500 160 170 180 190 200 210 pF1KB7 SFSCKYCDKEYVSLGALKMHIRTHT--LPCVCKICGKAFSRPWLLQGHIRTHTGEKPFSC ..: : : . ..:. : :::: : :. :::::.. :.:: : ::::::..: CCDS35 PYKCDECGKAFKLKSGLRKHHRTHTGEKPYKCNQCGKAFGQKSQLRGHHRIHTGEKPYKC 510 520 530 540 550 560 220 230 240 250 260 pF1KB7 PHCNRAFADRSNLRAHLQTHSDVKKYQCKNCSKTFSRMSLLHKHEESGCCVAH ::..::...::::.: .::. : :::..:.::: . : :. :... CCDS35 NHCGEAFSQKSNLRVHHRTHTGEKPYQCEECGKTFRQKSNLRGHQRTHTGEKPYECNECG 570 580 590 600 610 620 CCDS35 KAFSEKSVLRKHQRTHTGEKPYNCNQCGEAFSQKSNLRVHQRTHTGEKPYKCDKCGRTFS 630 640 650 660 670 680 >>CCDS76957.1 ZNF18 gene_id:7566|Hs108|chr17 (548 aa) initn: 629 init1: 282 opt: 419 Z-score: 312.7 bits: 66.6 E(32554): 4.3e-11 Smith-Waterman score: 419; 38.1% identity (59.8% similar) in 194 aa overlap (73-262:358-540) 50 60 70 80 90 100 pF1KB7 PQPEILSSGAYSPITVWTTAAPFHAQLPNGLSPLSGYS-SSLGRVSPPPPSDTSSKDHSG ::: : ..::. : : ::: CCDS76 FTEDEPGCFGEGENLPEALQNIQDEGTGEQLSPQERISEKQLGQHLPNP--------HSG 330 340 350 360 370 110 120 130 140 150 160 pF1KB7 SESPISDEEERLQSKLSDPHAIEAEKFQ-CNLCNKTYSTFSGLAKHKQLHCDAQSRKSFS : . ::.: :. ..:.: :.:. : :.::. : : :.. : .. :. CCDS76 EMSTMWLEEKRETSQKGQPRAPMAQKLPTCRECGKTFYRNSQLIFHQRTHT---GETYFQ 380 390 400 410 420 430 170 180 190 200 210 pF1KB7 CKYCDKEYVSLGALKMHIRTHT--LPCVCKICGKAFSRPWLLQGHIRTHTGEKPFSCPHC : : : .. . . : :::: :: : :::.:: :. : . ::::::..:: : CCDS76 CTICKKAFLRSSDFVKHQRTHTGEKPCKCDYCGKGFSDFSGLRHHEKIHTGEKPYKCPIC 440 450 460 470 480 490 220 230 240 250 260 pF1KB7 NRAFADRSNLRAHLQTHSDVKKYQCKNCSKTFSRMSLLHKHEESGCCVAH ...: .:::. : ..:. : :.:..:.:.:: : : ::..: CCDS76 EKSFIQRSNFNRHQRVHTGEKPYKCSHCGKSFSWSSSLDKHQRSHLGKKPFQ 500 510 520 530 540 >>CCDS32568.1 ZNF18 gene_id:7566|Hs108|chr17 (549 aa) initn: 629 init1: 282 opt: 419 Z-score: 312.7 bits: 66.6 E(32554): 4.3e-11 Smith-Waterman score: 419; 38.1% identity (59.8% similar) in 194 aa overlap (73-262:359-541) 50 60 70 80 90 100 pF1KB7 PQPEILSSGAYSPITVWTTAAPFHAQLPNGLSPLSGYS-SSLGRVSPPPPSDTSSKDHSG ::: : ..::. : : ::: CCDS32 FTEDEPGCFGEGENLPEALQNIQDEGTGEQLSPQERISEKQLGQHLPNP--------HSG 330 340 350 360 370 380 110 120 130 140 150 160 pF1KB7 SESPISDEEERLQSKLSDPHAIEAEKFQ-CNLCNKTYSTFSGLAKHKQLHCDAQSRKSFS : . ::.: :. ..:.: :.:. : :.::. : : :.. : .. :. CCDS32 EMSTMWLEEKRETSQKGQPRAPMAQKLPTCRECGKTFYRNSQLIFHQRTHT---GETYFQ 390 400 410 420 430 170 180 190 200 210 pF1KB7 CKYCDKEYVSLGALKMHIRTHT--LPCVCKICGKAFSRPWLLQGHIRTHTGEKPFSCPHC : : : .. . . : :::: :: : :::.:: :. : . ::::::..:: : CCDS32 CTICKKAFLRSSDFVKHQRTHTGEKPCKCDYCGKGFSDFSGLRHHEKIHTGEKPYKCPIC 440 450 460 470 480 490 220 230 240 250 260 pF1KB7 NRAFADRSNLRAHLQTHSDVKKYQCKNCSKTFSRMSLLHKHEESGCCVAH ...: .:::. : ..:. : :.:..:.:.:: : : ::..: CCDS32 EKSFIQRSNFNRHQRVHTGEKPYKCSHCGKSFSWSSSLDKHQRSHLGKKPFQ 500 510 520 530 540 >>CCDS42496.1 ZNF846 gene_id:162993|Hs108|chr19 (533 aa) initn: 2016 init1: 289 opt: 417 Z-score: 311.5 bits: 66.3 E(32554): 5e-11 Smith-Waterman score: 417; 40.7% identity (71.4% similar) in 140 aa overlap (128-265:394-530) 100 110 120 130 140 150 pF1KB7 DHSGSESPISDEEERLQSKLSDPHAIEAEKFQCNLCNKTYSTFSGLAKHKQLHCDAQSRK ..:. :.:.... : :..: ..: ..: CCDS42 KLYLCKACGKAFTRSSGLVLHMRTHTGEKPYECKECGKAFNNSSMLSQHVRIHT---GEK 370 380 390 400 410 420 160 170 180 190 200 210 pF1KB7 SFSCKYCDKEYVSLGALKMHIRTHT--LPCVCKICGKAFSRPWLLQGHIRTHTGEKPFSC . :: : : ... ..:. :.:::: : :: :::::.: :. :.::::::::..: CCDS42 PYECKECGKAFTQSSGLSTHLRTHTGEKACECKECGKAFARSTNLNMHMRTHTGEKPYAC 430 440 450 460 470 480 220 230 240 250 260 pF1KB7 PHCNRAFADRSNLRAHLQTHSDVKKYQCKNCSKTFSRMSLLHKHEESGCCVAH .:..:: . : .: .::. .: :.::.:.:.:.. : : :: .. : CCDS42 KECGKAFRYSTYLNVHTRTHTGAKPYECKKCGKNFTQSSALAKHLRTKACEKT 490 500 510 520 530 268 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 08:39:32 2016 done: Fri Nov 4 08:39:33 2016 Total Scan time: 2.740 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]