FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA0414, 467 aa
1>>>pF1KSDA0414 467 - 467 aa - 467 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 9.2016+/-0.0016; mu= -1.1385+/- 0.091
mean_var=340.1990+/-80.708, 0's: 0 Z-trim(106.9): 773 B-trim: 358 in 1/49
Lambda= 0.069536
statistics sampled from 8368 (9279) to 8368 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.642), E-opt: 0.2 (0.285), width: 16
Scan time: 2.320
The best scores are: opt bits E(32554)
CCDS6867.1 ZBTB43 gene_id:23099|Hs108|chr9 ( 467) 3166 332.4 6e-91
CCDS44278.1 ZBTB37 gene_id:84614|Hs108|chr1 ( 503) 703 85.4 1.5e-16
CCDS4780.1 ZBTB9 gene_id:221504|Hs108|chr6 ( 473) 660 81.0 2.9e-15
CCDS48023.1 ZBTB34 gene_id:403341|Hs108|chr9 ( 500) 627 77.8 3e-14
CCDS4775.1 ZBTB22 gene_id:9278|Hs108|chr6 ( 634) 513 66.4 9.6e-11
>>CCDS6867.1 ZBTB43 gene_id:23099|Hs108|chr9 (467 aa)
initn: 3166 init1: 3166 opt: 3166 Z-score: 1746.2 bits: 332.4 E(32554): 6e-91
Smith-Waterman score: 3166; 100.0% identity (100.0% similar) in 467 aa overlap (1-467:1-467)
10 20 30 40 50 60
pF1KSD MEPGTNSFRVEFPDFSSTILQKLNQQRQQGQLCDVSIVVQGHIFRAHKAVLAASSPYFCD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS68 MEPGTNSFRVEFPDFSSTILQKLNQQRQQGQLCDVSIVVQGHIFRAHKAVLAASSPYFCD
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD QVLLKNSRRIVLPDVMNPRVFENILLSSYTGRLVMPAPEIVSYLTAASFLQMWHVVDKCT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS68 QVLLKNSRRIVLPDVMNPRVFENILLSSYTGRLVMPAPEIVSYLTAASFLQMWHVVDKCT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD EVLEGNPTVLCQKLNHGSDHQSPSSSSYNGLVESFELGSGGHTDFPKAQELRDGENEEES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS68 EVLEGNPTVLCQKLNHGSDHQSPSSSSYNGLVESFELGSGGHTDFPKAQELRDGENEEES
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD TKDELSSQLTEHEYLPSNSSTEHDRLSTEMASQDGEEGASDSAEFHYTRPMYSKPSIMAH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS68 TKDELSSQLTEHEYLPSNSSTEHDRLSTEMASQDGEEGASDSAEFHYTRPMYSKPSIMAH
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD KRWIHVKPERLEQACEGMDVHATYDEHQVTESINTVQTEHTVQPSGVEEDFHIGEKKVEA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS68 KRWIHVKPERLEQACEGMDVHATYDEHQVTESINTVQTEHTVQPSGVEEDFHIGEKKVEA
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD EFDEQADESNYDEQVDFYGSSMEEFSGERSDGNLIGHRQEAALAAGYSENIEMVTGIKEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS68 EFDEQADESNYDEQVDFYGSSMEEFSGERSDGNLIGHRQEAALAAGYSENIEMVTGIKEE
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD ASHLGFSATDKLYPCQCGKSFTHKSQRDRHMSMHLGLRPYGCGVCGKKFKMKHHLVGHMK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS68 ASHLGFSATDKLYPCQCGKSFTHKSQRDRHMSMHLGLRPYGCGVCGKKFKMKHHLVGHMK
370 380 390 400 410 420
430 440 450 460
pF1KSD IHTGIKPYECNICAKRFMWRDSFHRHVTSCTKSYEAAKAEQNTTEAN
:::::::::::::::::::::::::::::::::::::::::::::::
CCDS68 IHTGIKPYECNICAKRFMWRDSFHRHVTSCTKSYEAAKAEQNTTEAN
430 440 450 460
>>CCDS44278.1 ZBTB37 gene_id:84614|Hs108|chr1 (503 aa)
initn: 672 init1: 451 opt: 703 Z-score: 410.5 bits: 85.4 E(32554): 1.5e-16
Smith-Waterman score: 703; 31.0% identity (60.6% similar) in 462 aa overlap (1-446:1-447)
10 20 30 40 50 60
pF1KSD MEPGTNSFRVEFPDFSSTILQKLNQQRQQGQLCDVSIVVQGHIFRAHKAVLAASSPYFCD
:: : : ...:.::::...:..::: :.::.:::. . :::. :::::.::::::::: :
CCDS44 MEKGGN-IQLEIPDFSNSVLSHLNQLRMQGRLCDIVVNVQGQAFRAHKVVLAASSPYFRD
10 20 30 40 50
70 80 90 100 110 120
pF1KSD QVLLKNSRRIVLPDVMNPRVFENILLSSYTGRLVMPAPEIVSYLTAASFLQMWHVVDKCT
.. :.. . . . :: :::..: ::::. . .:.::::::::::: :..::::
CCDS44 HMSLNEMSTVSISVIKNPTVFEQLLSFCYTGRICLQLADIISYLTAASFLQMQHIIDKCT
60 70 80 90 100 110
130 140 150 160 170
pF1KSD EVLEG-----NPTVLCQKLNHG-SDHQSPSSSSYNGLVESFELGSGGHTDFPKAQELRDG
..::: : . . .:.. . :: :. .. ... . . . . ::.. : :
CCDS44 QILEGIHFKINVAEVEAELSQTRTKHQERPPESHR-VTPNLNRSLSPRHNTPKGN--RRG
120 130 140 150 160 170
180 190 200 210 220
pF1KSD ENEEESTKDELSS--QLTEHEYLPSNSSTEHDR--LSTEMASQ-DGEEGASDSAEFHYTR
. ::: . : . . .:..: . : . :.: : :..: :
CCDS44 QVSAVLDIRELSPPEESTSPQIIEPSSDVESREPILRINRAGQWYVETGVAD-------R
180 190 200 210 220
230 240 250 260 270 280
pF1KSD PMYSKPSIMAHKRWIHVKPERLEQACEGMDVHATYDEHQVTESINTVQTEHTVQPSGVEE
: . . .:.: : ::. : . . . .. . .: .... . : . : .:
CCDS44 GGRSDDEVRVLGA-VHIKTENLEEWL-GPENQPSGEDGSSAEEVTAMVIDTTGHGSVGQE
230 240 250 260 270 280
290 300 310 320 330 340
pF1KSD DFHIGEKKVEAEFDEQADESNYDEQVDFYGSSMEEFSGERSDGNLIGHRQ-----EAALA
.. .: . ... ... . .. . . . .. . .: : . .: : .
CCDS44 NYTLGSSGAKVARPTSSEVDRFSPSGSVVPLTERHRARSESPGRMDEPKQPSSQVEESAM
290 300 310 320 330 340
350 360 370 380 390 400
pF1KSD AGYSENIEMVTGIKEEASHLGFSATDKLYPCQCGKSFTHKSQRDRHMSMHLGLRPYGCGV
: : .:.. ..:.:. : . .: :.:::..:.. :::: .:.:. :. : .
CCDS44 MGVSGYVEYLR--EQEVSERWFRYNPRLTCIYCAKSFNQKGSLDRHMRLHMGITPFVCRM
350 360 370 380 390 400
410 420 430 440 450 460
pF1KSD CGKKFKMKHHLVGHMKIHTGIKPYECNICAKRFMWRDSFHRHVTSCTKSYEAAKAEQNTT
::::. : .: :.. ::: ::..:..:.: : .. ...:
CCDS44 CGKKYTRKDQLEYHIRKHTGNKPFHCHVCGKSFPFQAILNQHFRKNHPGCIPLEGPHSIS
410 420 430 440 450 460
pF1KSD EAN
CCDS44 PETTVTSRGQAEEESPSQEETVAPGEAVQGSVSTTGPD
470 480 490 500
>>CCDS4780.1 ZBTB9 gene_id:221504|Hs108|chr6 (473 aa)
initn: 675 init1: 417 opt: 660 Z-score: 387.5 bits: 81.0 E(32554): 2.9e-15
Smith-Waterman score: 662; 32.2% identity (58.8% similar) in 466 aa overlap (3-450:18-460)
10 20 30 40
pF1KSD MEPGTNSFRVEFPDFSSTILQKLNQQRQQGQLCDVSIVVQGHIFR
:. ....:::. ::..:..::..: .:..::::..:::. .:
CCDS47 METPTPLPPVPASPTCNPAPRTIQIEFPQHSSSLLESLNRHRLEGKFCDVSLLVQGRELR
10 20 30 40 50 60
50 60 70 80 90 100
pF1KSD AHKAVLAASSPYFCDQVLLKNSRRIVLPDVMNPRVFENILLSSYTGRLVMPAPEIVSYLT
::::::::.:::: :..:: .. :..::.:.. .::..: :.::: .: . ..:
CCDS47 AHKAVLAAASPYFHDKLLLGDAPRLTLPSVIEADAFEGLLQLIYSGRLRLPLDALPAHLL
70 80 90 100 110 120
110 120 130 140 150
pF1KSD AASFLQMWHVVDKCTEVLEGNPTVLCQKLNHGSD--HQSPSSSSYNG--LVES--FE--L
.:: ::::.:::.:.:.:. : .:.. : :..: .: ..: :. .
CCDS47 VASGLQMWQVVDQCSEILRELETSGGGISARGGNSYHALLSTTSSTGGWCIRSSPFQTPV
130 140 150 160 170 180
160 170 180 190 200 210
pF1KSD GSGGHTDFPKAQELRDGENEEESTKDELSSQLTEHEYLPSNSSTEHDRLSTEMASQDGEE
:.. :. : . : : .: . :. :. :.: ... : :. :. ... .
CCDS47 QSSASTESPASTESPVG-GEGSELGEVLQIQVEEEEEEEEDDDDE-DQGSATLSQTPQPQ
190 200 210 220 230
220 230 240 250 260 270
pF1KSD GASDSAEFHYTRPMYSKPSIM-AHKRWI---HVKPERLEQACEGMDVHATYDEHQVTESI
.: . :: .: : : : . . : .: : .. . : ... :
CCDS47 RVSGV----FPRPHGPHPLPMTATPRKLPEGESAPLELP-APPALPPKIFYIKQEPFEPK
240 250 260 270 280 290
280 290 300 310 320 330
pF1KSD NTVQTEHTVQPSGVEEDFHIGEKKVEAEFDEQADESNYDEQVDFYGSSMEEFSGERSDGN
. .. : ::.:..: : :: :. :.: . . .. .: . .
CCDS47 EEISGSGT-QPGGAKE-----ETKV---FSGGDTEGNGELGFLLPSGPGPTSGGGGPSWK
300 310 320 330 340
340 350 360 370 380
pF1KSD LIGHRQEAALAAGYSENIEMVTGIKEEASH----LGFS--ATDKLYPCQCGKSFTHKSQR
. . . :..: . : .: : :: . : : . : ::: :. : .:
CCDS47 PVDLHGNEILSGGGGP------GGAGQAVHGPVKLGGTPPADGKRFGCLCGKRFAVKPKR
350 360 370 380 390
390 400 410 420 430 440
pF1KSD DRHMSMHLGLRPYGCGVCGKKFKMKHHLVGHMKIHTGIKPYECNICAKRFMWRDSFHRHV
:::. . ..:::.:::.:.:.::.::::. ::: :.: . : :..:: . : ::
CCDS47 DRHIMLTFSLRPFGCGICNKRFKLKHHLTEHMKTHAGAL-HACPHCGRRFRVHACFLRHR
400 410 420 430 440 450
450 460
pF1KSD TSCTKSYEAAKAEQNTTEAN
:
CCDS47 DLCKGQGWATAHWTYK
460 470
>>CCDS48023.1 ZBTB34 gene_id:403341|Hs108|chr9 (500 aa)
initn: 784 init1: 406 opt: 627 Z-score: 369.3 bits: 77.8 E(32554): 3e-14
Smith-Waterman score: 628; 30.4% identity (58.4% similar) in 461 aa overlap (5-447:3-447)
10 20 30 40 50
pF1KSD MEPGTNSF-RVEFPDFSSTILQKLNQQRQQGQLCDVSIVVQGHIFRAHKAVLAASSPYFC
..:: . . :..:::.:..::. : ::.:::. . .::. :::::::::::::::
CCDS48 MDSSSFIQFDVPEYSSTVLSQLNELRLQGKLCDIIVHIQGQPFRAHKAVLAASSPYFR
10 20 30 40 50
60 70 80 90 100 110
pF1KSD DQVLLKNSRRIVLPDVMNPRVFENILLSSYTGRLVMPAPEIVSYLTAASFLQMWHVVDKC
:. :.. . . . :: :::..: ::::. . ..::.::::::::: :.:::
CCDS48 DHSALSTMSGLSISVIKNPNVFEQLLSFCYTGRMSLQLKDVVSFLTAASFLQMQCVIDKC
60 70 80 90 100 110
120 130 140 150 160 170
pF1KSD TEVLEG-NPTVLCQKLNHGSDHQSPSSSSYNGLVESFELGSGGHTDFPKAQELRDGENEE
:..::. . . .. . . : ::. .: ... . . : .. :
CCDS48 TQILESIHSKISVGDVDSVTVGAEENPESRNGVKDSSFFANPVEISPPYCSQGR------
120 130 140 150 160 170
180 190 200 210 220 230
pF1KSD ESTKDELSSQLTEHEYLPSNSSTEHDRLSTEMASQDGEEGASDSAEFHYTRPMYSKPSIM
. ::.: . : ::.. ..::. : :. : :. . :.. . . ...
CCDS48 ---QPTASSDL-RMETTPSKAL--RSRLQEEGHSDRGSSGSVSEYEIQIEGD-HEQGDLL
180 190 200 210 220
240 250 260 270 280 290
pF1KSD AHKRWI---HVKPERLEQ-ACEGMDVHATYDEHQVTESINTVQTEHT-VQPSGVEEDFHI
... : .:: :. .. .: : . :. :: .. :. . : : .
CCDS48 VRESQITEVKVKMEKSDRPSCS--DSSSLGDDGYHTEMVDGEQVVAVNVGSYGSVLQHAY
230 240 250 260 270 280
300 310 320 330 340
pF1KSD GEKKVEAEFDEQADESNYDEQVDFYGSSMEEFSGERSDG----NLIGHRQEAALAAGYSE
. ... .. . .. . . . : . : : :. .. : . .:. : :.
CCDS48 SYSQAASQPTNVSEAFGSLSNSSPSRSMLSCFRGGRARQKRALSVHLHSDLQGLVQG-SD
290 300 310 320 330 340
350 360 370 380 390 400
pF1KSD NIEMVTGIKEEASHLGFSATDKLYP------C-QCGKSFTHKSQRDRHMSMHLGLRPYGC
. :... :.: :: . :: : :::::..:.. :::: .:.:. :. :
CCDS48 SEAMMNNPGYESSPRERSARGHWYPYNERLICIYCGKSFNQKGSLDRHMRLHMGITPFVC
350 360 370 380 390 400
410 420 430 440 450 460
pF1KSD GVCGKKFKMKHHLVGHMKIHTGIKPYECNICAKRFMWRDSFHRHVTSCTKSYEAAKAEQN
::::. : .: :.. :: ::..:.::.: : .. ....:.
CCDS48 KFCGKKYTRKDQLEYHIRGHTDDKPFRCEICGKCFPFQGTLNQHLRKNHPGVAEVRSRIE
410 420 430 440 450 460
pF1KSD TTEAN
CCDS48 SPERTDVYVEQKLENDASASEMGLDSRMEIHTVSDAPD
470 480 490 500
>>CCDS4775.1 ZBTB22 gene_id:9278|Hs108|chr6 (634 aa)
initn: 1074 init1: 510 opt: 513 Z-score: 306.3 bits: 66.4 E(32554): 9.6e-11
Smith-Waterman score: 693; 34.7% identity (57.0% similar) in 505 aa overlap (3-410:27-523)
10 20 30
pF1KSD MEPGTNSFRVEFPDFSSTILQKLNQQRQQGQLCDVS
:.. .: ::. .:..:..::::: ::::::::
CCDS47 MEPSPLSPSGAALPLPLSLAPPPLPLPAAAVVHVSFPEVTSALLESLNQQRLQGQLCDVS
10 20 30 40 50 60
40 50 60 70 80 90
pF1KSD IVVQGHIFRAHKAVLAASSPYFCDQVLLKNSRRIVLPDVMNPRVFENILLSSYTGRLVMP
: :::. ::::.:::::::::: ::::::. : ::.::.: .::..: :.::::: :
CCDS47 IRVQGREFRAHRAVLAASSPYFHDQVLLKGMTSISLPSVMDPGAFETVLASAYTGRLSMA
70 80 90 100 110 120
100 110 120
pF1KSD APEIVSYLTAASFLQMWHVVDKCTEVL-EGN-----------------------------
: .::..::..: :::::.::::::.: ::
CCDS47 AADIVNFLTVGSVLQMWHIVDKCTELLREGRASATTTITTAAATSVTVPGAGVPSGSGGT
130 140 150 160 170 180
130 140 150 160 170 180
pF1KSD --PTVLCQKLNHGS----DHQSPSSSSYNGLVESFELGSGGHTDFPKAQELRDGENEEES
:... . .:.: ..::::::.: . :: ...:... : . : .:...
CCDS47 VAPATMGSARSHASSRASENQSPSSSNYFSPRESTDFSSSSQEAFAASAV---GSGERRG
190 200 210 220 230
190 200 210 220 230
pF1KSD TKDELSSQLTEHEYLPSNSST-EHDRLSTEMASQDGEEGASDSAEFHYTRPMYSKPSIMA
. . .. :.. : :.: . . ::. .. .: .. :: :. ::::
CCDS47 GGPVFPAPVVGSGGATSGKLLLEADELCDD--GGDGRGAVVPGAGLR--RPTYTPPSIMP
240 250 260 270 280 290
240 250 260
pF1KSD HKRWIHVK------------PER--LEQACEGMDVHAT----YDEH-------------Q
.:.:..:: :. ::. : :. : ::. .
CCDS47 QKHWVYVKRGGNCPAPTPLVPQDPDLEEEEEEEDLVLTCEDDEDEELGGSSRVPVGGGPE
300 310 320 330 340 350
270 280 290 300 310
pF1KSD VTESINTVQTEHTVQPSGVEE--------DF--HIGEKKVEAEFDEQADE--SNYDEQ--
.: ::. :.: .: :. :: . : : : .:... :.: .
CCDS47 ATLSISDVRTLSEPPDKGEEQVNFCESSNDFGPYEGGGPV-AGLDDSGGPTPSSYAPSHP
360 370 380 390 400 410
320 330 340 350
pF1KSD ------VDFYGSSMEEF------SGERSDGNLIGHRQE--AALAAGYSENIEMVTG-IKE
.:. :... : :. .. :. :.. : :. ..: : . : : .
CCDS47 PRPLLPLDMQGNQILVFPSSSSSSSSQAPGQPPGNQAEHGAVTVGGTSVGSLGVPGSVGG
420 430 440 450 460 470
360 370 380 390 400 410
pF1KSD EASHLGFSATDKLYPCQCGKSFTHKSQRDRHMSMHLGLRPYGCGVCGKKFKMKHHLVGHM
. : . .:.. :.:::.:.:::.::::..:::.:::. : ::.::::
CCDS47 VPGGTGSGDGNKIFLCHCGKAFSHKSMRDRHVNMHLNLRPFDCPVCNKKFKMKHHLTEHM
480 490 500 510 520 530
420 430 440 450 460
pF1KSD KIHTGIKPYECNICAKRFMWRDSFHRHVTSCTKSYEAAKAEQNTTEAN
CCDS47 KTHTGLKPYECGVCAKKFMWRDSFMRHRGHCERRHRLGGVGAVPGPGTPTGPSLPSKRES
540 550 560 570 580 590
467 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 01:38:33 2016 done: Thu Nov 3 01:38:33 2016
Total Scan time: 2.320 Total Display time: 0.020
Function used was FASTA [36.3.4 Apr, 2011]