Index: [Article Count Order] [Thread]

Date:  Fri, 12 Jan 2001 11:30:41 +0900
From:  にゃろめ <nyarome@tenik.co.jp>
Subject:  [analog-jp:00255] Re: 複数のマシンのログ
To:  analog-jp@monyo.com
Message-Id:  <20010112112924.9808.NYAROME@tenik.co.jp>
In-Reply-To:  <NDBBLHMFCLODDAJNHNEIOEMKCEAA.matsuki@tokyo-kasei.ac.jp>
References:  <20010111201449.97FC.NYAROME@tenik.co.jp> <NDBBLHMFCLODDAJNHNEIOEMKCEAA.matsuki@tokyo-kasei.ac.jp>
Posted:  Fri, 12 Jan 2001 11:29:26 +0900
X-Mail-Count: 00255

ニャロメです。

On Thu, 11 Jan 2001 22:39:00 +0900
"Takayuki Matsuki" <matsuki@tokyo-kasei.ac.jp> wrote:

> 松木です。
> 
> > ニャロメです。
> > はじめて、投稿させて頂きます。
> >
> > 各ホストからログそのもの・圧縮ファイルを送るとどうしても大きくなるので、
> > 各ホストでanalogして出力をキャッシュファイルにして、最後にまとめたら如何
> > でしょうか?
> 
> 確かに、キャッシュファイルをログファイルから作成すれば、もとのログファイルから
> 更にデータ項目が減って、従ってファイルサイズも減り、それを圧縮すれば、更に
> ログファイルの圧縮サイズより小さくなりそうです。しかも、圧縮したキャッシュ
> ファイル
> から、analog でデータ解析ができるので一つの選択肢であるようです。
> ただ、私は試したことがないので、圧縮率とどれくらい情報量が減るのか何とも
> 言えません。
> 
> ニャロメさんは試されましたか。試されたら結果を教えていただけますか。
私のお客さん(某DB屋)で運用しているサイトのログです。
ログは圧縮して、キャッシュは未圧縮です。
キャッシュは統計後の内部データを保存するので、ログの大きさが2倍になって
も少し増えるだけです。また、このサイトのツリーは大きいので松木の環境では
小さくなるかもしれません。

ログ(圧縮)
 336122 log/host-20010107.gz
 374660 log/host-20010108.gz
1637748 log/host-20010109.gz
1819526 log/host-20010110.gz
1838106 log/host-20010111.gz

キャッシュ
 191725 cache/host-20010107
 158796 cache/host-20010108
 260596 cache/host-20010109
 283628 cache/host-20010110
 286078 cache/host-20010111

キャッシュはALIAS(OUTPUTALIASではなく)後の統計が入るようです。
FLOORは適用されていないようです。

運用では、バーチャルホストで2サイト分のログをcronでキャッシュに変換後、
さらに1つのキャッシュファイルを作成していて、CGI(anlgform.pl)経由で参照
するようにしています。