ニャロメです。
On Thu, 11 Jan 2001 22:39:00 +0900
"Takayuki Matsuki" <matsuki@tokyo-kasei.ac.jp> wrote:
> 松木です。
>
> > ニャロメです。
> > はじめて、投稿させて頂きます。
> >
> > 各ホストからログそのもの・圧縮ファイルを送るとどうしても大きくなるので、
> > 各ホストでanalogして出力をキャッシュファイルにして、最後にまとめたら如何
> > でしょうか?
>
> 確かに、キャッシュファイルをログファイルから作成すれば、もとのログファイルから
> 更にデータ項目が減って、従ってファイルサイズも減り、それを圧縮すれば、更に
> ログファイルの圧縮サイズより小さくなりそうです。しかも、圧縮したキャッシュ
> ファイル
> から、analog でデータ解析ができるので一つの選択肢であるようです。
> ただ、私は試したことがないので、圧縮率とどれくらい情報量が減るのか何とも
> 言えません。
>
> ニャロメさんは試されましたか。試されたら結果を教えていただけますか。
私のお客さん(某DB屋)で運用しているサイトのログです。
ログは圧縮して、キャッシュは未圧縮です。
キャッシュは統計後の内部データを保存するので、ログの大きさが2倍になって
も少し増えるだけです。また、このサイトのツリーは大きいので松木の環境では
小さくなるかもしれません。
ログ(圧縮)
336122 log/host-20010107.gz
374660 log/host-20010108.gz
1637748 log/host-20010109.gz
1819526 log/host-20010110.gz
1838106 log/host-20010111.gz
キャッシュ
191725 cache/host-20010107
158796 cache/host-20010108
260596 cache/host-20010109
283628 cache/host-20010110
286078 cache/host-20010111
キャッシュはALIAS(OUTPUTALIASではなく)後の統計が入るようです。
FLOORは適用されていないようです。
運用では、バーチャルホストで2サイト分のログをcronでキャッシュに変換後、
さらに1つのキャッシュファイルを作成していて、CGI(anlgform.pl)経由で参照
するようにしています。