Index: [Article Count Order] [Thread]

Date:  Fri, 14 Feb 2003 11:17:10 +0900
From:  Takayuki Matsuki <tmatsukijp@ybb.ne.jp>
Subject:  [analog-jp:01455] Re: pdf ファイルのログ解析
Sender:  tmatsukijp@ybb.ne.jp
To:  analog-jp@jp.analog.cx
Message-Id:  <mid-1455-analog-jp@jp.analog.cx>
In-Reply-To:  <mid-1454-analog-jp@jp.analog.cx>
References:  <mid-1454-analog-jp@jp.analog.cx>
X-Mail-Count: 01455

松木です。

ステータスコード206は断片情報(Partial Information)と
ありますから、三品さんの考えていたとおりですね。
状態コードレポートを見れば、この件数は表示されますが、
Analogは忠実にApacheで記録された項目を勘定するだけです
から、「何件がまとまって実際の1つのファイルをダウンロード
したか」までは計算してくれないと思います。
grepで抜き出して手で修正してからログに入れ直せば、望みの
レポートを手に入れることができないことはないでしょうが、
そこまでやる必要があるかどうか?件数が多ければそんなことは
出来ないし。
もしこのデータ(ステータスコード206)だけを解析対象から除外
するなら、

STATUSEXCLUDE 206

でできますが。

On Fri, 14 Feb 2003 10:13:40 +0900
mishina <mishina.f@jp.fujitsu.com> wrote:
> 古いのですが、Apache1.3.12、analog4.13を使用しています。
> 
> アクセスログ中のpdfファイルの記録で、バイト数が違うだけで
> まるっきり同じ内容のログが永遠記録されています。
> -----------------------------------
> xxx.xxx.xxx.xxx - - [14/Feb/2003:09:54:00 +0900] "GET
> /aaa/bbb/ccc/ddd.pdf HTTP/1.1" 206 1024 "-" "Mozilla/4.0 (compatible;
> MSIE 5.5; Windows 98)"
> xxx.xxx.xxx.xxx - - [14/Feb/2003:09:54:00 +0900] "GET
> /aaa/bbb/ccc/ddd.pdf HTTP/1.1" 206 1024 "-" "Mozilla/4.0 (compatible;
> MSIE 5.5; Windows 98)"
> xxx.xxx.xxx.xxx - - [14/Feb/2003:09:54:00 +0900] "GET
> /aaa/bbb/ccc/ddd.pdf HTTP/1.1" 206 552 "-" "Mozilla/4.0 (compatible;
> MSIE 5.5; Windows 98)"
>  ・
>  ・
> -----------------------------------
> 多分、ファイルが分割されて送信されてるからと思うのですが、analogでは
> これを忠実にカウントしているようで、解析結果ではpdfファイルのアクセス
> 数が、ルートディレクトリのアクセス数を抜かしてしまうといったような現象
> が起こってしまいました。
> 
> これはApacheのログおよびpdfファイルの特性上仕方ないのでしょうか?
> それとも、analogの解析方法で回避することは可能なのでしょうか?