Index: [Article Count Order] [Thread]

Date:  Wed, 5 Oct 2005 03:19:25 +0900
From:  FSCM小野	 <ono.1982.kenji@jp.fujitsu.com>
Subject:  [analog-jp:01900] Re: 「異常ログ行数」「不必要ログ項目数」について 
To:  analog-jp@jp.analog.cx
Message-Id:  <200510050319.AIJ69345.3L2OPJ.KP9O9F.@jp.fujitsu.com>
In-Reply-To:  <20051003230423.2E75.TMATSUKIJP@ybb.ne.jp>
References:  <200510030115.GED41643.2OL9K.F9OP.PJ3@jp.fujitsu.com>	<20051003230423.2E75.TMATSUKIJP@ybb.ne.jp>
X-Mail-Count: 01900

 松木さん、こんばんは。

小野です。

> 不必要ログ項目数(Unwanted logfile entries):
>   明示的に除外した行(FILEEXCLUDEコマンドで除外した行)

なるほど。

> したがって、FILEEXCLUDEコマンド以外で除外されたと思われるのは
> LOGFORMATコマンドでひょっとして以下のように書いた場合です(?)。
> LOGFORMAT (%S - %u [%d/%M/%Y:%h:%n:%j %j] "%j %r HTTP/1.0" %c %b)

LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\"" combined

LogFormat "%h %l %u %t \"%r\" %>s %b" common

LogFormat "%{Referer}i -> %U" referer

LogFormat "%{User-agent}i" agent

LogFormat "%h %l %u %t \"%r\" %>s %b mod_gzip: %{mod_gzip_result}n In: %
{mod_gzip_input_size}n Out: %{mod_gzip_output_size}n %{mod_gzip_compression_ratio}
npct." combined_with_mod_gzip


Apacheの定義は上記のようになっています。

> 異常ログ件数(Corrupt logfile lines):
:Snip
> ないためです。) デバッグを有効にすることで、corrupt line をすべて表示さ
> せることができます。) 

DEBUG C
WARNINGS ON
ERRFILE errfile.txt
書いてみたのですが、
Yokohama-Netra{yokohama}63: cat errfile.txt
./analog: Warning D: In Directory Report, SORTBY (alphabetical) doesn't match
  SUBSORTBY (bytes)
このような行がでるだけでした。(^^;;

hoge.com - - [28/Jul/2005:16:30:09 +0900] "GET /infection_inf/infc_infuruenza.asp 
HTTP/1.0" 304 -
hoge.com - - [30/Jul/2005:00:00:05 +0900] "GET /infection_inf/infc_infuruenza.asp 
HTTP/1.1" 200 21977

上記なども、何故、1行目が良くて2行目がNGなのか意味がさっぱり
わかりません。
上記は抜粋なのですが、全体で100万行くらいあるなかで、HTTP/1.1
でのアクセスは他にも沢山あって、正常にカウントされている行もある
と思います。
上記はたまたま、ディレクトリレポートとの整合性をチェックする際、
このURLが実際に何行あるのかを抽出してファイル化しました。
その抽出行のみのファイルを利用してAnalogにかけたところ、HTTP/1.1
の行の数が、不必要ログ項目数の数と一致しました。
よって、HTTP/1.1は読み込めないのかな、と思った次第です。

以上、もう少しお付き合いを頂きたく、宜しくお願い致します。