Index: [Article Count Order] [Thread]

Date:  Wed, 18 Dec 2002 12:29:15 +0900
From:  森下寿昌 <morishita@mimi-zuku.com>
Subject:  [analog-jp:01427] Re: 連続する同一 IP    からのリク
To:  analog-jp@jp.analog.cx
Message-Id:  <mid-1427-analog-jp@jp.analog.cx>
In-Reply-To:  <mid-1426-analog-jp@jp.analog.cx>
X-Mail-Count: 01427

森下です。

>> 一番手っ取り早いのは、「/」への200を持つ成功リクエスト
>> のみを抜き出し、Analogで解析してみることだと思います。

件数をしぼって実験したところ以下のような結果が出ました。
ログ行数は5089行です。

リクエスト成功件数: 710
異常ログ行数: 24
不必要ログ項目数: 4,355

この合計は5089になります。

異常ログ行数は、ログフォーマットが拡張形式になっていないものだでした。
ぴったり数が一致しました。

問題は不必要ログ項目ですが、
「リンク元サイトレポート」の合計が710件でした。
そこで、ログの中からリンク元のあるもののみ抽出して、
解析結果と比較しました。その結果見事に一致しています。
つまり、リンク元がSEARCHENGINEで定義されていないログは、
すべて不必要ログ項目となっていたわけです。

完全に設定がおかしかったことが分かりました。
当初の私の推測は完全にまちがっていました。
しかし、SEARCHENGINEで定義したリンク元だけが拾われるというのは、
どこがおかしいのか分かりません。
SEARCHENGINEで定義するとそうなってしまうのでしょうか。
ご存じでしたら教えて下さい。
よろしくお願いします。