松井@神菱システムさん、
松木です。
いささか蛍光灯(?)的回答ですが、松井さんの疑問に対する理由らしきものが見つ
かり
ました。これが全てかどうか分かりませんが、一つの理由を以下に書いて見ます。
まず、「成功したリクエスト件数」は状態コードにして、200と304が対象になってい
ます。
(defns.htmlを参照。これは以前、高野@熊本県さんが解決された話です。)
では、( grep 'htm.HTTP' | grep ' 200 ') >「ホームページへの成功したリクエ
スト件数」
との差はどこにいってしまったかという理由ですが。ログを見てみると、状態コード
200を
持ち、かつhtmlあるいはhtmの拡張子を持ったログを取り出すと、その中に以下のよ
うな
行がありました。
p234.v074.tokai.or.jp - - [01/Oct/2000:00:09:09 +0900] "GET
/center/image/hrx3.g
if HTTP/1.1" 200 54 "http://www.tokyo-kasei.ac.jp/center/body.html"
"Mozilla/4.0
(compatible; MSIE 5.0; Windows 98; DigExt)"
これは、http://www.tokyo-kasei.ac.jp/center/body.html という参照元URLから
/center/image/hrx3.gif という画像ファイルをリクエストして成功した例です。
リクエストしたのが、画像ですから、もちろんこれは「ホームページへの成功したリ
クエスト
件数」には、含まれませんが、参照元URLがページ(html)を含んでいたので、検索
に
引っかかってしまったわけです。従って、松井さんの検索結果も結局これらを多数含
んで
いたと言うことになり、結果的に両者の違いが出たと思われます。他の理由があるか
も
知れませんが、これが大きな理由の一つであることは間違いないようです。