Index: [Article Count Order] [Thread]

Date:  Sun, 1 Oct 2000 21:42:26 +0900
From:  "Takayuki Matsuki" <matsuki@pegasus.tokyo-kasei.ac.jp>
Subject:  [analog-jp:00151] Re: ホームページへの成功したリクエスト件数と grep  の数が合わない
To:  <analog-jp@monyo.com>
Message-Id:  <NDBBLHMFCLODDAJNHNEIAENMCCAA.matsuki@pegasus.tokyo-kasei.ac.jp>
In-Reply-To:  <001e01c02793$418ba340$8243e4d2@matsui>
Keywords:  analog
Posted:  Sun, 1 Oct 2000 21:46:59 +0900
X-Mail-Count: 00151

松井@神菱システムさん、

松木です。

いささか蛍光灯(?)的回答ですが、松井さんの疑問に対する理由らしきものが見つ
かり
ました。これが全てかどうか分かりませんが、一つの理由を以下に書いて見ます。

まず、「成功したリクエスト件数」は状態コードにして、200と304が対象になってい
ます。
(defns.htmlを参照。これは以前、高野@熊本県さんが解決された話です。)

では、( grep 'htm.HTTP' | grep  ' 200 ') >「ホームページへの成功したリクエ
スト件数」
との差はどこにいってしまったかという理由ですが。ログを見てみると、状態コード
200を
持ち、かつhtmlあるいはhtmの拡張子を持ったログを取り出すと、その中に以下のよ
うな
行がありました。

p234.v074.tokai.or.jp - - [01/Oct/2000:00:09:09 +0900] "GET
/center/image/hrx3.g
if HTTP/1.1" 200 54 "http://www.tokyo-kasei.ac.jp/center/body.html"
"Mozilla/4.0
 (compatible; MSIE 5.0; Windows 98; DigExt)"

これは、http://www.tokyo-kasei.ac.jp/center/body.html という参照元URLから
/center/image/hrx3.gif という画像ファイルをリクエストして成功した例です。
リクエストしたのが、画像ですから、もちろんこれは「ホームページへの成功したリ
クエスト
件数」には、含まれませんが、参照元URLがページ(html)を含んでいたので、検索
に
引っかかってしまったわけです。従って、松井さんの検索結果も結局これらを多数含
んで
いたと言うことになり、結果的に両者の違いが出たと思われます。他の理由があるか
も
知れませんが、これが大きな理由の一つであることは間違いないようです。