Index: [Article Count Order] [Thread]

Date:  Thu, 19 Dec 2002 11:42:32 +0900
From:  Takayuki Matsuki <tmatsukijp@ybb.ne.jp>
Subject:  [analog-jp:01428] Re: 連続する同一 IP    からのリク
Sender:  tmatsukijp@ybb.ne.jp
To:  analog-jp@jp.analog.cx
Message-Id:  <mid-1428-analog-jp@jp.analog.cx>
In-Reply-To:  <mid-1427-analog-jp@jp.analog.cx>
References:  <mid-1426-analog-jp@jp.analog.cx> <mid-1427-analog-jp@jp.analog.cx>
X-Mail-Count: 01428

松木です。

On Wed, 18 Dec 2002 12:29:15 +0900
森下寿昌 <morishita@mimi-zuku.com> wrote:
> 不必要ログ項目数: 4,355
> 
> 問題は不必要ログ項目ですが、
> 「リンク元サイトレポート」の合計が710件でした。
> そこで、ログの中からリンク元のあるもののみ抽出して、
> 解析結果と比較しました。その結果見事に一致しています。
> つまり、リンク元がSEARCHENGINEで定義されていないログは、
> すべて不必要ログ項目となっていたわけです。
> 
> 完全に設定がおかしかったことが分かりました。
> 当初の私の推測は完全にまちがっていました。
> しかし、SEARCHENGINEで定義したリンク元だけが拾われるというのは、
> どこがおかしいのか分かりません。
> SEARCHENGINEで定義するとそうなってしまうのでしょうか。

「不必要ログ項目(Unwanted logfile entries)」の定義は、
以下のURLに載っています。

http://www.jp.analog.cx/jp5.24/defns.html

これによると、Analog.cfgの設定あるいは他の設定で、*EXCLUDE
コマンドを使用してログから除外した項目の含まれる行数という
ことになります。*INCLUDEコマンドと同様に、*EXCLUDEコマンド
には、単にレポートからその項目を除外する種類のコマンドと
ログから完全に解析対象外として除外してしまうコマンドの種類
があります。この場合には、後者の種類のコマンドを使用した場合
を想定しています。
この場合には逆に、SEARCHENGINEは*INCLUDEコマンドに相当して
おり、このコマンドにより、ログ中の解析対象の母集団が決められ
ているので、SEARCHENGINEで書かれていないURLは「不必要ログ項目」
になっているのだと思います。