Index: [Article Count Order] [Thread]

Date:  Mon, 10 Oct 2005 23:12:06 +0900
From:  Takayuki Matsuki <tmatsukijp@ybb.ne.jp>
Subject:  [analog-jp:01907] Re: 「異常ログ行数」「不必要ログ項目数」について 
Sender:  matsuki@tokyo-kasei.ac.jp
To:  analog-jp@jp.analog.cx
Message-Id:  <20051010225021.DDA3.TMATSUKIJP@ybb.ne.jp>
In-Reply-To:  <200510100324.DHH48855.3K.9OF92JOLP.P@jp.fujitsu.com>
References:  <20051006094409.7B15.MATSUKI@tokyo-kasei.ac.jp> <200510100324.DHH48855.3K.9OF92JOLP.P@jp.fujitsu.com>
X-Mail-Count: 01907

小野さん

> なんとなくわかってきました。
> 
> lj2007.inktomisearch.com - - [10/Sep/2005:06:34:37 +0900] "GET /me/aoba/aobadai/
> h16ochiba/ochiba3.html HTTP/1.0" 200 7722 "-" "Mozilla/5.0 (compatible; Yahoo! S
> lurp; http://help.yahoo.com/help/us/ysearch/slurp)";
> 上記のログですが、「lj2007.inktomisearch.com」の部分を「hoge.com」
> に変えるとカウントされるようになりました。
> 特にこの部分を対象外にするような定義が見つからないのですが、そん
> なものでしょうか。
> 
> また、「SEARCHENGINE」や「ROBOTINCLUDE」は包含されるのでしょうか、
> それとも、除外されるのでしょうか。
> マニュアル見てもピントきません。
> 「ROBOTINCLUDE」は「〜INCLUDE」なので包含されるような気もするの
> ですが・・・。

SEARCHENGINE http://*yahoo.*/* p
の意味は、yahoo の文字列を含む検索サイトは、p=analog+compile のように
検索項目に名前を「p」とつけるの意味です。これは、検索語/検索単語レポート
中で解析するのに使用されます。

ROBOTINCLUDE *Slurp*
の意味は、上記の一番上のログの最後のブラウザー項目中にある「Slurp」と
いう文字を見つけるとこのログはロボットによる自動検索であるとみなし、
OSレポート中に「ロボット」という項目を設けます。

通常
NOROBOTS ON
がデフォルトになっており、これが有効になるのはロボットがMETAタグに準拠
している場合であり、組織別(ホスト)レポート中から排除されます。

参考:
http://www.jp.analog.cx/jp5.911/output.html#NOROBOTS
我々の本「Analog Webアクセスログの高速解析ソフト」p.62
-- 
Takayuki Matsuki <matsuki@tokyo-kasei.ac.jp>