Analog 4.16: 包含と除外HOSTEXCLUDE mycomputer.myisp.comは、そのコンピュータからの全てのリクエストを統計から除外します。
項目が含まれるか除外されるかどうかの規則は、次のようにして決められる。その項目に対する全ての INCLUDE と EXCLUDE は、順番に一つずつ考慮され、適合する最後のコマンドにより、その項目が含まれるか或いは除外されるかが決まる。どの INCLUDE あるいは EXCLUDE コマンドにも一致しない項目は、もしそのコマンドが除外ならば含まれるし、もしそのコマンドが包含ならば除外される。例えば、以下の環境設定
FILEINCLUDE /~sret1/* FILEEXCLUDE /~sret1/backgammon/*,/~sret1/analog/* FILEINCLUDE /~sret1/backgammon/*.gifは、私のファイルだけを吟味しろとプログラムに指示し、次に私の backgammon と analog のファイルは除外するが、最後に backgammon ディレクトリ中の gif ファイルだけを含めるように指示する。一方、
FILEEXCLUDE /~sret1/*/img/*は、私の種々のディレクトリ中の画像ファイルを除いて、全てのファイルを解析する。 (もし全ての包含と除外について混乱したときには、SETTINGS ON を使えば、あなたが指定したオプションが何を意味するかを見ることがいつでも出来ることを思い出してください。)包含と除外は、幾つでもワイルドカードを使え、コンマ(スペースではない)区切りでリストすることができることに注意せよ。
これらのコマンドの完全な一覧は、HOSTINCLUDE と HOSTEXCLUDE; FILEINCLUDE と FILEEXCLUDE; BROWINCLUDE と BROWEXCLUDE; REFINCLUDE と REFEXCLUDE; USERINCLUDE と USEREXCLUDE; VHOSTINCLUDE と VHOSTEXCLUDE;そして STATUSINCLUDE と STATUSEXCLUDE である。
包含と除外は別名を付けた 後に 処理されるので、使用すべき名前は、別名である。( OUTPUTALIAS コマンドがない時には、これは出力に現れる項目名である。)
時には、行がある特別な項目を含まないことがある。これは、その行にその項目用の場所が無いからか、あるいはそのリクエストに対して、ブラウザーがその項目を送らないから、あるいは存在したのだが、以上行であったからである。これらの行を含めるか削除するかは、 INCLUDE か EXCLUDE コマンドに特殊な空の項目を指定することによって可能になる。
USERINCLUDE jim USERINCLUDE ""は、 jim というユーザを含む行と、ユーザが指定されていない行を含めることになる。
もしファイルが、検索語 を含むときには、REQINCLUDE と REFINCLUDE は、やや直感とは異なる振る舞いをする。
適切な OS では、"REGEXP:" または "REGEXPI:" を表現の頭に付け加えて、包含と除外に対して正規表現が使える。これについては、エイリアスの項ですでに相当ページを割いて説明をしたので、詳細については、そこを参照 して下さい。正規表現は、コンマで区切った一覧内ではなくそれ自身の行になければならない。
STATUSINCLUDE 200-206,304,500-は、状態コードが 200-206, 304 または 500-599 の行だけを見ることを意味する。
ある人が、状態コード 304 (変更なし)を除外して、リクエストレポートに現れないようにしたいとします。しかしもっと良い方法があります。初期設定で、analog はコード 304 を成功リクエストと勘定します。なぜなら、ユーザにはキャッシュされたページが提供されたと仮定するからです。しかし、以下のコマンドを使って、これをリダイレクトされたリクエストと勘定することも出来ます。
304ISSUCCESS OFF繰り返しますが、この意味を理解していないならば、初期設定を使用してください。
FROM 990701 TO 000630:1300この代わりとしては、各成分の頭に + または - を付けて、プログラムが起動された時刻に相対的な時間を表すことができます。この場合には、日にちは2桁以上になることができます。これを使えば、以下のような設定ができます。
FROM -01-00+01 # 昨年度の明日の日付から TO -00-0131 # 先月の終わりまで (先月が31日なくても大丈夫です) FROM -00-00-112 TO -00-00-01 # 最近16週間の統計 FROM -00-00-00:-06+01 # 最近6時間の統計FROM と TO コマンドに対するコマンドラインの省略形、+F と +T があります。例えば、+T-00-00-01:1800 は、昨日の午後6時までの統計を取ります。-F と -T は、FROM OFF と TO OFF の様に、これらのコマンドの使用を止めます。
REFREPEXCLUDE http://your.site.com/*は、「リンク元URLレポート」からあなたの内部のリンク元を除外します。しかし、このコマンドでは、内部のリンク元は、「不成功リンク元レポート」、「リンク先レポート」、等からは除外されません。( これを実行するには、FAILREFEXCLUDE、 REFSITEEXCLUDE 等が必要です。) REFEXCLUDE コマンドと同様に、これらのリンク元があっても、ログファイルの他の解析は妨げられません。また、REFREPEXCLUDE は、レポートの最後の行の "残り" にリンク元を含みます。
これらのコマンド群の全部の一覧は以下の通りです。REQINCLUDE と REQEXCLUDE; REDIRINCLUDE と REDIREXCLUDE; FAILINCLUDE と FAILEXCLUDE; TYPEINCLUDE と TYPEEXCLUDE; DIRINCLUDE と DIREXCLUDE; HOSTREPINCLUDE と HOSTREPEXCLUDE; DOMINCLUDE と DOMEXCLUDE; ORGINCLUDE と ORGEXCLUDE; REFREPINCLUDE と REFREPEXCLUDE; REFSITEINCLUDE と REFSITEEXCLUDE; SEARCHQUERYINCLUDE と SEARCHQUERYEXCLUDE; SEARCHWORDINCLUDE と SEARCHWORDEXCLUDE; REDIRREFINCLUDE と REDIRREFEXCLUDE; FAILREFINCLUDE と FAILREFEXCLUDE; BROWSUMINCLUDE と BROWSUMEXCLUDE; FULLBROWINCLUDE と FULLBROWEXCLUDE; OSINCLUDE と OSEXCLUDE; VHOSTREPINCLUDE と VHOSTREPEXCLUDE; USERREPINCLUDE と USERREPEXCLUDE; と FAILUSERINCLUDE と FAILUSEREXCLUDE。もし、出力の別名 を使用しているときには、包含と除外は、別名を付ける前の名前に適用されます。
適切な INCLUDE と EXCLUDE コマンド内で、象徴的な言葉 pages を使うこともできる。非常によく使われるコマンド
REQINCLUDE pagesは、リクエストレポート中のページだけを含めるようにする。
PAGEINCLUDE *.ps,*.ps.gz PAGEEXCLUDE /sret1.html即ち、ポストスクリプトファイルと gzip で圧縮されたポストスクリプトファイルがページとみなされるが、/sret1.html はページとはならない。(もしファイルが 検索引数 を持っているときには、PAGEINCLUDE と PAGEEXCLUDE は、疑問符の前のファイル名の部分に対してだけ考慮される。)
LINKINCLUDE pagesは、リクエストレポート中でページにリンクを張る。または、
LINKINCLUDE *.pdfは PDF ファイルにリンクを張る。リクエストレポート中のリンクの目標は、BASEURL コマンドによっても影響を受けることに注意せよ。
Stephen Turner
analog についての質問は analog-help メーリングリスト をお使いください。