[ 先頭 | 上へ | 前へ | 次へ | 目次 | 索引 ]

Analog 5.24: Analog 固有の用語定義


この章では、Analog で使われている用語の定義と、 This section describes how analog defines its terms, and exactly what is counted in each category. これはやや技術的な話になりますので、レポートについてざっと理解したいと いう時には、まずは Analog のレポート 章を読むことをお勧めします。

それでは、基本的な用語の定義からしていきましょう。 ホスト とは、ファイルを要求してくるコンピュータを意味します(「クライアント」と呼ばれることもよくあります)。 ファイルはページ (HTML ドキュメントなど) の場合もありますが、画像などそれ以外の場合もあります。 デフォルトで、ファイル名の末尾が (大文字小文字に関わらず) .html.htm/ であるものは、ページとみなされます。ただし PAGEINCLUDE コマンドにより、任意のファイルをページとして扱うことができます。

total requests とは、ページ、画像など、すべてのファイルに対するリクエストの数を示します。(これはヒット数と呼ばれることもありますが、この言葉は別の意味に使われることもありますので、ここでは使用を避けました)。requests for pages はページへのリクエスト数だけを扱います。多数のファイルに対するリクエストを行なうことによっても、同じファイルに何度もリクエストを行なうことによっても、多数のリクエストが発生します。

リクエストの referrer とは、ユーザ(コンピュータ)が現在参照しているファイルについての情報を得た場所を意味します。 リンクをたどって現在参照しているページにたどり着いた場合は、ひとつ前のページになるでしょう。ページに含まれる画像の場合、referrer は、その画像を含んでいるページになるでしょう。

Analog では、キロバイト(kirobyte)とは 1024 バイトを意味します。 (これを kibibyte と表示したい場合は、言語ファイルを修正してください。)


Analog は HTTP ステータスコードに基づいて、リクエストを4つのカテゴリに分類します。各ステータスコードごとのリクエスト数や、その意味についてはステータスコードレポートで参照できます。( 詳細な記述については、HTTP spec を参照してください。)

まず、成功したリクエストとは、HTTP ステータスコードが 200 番台(ドキュメントが返却された)か、304(ドキュメントが要求されたが、最近修正されておらず、キャッシュされたコピーを使うことができるので、不要である)のものです。(304ISSUCCESS コマンドにより、コード 304 を成功したリクエストではなく、リダイレクトされたリクエストとして扱うように設定することもできます。) ページに対する成功したリクエスト とは、リクエストされたファイルが存在して、それがページであるものです。

リダイレクトされたリクエスト とは、304 以外の 300 番台のステータスコードのものです。これはユーザがリクエストしたファイルとは別のファイルを提示されたことを意味します。このリクエストの大部分は、ユーザが「/」を最後につけずにディレクトリ名をリクエストした場合になります。この場合は、サーバはリクエストをリダイレクトし(おそらく以下の処理を意味していると解釈して)、ユーザは再度アクセスを行なって、適切なドキュメントを取得します。(通常ブラウザはユーザが何もしなくても、この処理を自動的に行ないます) リダイレクトされたリクエストが発生するこれ以外の理由としては、「click-thru」な宣伝バナーが使われている場合が考えられます。

失敗したリクエスト とは、400 番台のステータスコード(リクエストのエラー)のものか、500 番台(サーバ側のエラー)になります。これが発生する理由は様々ですが、一番多いのは、要求されたファイルが見つからなかったか、読み込みが許可されていない場合になります。

最後になりますが、requests returning informational status code とは、100 番台のステータスコードのものになります。現在このステータスコードが返却されることはまずないでしょう。

全体の概要で表示されるログファイルの行の分類は、他にも幾つかあります。 Lines without status code はステータスコードが記録されていないログファイルの行数を示します。全体の概要で、成功したリクエストとして計算される行は、ステータスコードがあるもののみです。ただし、行にリクエストされたファイル名が含まれていて、そのファイル名が計算されている場合(LOGFORMAT コマンドで、不正な行を示すアスタリスクがつかない場合)に限り、その行は成功したリクエストとして分類されます。 Unwanted logfile entries は、明示的に除外した行になります。 corrupt logfile lines は Analog が解析できなかった行数になります。 (この数値は、ログファイルの一部だけを解析するように指定されていた場合であっても、ログファイル全体の中で Analog が解析できなかった行数になります。これは解析できなかった行については、そもそも解析対象かどうかについても判断することができないためです。) デバッグを有効にすることで、corrupt line をすべて表示させることができます。)


ほとんどのレポートは、リクエスト数、ページ単位のリクエスト数、バイト転送量、最終アクセス日などの数を算出する場合、成功したリクエストのみを対象としています。もちろん、リダイレクトレポートや失敗したレポートは除きます。 時間レポート、ステータスコードレポート、処理時間レポート、ファイルサイズレポート、全体の概要におけるバイト数単位の行については、さらに制限があり、 ログファイルの行には、リクエストされたファイル名が含まれていて、そのファイル名自体が計算されている必要があります。 これは、サーバが複数のログファイルを併用している時に、二重にカウントしてしまうことを防ぐために必要な処理です。

時間レポート以外のレポートの最下行にある「not listed」行は、レポートの閾値以下の値のため、個別に表示されなかった項目を示します (これには、明示的に除外した項目は含まれません)。

全体の概要における括弧内の数値は、最近7日間のものを示します。これは TO で指定した時間の直近 7 日間か、もしくはTO が指定されていない場合は、プログラム起動時点までの直近 7 日間を示します。(ログファイルに最後に記録された時刻における最近 7 日間という指定ができると、もっと良いのですが、その時刻は、ログファイル全体を読み込むまでわからないため、これではタイミングが遅過ぎます (訳注: Analog はログファイルを読み込みながら解析のための情報を蓄積しますので、このロジックを実装すると、最初に最近 7 日間の期間を特定するために一度すべてのログファイルを読み込んだ上、改めて解析のために再度すべてのログファイルを読み直す必要があります) 。 The figures for the last seven days are not included if all, or none, of the requests fall in the last seven days.

ドメインレポートにおける、「domain not given」というメッセージは、ホスト名にドット(「.」)が含まれていないという意味になります。「Unknown domain」は、ドットが含まれてはいるものの、ドメイン名自体がドメインファイル 中に存在しなかったという意味になります(もしくはドメインファイルが読み込めなかったという場合も該当します)。The hosts and domains concerned can be listed by turning debugging on.

OSレポートで、どのブラウザをロボットとみなすかについては、 ROBOTINCLUDEROBOTEXCLUDE コマンドで制御されます。


Analog ホームページ

Stephen Turner
25 June 2002

Analog についての質問はanalog-help メーリングリスト をお使いください。 (訳注: 日本では analog-jp メーリングリスト をご利用ください)

[ 先頭 | 上へ | 前へ | 次へ | 目次 | 索引 ]