AWStats
はオープンソースのアクセス解析ツールです。
Apache httpd や IIS
などのウェブサーバのアクセスログを解析してウェブで見せるツールです。
CGI として動作させることも可能で、グラフィカルなウェブ・インターフェースを持っています。
現在の AWStats は正式に日本語対応しており、ウェブ・インターフェースも日本語化されています。
UTF8 で書かれています。
アクセスログの分析についても、UTF8 であれば日本語の検索ワード、キーワードも解析して表示してくれます。
しかし、ログに euc (EUC-JP) や sjis (Shift-JIS) の検索キーワードが含まれている場合は、うまく解析できません。
解析結果の「検索文字列(キーフレーズ)」や「検索文字列(キーワード)」に文字化けした文字列が並んでしまいます。
UTF8 で検索された文字列と EUC-JP で検索された文字列は、別々の検索文字列として集計されてしまいます。
これは、検索エンジンに依存しており、検索エンジンによって使用している文字コードがことなるからです。
単にログファイルを見ただけでは、どれが UTF8 でどれが EUC なのか、一目見て分かる人は少ないでしょう。
それは、日本語の検索文字列が URL エンコーディングされたものがログに記述されているからです。デコードしないと分かりません。
また、解析結果には「ロボット/スパイダーの訪問者」「アクセス元 - 検索エンジン」などがありますが、
日本の検索エンジンや日本のロボット/スパイダーはカウントされません。
Google などは、海外の Google と日本の Google を別けてカウントしたくてもまとめてカウントされてしまいます。
特にロボットによるアクセスは訪問者の閲覧とは違いますので、解析結果の閲覧数から引かれます。
ロボットの訪問者数が正確にカウントされるかされないかで、閲覧数が変わってきてしまいます。
また、解析結果に「ブラウザ」があって、ウェブの閲覧に使用されているブラウザの統計をとっていますが、
日本製のブラウザ Sleipnir が MS Internet Explorer としてカウントされてしまいます。
これらの問題を解消するためにパッチを作成しました。
AWStats の日本語対応というよりにローカライズ、日本の検索エンジンやロボット対応です。
・ awstats-6.5-japanese.patch.gz (for awstats-6.5)
アクセスログを UTF8 へする為に、Jcode.pm を使用しています。
従って、Jcode.pm が必要になります。
・
sleipnir.png (14 x 14 px.)
・ awstats-6.5-1ja.noarch.rpm (RPM)
・ awstats-6.5-1ja.src.rpm (SRPM)
以下のLinux OSで動作確認をしました。
・ RedHat 6.2 + perl 5.005_03
・ Fedora Core 4 + perl 5.8.6
(yum で perl-Jcode-2.03-1.fc4 をインストール)
(AWStats のソースアーカイブとパッチとアイコンをダウンロード) gzip -d awstats-6.5-japanese.patch.gz tar xvzf awstats-6.5.tar.gz cd awstats-6.5 patch -p1 < ../awstats-6.5-japanese.patch cp ../sleipnir.png wwwroot/icon/browser/
Last Modify:2006/05/05