BAKの日記: web log 解析ツール 2
webalizer をマシンに仕込んでみた. こんな感じである. 過去のログは特に保存してないので,ここ1カ月間の統計である.
こうやってみると,意外に見に来てる人が多いのだなぁ,と感じる. しかも,ほとんどが Google 経由だったりするようだ. そんなに頻繁に更新してるわけでもないのだが.
ちょっと手こずったのが,逆引き. うちでは,逆引きしないで IP アドレスのままで access_log に落とすように設定している. で,Vine の吊しの rpm では,逆引きが disable にされてコンパイルされている. このままでは,国(ドメイン)別の統計が正しく表示されない. そこで,SRPM を取ってきて再コンパイルを書けてみようとするが,db を扱っているあたりでエラーが出て通らない.
まぁ,こいつをイジってもいいのだが,ここは手抜きで perl で逆引きをするようなラッパースクリプトをでっちあげる. で,やっとこさ国別情報が表示されるようになりました. めでたしめでたし.
追記: 某氏に対抗して analog もインストールしてみる. こちらはこんな感じ. こっちも DNS 逆引きでちと手こずる. これについては,anlgform.pl の中をちょろっといじって解決.
更に図に乗って,analog の DNS 逆引きキャッシュを webalizer 側でも参照するように改造してみる. 一気に解析速度が速くなりました.
更に追記: アクセス元のホスト名をそのまま晒すのはまずいかな,というわけで,webalizer のほうは,設定ファイルでこれを表示しないように設定を変更. analog のほうも,form で統計情報を選択できていたものを,決め打ちにするように変更. こいつは,別の設定ファイルを作成し,web 経由のアクセスではシェルラッパーを通すようにして解決.
更に更に追記: 闘いの記録をまとめてみました. 参考まで.
WEB log解析つーる (スコア:1)
本家 [sourceforge.net]
日本語な情報 [ryu.dyn.to]
------------------ セキュリティって何?
対抗されましたっ (スコア:1)
私のuser agentもおもしろいからねぇ…。
私のはWin2K + SP2 + Apache の環境。バイナリで配布されているのを Windowsのタスクでまわしとります。
ちょこちょことやってみたけどwebalizerはすんなりと設置できてしまったので拍子抜け。analogは奥が深くておもしろいですね♪
仕掛けてみたところ [sslan.com]