カウンターと検索ロボット

［えでぃっとはうすのときど記］

カウンターと検索ロボット

　僕はこの1年、どうして三つともダウンロードするのだろう、と疑問に思っていた。
　2005年の12月から僕が作ったささやかなCGIスクリプトを公開しているが、ダウンロード用の圧縮ファイルは環境に応じて選択できるよう「.sit」「.lzh」「.zip」の三つを用意している。そしてこれにはダウンロードカウンターがセットしてある。ところが不思議なことに、どのタイプも比較的まんべんなくカウントが上がっていたのだ。

　先日も新しいスクリプトを公開したが、これもいきなりダウンロードカウンターが3件増えた。しかしアクセス解析を見ると、通常なら必ず通るはずの上部階層のページにアクセスの記録がなかった。公開直後で直リンクなど考えられないので、それを見てやっと気がついた。もしかしてこれは、検索ロボットの仕業ではないのか、と。

　いわゆるカウンターは、アクセスカウンターとダウンロードカウンターに大別されると思う。
　アクセスカウンターは、Webページへのアクセス数をカウントするものだ。Webページにアクセスがあると、そこに仕込まれたカウンター用のスクリプトが起動して累計カウント数を表示する。ブラウザに表示する際に自動アクセスする（ブラウザ等の設定にもよるが）、たとえばSSIとかJavaScriptとかイメージファイルなどにスクリプトへのリンクを仕込んでおくと、アクセスによってスクリプトが自動起動する、という仕掛けだ。
　ダウンロードカウンターは、リンクファイルのダウンロード数をカウントするもの。クリックによってカウントされるので、クリックカウンターとも言える。リンクは通常、リンク先ページへのパスやURLをリンクタグで指定するが、その代わりにカウンタースクリプトにリンクし、リンク先ページはそのスクリプトにセットする。これにより、クリックされるとスクリプトが起動して、カウントを記録した上でリンクページにジャンプする、という仕組みになっている。

　さて、検索ロボットはブラウザではない。HTMLファイルのテキストデータを収集しているのだと思う。したがって検索ロボットがアクセスしても、アクセスカウンターは起動しない。同様の仕掛けになっているアクセス解析なら、これも起動しない。
　また検索ロボットは、いくつかの階層のリンクをたどるのだという。テキストファイルにリンクタグがあると、そこにセットされたパスやURLを読み込んでその先にアクセスするらしい。ということは、リンク先にダウンロードカウンターがあると、これは起動することになる。
　おそらくこれが、上部階層ページにアクセスの跡を残さずに圧縮ファイルを三つともダウンロードしていた理由だろうと思う。

　そこでネットでいろいろ調べ、ダウンロードリンクをセットしてあるページに、次のようなMETAタグを仕込んでみた。

　<META NAME="robots" CONTENT="index,nofollow">

　これは「このページを検索データに加えるのはいいけれども、リンク先はダメだよ」というロボットへのメッセージだ。
　しばらく様子を見ているところだが、これ以後ダウンロードカウントがパタリと止まった。はは、はははは……。

（記：2007/01/11）

［］［ときど記］