2004年11月24日

「index.rdfのアクセスログ大爆発の兆し」MT導入と改造

なんか、5分ないし10分に一度index.rdfを読み込んでくるところが 2~3日前から目立ちはじめた。1日に少なくとも200はアクセスしてくる。

自分の書いたものを読んでくれる人がいるというのは、 なんとなく気恥しい面もありはするが、 それなりに気合いが入ろうというものでもある。 そういう意味で、悪意があるのでない限りは、 アクセスがあるのは大歓迎である。

だけど5分に一回おなじファイルをダウンロードするというのはちょっとやりすぎではないか。 2~3日で一挙にアクセスランキング上位におどりでてしまった。 うちのindex.rdfはそんなに頻繁にみても内容は変わっていない。 そもそもHTTPのGETで見にくる前にHEADをとるなどやっても よさそうなのだが、それもやっていない。 このようなアクセスは、無駄に帯域を消費しているように感じる。

USER_AGENTをみてみたらMagpieRSSというやつだ。 インターネットで検索してみたらオープンソースのRSSリーダーらしい。 ブログ集約サイトなどから更新データを引っ張ってくることを前提にしているのだろう。 ならばなおさら帯域には気を払うべきだと思うが、 ツールが悪いのではなく使い方がタコなんだろうと思っている。 中身はみてないけど、オープンソースのRSSリーダーともあろうものが、 5分に1回無条件にrdfをダウンロードするなどという、 そんなタコな仕様でつくられているはずはないと信じたい。

一瞬、いっそのことIPでみきわめて、 そのホストからのアクセスをはねてやろうとも思ったが、 とりあえずはそこまでするのは止めた。 ファイルの性質上アクセス制御しなくてはならないもの以外は、 できるかぎり差別なくアクセス可能なものでありたいと思っている。 そういうわけでindex.rdfはアクセスログの候補から外した。 データベースのほうも該当するレコードは削除した。 こういうときファイルベースではなくDBMSだと楽だ。 早くも、データベースを移行したメリットがでた。

この記事のトラックバック用 Ping URL: http://www.mediaware.jp/blog/mt-tb.cgi/92
「index.rdfのアクセスログ大爆発の兆し」へのコメント  コメントを書く
「index.rdfのアクセスログ大爆発の兆し」へのトラックバック
コメントを書き込む









メールアドレスを記憶する?


この記事の評価
悪い あんまり 普通 まあまあ 良い





@@@@