ただのにっき
2007-02-18(日) [長年日記]
■ 百度(Baidu)のbotを受け入れてみる
Baiduのbotである「Baiduspider」が、少しおとなしくなったらしい(via SEMサーチ)。
なにを契機にやったのか忘れたが、いままではBaiduspiderを拒絶していた。そういうことなら受け入れてみてもいいか、ということでいったん制限を解除。もっとも、まだ問題があるようならまた拒否するけど。それ以前に、EUC-JPな日本語ばかりのサイトがBaiduにとって意味があるのかわからんが。
それにしても、ツッコミどころの多いリリースだなぁ。
今後はこの問題について会社全体が真摯に受け止め、日本のインターネット業界におけるルールに従い、このようなことが二度とないように努めていく所存でございます。
「日本の」インターネット業界にローカルルールがあったんだ? 苦情を言ってきたのは日本だけってこと?
各サイトの規模とIP負荷に対し、それぞれ対応できるクローラー対策を設定し、中小のサイトに対し、クローラー頻度は20秒/回以内にコントロールしています。
IP負荷ってなんだ? レスポンスかなんかのことか?
絨毯爆撃型のbotにありがちな実装として、ホスト名が異なる場合にはIPアドレスが同一でも別サイトと見なして、同時に無数のアクセスをしてくるというのがあるが、それを同一視してくれるようになるんだろうか。ウチみたいに同一サーバでたくさんの仮想的なホストを見せているサービスだと、そうしてくれないとたまらんのだが。
■ メールとXMLRPCのゲイトウェイサービス
tDiary-users掲示板の投稿で知ったんだが、メールとXMLRPCのゲイトウェイを提供するubicast Mail Bloggerなんてサービスがあるんだ。ぜんぜん知らんかった。
tDiaryのXMLRPCプラグインは、つい最近まで最新版に追従していなくて動かなかったんだけど、やっと今年になってから追従した(らしい)ので、使えるようになっているはず。設置環境の制約でposttdiary.rbを使えなかった人にはいいかも。ちゃんと動けば、だけど(←なにしろXMLRPCプラグインを使ったことがない)。