トップ «前日 最新 翌日» 編集
RSS feed

ただのにっき


2007-02-18(日) [長年日記]

百度(Baidu)のbotを受け入れてみる

Baiduのbotである「Baiduspider」が、少しおとなしくなったらしい(via SEMサーチ)。

なにを契機にやったのか忘れたが、いままではBaiduspiderを拒絶していた。そういうことなら受け入れてみてもいいか、ということでいったん制限を解除。もっとも、まだ問題があるようならまた拒否するけど。それ以前に、EUC-JPな日本語ばかりのサイトがBaiduにとって意味があるのかわからんが。

それにしても、ツッコミどころの多いリリースだなぁ。

今後はこの問題について会社全体が真摯に受け止め、日本のインターネット業界におけるルールに従い、このようなことが二度とないように努めていく所存でございます。

「日本の」インターネット業界にローカルルールがあったんだ? 苦情を言ってきたのは日本だけってこと?

各サイトの規模とIP負荷に対し、それぞれ対応できるクローラー対策を設定し、中小のサイトに対し、クローラー頻度は20秒/回以内にコントロールしています。

IP負荷ってなんだ? レスポンスかなんかのことか?

絨毯爆撃型のbotにありがちな実装として、ホスト名が異なる場合にはIPアドレスが同一でも別サイトと見なして、同時に無数のアクセスをしてくるというのがあるが、それを同一視してくれるようになるんだろうか。ウチみたいに同一サーバでたくさんの仮想的なホストを見せているサービスだと、そうしてくれないとたまらんのだが。

Tags: bot baidu

メールとXMLRPCのゲイトウェイサービス

tDiary-users掲示板の投稿で知ったんだが、メールとXMLRPCのゲイトウェイを提供するubicast Mail Bloggerなんてサービスがあるんだ。ぜんぜん知らんかった。

tDiaryのXMLRPCプラグインは、つい最近まで最新版に追従していなくて動かなかったんだけど、やっと今年になってから追従した(らしい)ので、使えるようになっているはず。設置環境の制約でposttdiary.rbを使えなかった人にはいいかも。ちゃんと動けば、だけど(←なにしろXMLRPCプラグインを使ったことがない)。


トップ «前日 最新 翌日» 編集
RSS feed