トップ «前日 最新 翌日» 編集
RSS feed

ただのにっき


2002-07-19(金) [長年日記]

Yahoo!: 今日のオススメ

昨日、Yahoo!のサーファーチームから、「明日(今日)の今日のオススメこま犬ライブラリを掲載するのでよろしく」というメールが来た。そんなページがあったことすら知らなかったんだけど(笑)、せっかく紹介してくれるならということで夕べのうちに1匹新しいのを追加しておいた。ついでに普段は隠している「本日のリンク元」を表示して(tDiaryで運用しているのである)、どれくらい来るものか見てみたら、昼現在で500アクセスを越えている。Yahoo!的には、多いのか少ないのか、よくわからんな。

それにしてもこのメール、「掲載させてください」(依頼)でも「掲載したいのですがよろしいですか」(質問)でもなく、「掲載させていただきます」(断言)である。なんだかんだ言っても先駆者Yahoo!、Webの基本原理がよくわかっている。へんに丁寧でやたらと長文の掲載依頼メールは多いけど、そういうのって読むのも返事するのも面倒で、むしろ悪印象を持ってしまう。Yahoo!のメールは必要最小限で気持ちがいい。送ってくるタイミングも掲載日を忘れてしまうほど前でもなく、かといって事後承諾でもない、ちょうど1日前というのも、受入準備(笑)をするには充分という点で絶妙。

もちろんYahoo!のことだから、「載せてやるからありがたく思え」的な態度がこうしているという見方もできるわけだけど(笑)、こういうことは良い方向に取る方がよろしい。少なくとも、Webのなんたるかがわかってない連中が検索エンジンを訴えたり裁いたりしているのに比べたら、何倍もマシであろう。

関連する日記: 2004-05-18(火)

はてなアンテナ

余計なトラフィックかというと、微妙なところで。昨日のアクセスログでtDiary.Net全体に対するアクセス元で、はてなのロボットは第3位、約2500回。1分に1、2回なので、負担になるほどではない。現時点では。

もっとひどい1、2位のアクセスなんて、WWWCで一日中休みなしに全日記を巡回しまくるような連中で、1日に3〜5000回もアクセスしてくる。こういうのは「読みもしないのに巡回すんなボケっ」とばかりに見つけ次第アクセス禁止にしてしまうのだが(笑)。ホント、これから暑くなるんだから勘弁して欲しいよ。WWWCって、LIRSでリモート情報取ったりしてくんないの?

それに比べてはてなアンテナは大勢でそのデータを共有しているはずなので、よっぽど地球に優しいと言えるんじゃなかろうか。それはともかく、はてなロボット対策として、googlebotと同様に、本日のリンク元は返さないように仕込んでみた。これで詳細モードにしても、本文とツッコミ以外は現れないようになるはずである。

はてなアンテナ(2)

はてながデータ共有してるか。毎分1、2回っつーのはtDiary.Net全体での話で、各日記ごとに集計すると1時間に1、2回くらい。極端に多い日記もないので、はてなアンテナは全ユーザを代表してロボットと回していると考えて間違いない。まぁ、そうでなければ、あそこの技術者はマヌケ杉じゃん(笑)。だから安心して利用していいんじゃないかな。

WWWC

読んでるって言われてもなぁ。24時間休みなく、30近い数の日記の更新時刻を10分おきに取り続け、1日通算4000アクセス。そのうちWWWC以外からのアクセスはたった400回で、夕方から深夜の間だけ……こんなアクセスログを残しておいてそれはないと思うんだけど(これがhirokiさんかどうかは別にして)。細い回線なのはわかるけど、その回線の向こう側にあるのはたくさんの人と共有している人様の資源(CPU、メモリ、ディスク、回線……)だということを忘れたらいかんのとちゃいますか。読みもしない時間帯までWWWCに巡回させとく必要はないでしょう?

ともあれ、昨日の「WWWC 4000回」はDoSアタックと認識したのでアクセス禁止にしただけ。クラッカー相手にわざわざことわる義務はない。なにしろtDiaryはHEADリクエストだってそれなりにリソースを食うので、この季節、CPUの発熱で本当にダウンしかねない(笑)。ちなみにこういう措置をするのは1日あたり2000回を越えるアクセスをしてくる場合なので、それ以下にするというなら解除しなくもないです。

つーか、WWWCみたいなひとりよがりなツールじゃなくて、リモート情報を融通しあえる環境に優しいアンテナを使って欲しいと個人的には思う。tDiary.NetはLIRSファイルも配布してるんだし。

本日のツッコミ(全12件) [ツッコミを入れる]
Nyan2 (2002-07-19(金) 15:35)

>はてなアンテナは大勢でそのデータを共有している
……してるのかなぁ(^^;
他のアンテナの登録内容をインポートすることはできるけど、内容まで同期しているかは分かりません。
にしても、1分に1、2回ですか。うへぇ。巡回頻度を指定できないと思ったら、そんなに速い速度で回してたんだなぁ……。
個人的には、4〜6時間に1回程度でいいと思うんだけど。

hiroki (2002-07-19(金) 17:39)

WWWCを使っててアクセス禁止にされた者ですが、いきなりアクセス禁止にするのはどうかと。
どこかに注意書きがあったりするのならまだしも。
(一応tDiary Netのページは全部読んでいるつもりですが、もし書いてあったならすいません)
>読みもしないのに巡回すんなボケっ
読んでるから巡回してるのですが。わざわざ細い回線を読みもしないページの巡回に使いたくはないので。
串さすの嫌いなんで何らかの対処をして欲しいものです。
こちらもある程度はそちらの条件通りにしますので。

yada (2002-07-19(金) 18:13)

わしも自分のサイトでうざいWWWCを見付けると、それなりに細工しますが

かずあき (2002-07-19(金) 18:52)

WWWCで巡回すること自体が問題なのではなく、巡回頻度が多すぎることが問題なのではないでしょうか?
でもtDiary.Netの場合は一度の巡回で同一サーバに複数(巡回している日記の数)のリクエストを送ることになってしまう場合もありますねぇ・・・。

hiroki (2002-07-19(金) 18:57)

私の場合30弱の日記(ほとんど知ってる方)の日記をチェックしているので
その分負荷をかけているとは思います。
うちの回線だとtDiaryNetのTOPにあるアンテナを見に行くより、
WWWCで巡回した方が楽に巡回ができるもので。

ishinao (2002-07-19(金) 19:59)

こういう話題が出ているときになんなんですが、私も今http://ishinao.mine.nu/blogmap/関連でサーバーに負荷をかけてしまっています。すみません。
今調整&テスト中なんでアクセス頻度が多くなっていますが、もうちょっと安定したらアクセス頻度を減らします。最終的には(textmaniaでもらっている)LIRSの情報と連動させて、アクセスを最低限にしますので。

hiroki (2002-07-19(金) 21:08)

素直にアクセスが増えた事は謝ります、すみません。
最初は片手で数えられる位だったのが、最近増えていき登録し続けた結果こうなってしまいました。
ご迷惑をおかけいたしました。

ただただし (2002-07-19(金) 23:52)

アクセス可能に戻しておきましたよ

woods (2002-07-20(土) 02:01)

ああ、そうそう、そのLIRSですけど、tDiary.netの外の日記でも最終取得時間が同じになるのはなにげにちょっと困ってるんですけどぉ。(とかついでなのでいっておきます)

アビー (2002-07-20(土) 02:10)

僕の会社の人がこま犬を知らんとのたまったのでしばいときました(笑)

ishinao (2002-07-20(土) 11:33)

HEADの代わりにLIRSの情報から更新時刻を取得するように変更し、最低限のGETリクエストしか送らないように変更しました。ご迷惑おかけしました。

くわ (2002-07-20(土) 21:01)

tDiaryとかを巡回対象にする場合、「同じサーバ相手のリクエストをすべてまとめて一度に送り、すべての応答を一度に貰うHTTP/1.1の仕組み(パイプラインリクエスト)を積極活用している」というWWWDだと随分違うんですかね。自分はコレ使ってますが。


トップ «前日 最新 翌日» 編集
RSS feed