ただのにっき
2001-11-27(火) 10787歩 [長年日記]
■ tDiaryは重いか?
夕べのs1.xrea.comはいつもに増して重く、なかなかFound攻撃を回避できなかった。最近はあまりなかったんだけどなぁ、と思っていたら、同じような感想が上がってたりして。さらにはこんな恐ろしい警告まで。
で、思ったんだけど、実はtDiaryってけっこう重い? まぁ、日記のわりにはけっこういろいろやってるし、no-cacheだから呼び出し回数も増えよう。主観的には重いCGIと言えなくもなさそうだ。でもふが日記みたいな非力なマシン(たしか子羊だったはず)でもストレスなく動いてるんだから、まともなレンタルサーバ上で迷惑になるほど重いなんて信じられぬ。まぁ、ちゃんと計測してみるべきだとは思うが。
そうは言っても、運用で軽くする工夫はできるだろう。今、自分でも「こりゃねーだろ」と思ってる効率の悪い実装は、「本日のリンク元」の変換部分。変換テーブルを毎回全部なめるので、リンク元が多い日記はそれだけ処理が多くなる。これを現状のまま軽くするには、まずリンク元除外をきちんと設定する。それも、参照の多いURLほど先の方に書くと良い。ここで絞っておくと、リンク元の変換で対象になるものが少なくなるので軽くなる。個人的にはアンテナのような常設のサイトは除外すべきではないかと思う。
さらに、無駄なリンク元変換を減らす。tDiary系サイトの正しい変換には3つの設定が必要だけど、これを日付をはぶいた1つだけにしてしまうのも効果が高いと思う。もちろん、本日のリンク元自体を非表示にするのが一番効果が高いけど、それをやりたい人はあまりいないだろうな(笑)。
最後に、最新表示の日数を減らす。10日になっているなら5日くらいにすれば、ずいぶん軽くなると思う。
でもさぁ、一番負荷をあげてくれてるのはもしかして、検索エンジンのロボットじゃねーの? ロボットが毎回、すべてのリンクをたどるとすると、すべての月、すべての日が呼び出されることになる。長く続けてる人の日記はそれだけ負荷がかかるってことになるぞ。metaタグでロボット除外できるようにすべきかも。
■ Suica
そんなことより(中略)新横浜の唯一のSuica対応改札だけ妙に列が長いんですよ。見てみるとSuicaユーザに混じって磁気カードな連中まで並んでるんですよ。もうね、アホかと。馬鹿かと(以下略)。おれが使うようになったらオシマイです。そろそろやめましょう >吉野家コピペ
でも楽しいな、タッチアンドゴー。
■ tDiaryは重いか?(2)
ロボット犯人説を検証するため、今年8月からのアクセスログを、User-Agentに着目して分析してみた。Mary日記をターゲットにしているアクセスだけを対象にした。
一番多いのはMozillaを名乗るブラウザ。これはまぁ、いたしかたない(?)というか、本来の日記読者。
次に多いのがLycos_Spyderで(Lycosのロボットと思われ)、3日に一度、全日記をなめまわす。ほぼ同一の時刻に連続500回。相手の負荷とか、何にも考えてない馬鹿ボット。逝ってよし。
次は名乗らないUAで、これはどうにもならんなぁ。
その次がTAMATEBAKO、WWWC、NATSUMIKANと、アンテナ/巡回系ソフトが並ぶ。うーん、あんまり頻繁に監視しちゃダメだにょー、Remote情報も使おうねー、ってことだな。これはアンテナ運営者に対応してもらうしかない。まぁ、アンテナは間隔をおいてアクセスするから、サーバの負荷を一気に上げることはないはずなので、大丈夫だろう。つーか、そんなにたくさんのアンテナから監視されてんのか、ここ(汗)。
以下はアクセス数の桁がひとつ減るので、そんなに影響はないか。というわけで、Lycosのボットを排除すればずいぶん負荷が下がるのではないか。xrea.comはバーチャルサーバで運用されてるから、robot.txtやrobots.txtで撃退できると思う。誰か試してみない?
しかしなんだ。UAに「ヽ(´ー`)ノ =@ Σ(´¬`)ハァハァ」とか「恋はいつもハリケーン」(?)とか「せがとってもたかい」(??)とか、他にも日記に書けないような怪しいもん設定してんじゃねーっ(笑)。笑っちまったじゃねーの。