2003-05-19(月) [長年日記]
■ bsfilter(3)
職場のメールサーバにも仕込んだ。
どうも、フィルタを擦り抜けてしまうspamの方が多いので(サンプルが200通余りでは少ないのだろう)、そっちの強化を楽できるように、こんなスクリプトを用意した(bsupdate)。
#!/bin/sh for spam in $HOME/Maildir/._spam_/cur/*,; do if [ -f ${spam} ]; then echo ${spam} bsfilter -s ${spam} mv $spam ${spam}S fi done bsfilter -u
Maildir専用。検出されなかったspamは_spam_フォルダに移動して未読状態にしておけば、このスクリプトが走るたびにDBに追加され、既読になる。これをcronで回せばかなり自動的に賢くなってくれる……と思うが、まだしばらくは更新は手動。bsfilterがちゃんと動くたびに「good job!」とか言いたいので(笑)。
2003-05-18(日) [長年日記]
■ bsfilter(2)
-sと-cで複数ファイルを扱えるようになったもよう。そうそう、今どきのメールボックスはMaildir。となると、1通1ファイルなのは普通ですからな!(根拠なし) というか、-sや-cはオプションという扱いだったのか……。
さて、正しくDBを作り直してからの成績は、通過してしまったspamは5件(ぬぬっ)、spam扱いしてしまった普通のメールは1件(ブブー)。clean.dbはもうちょっと鍛える必要があるな。
しかしあれだね、ベイジアン・フィルタを導入するとみんなspamが来るのが楽しみになると言っているけど、ホントだなぁ。これは新しいレジャーだね。
■ Klipper
デスクトップ環境をKDEに変えた時、デフォルトで入っていた「クリップボードツール」ことKlipperは邪魔で外していたんだけど、使い道を見つけたので復活。
うちのアンテナは、更新時刻を「YYYY-MM-DD HH:MM」の形式で表示しているので、これを選択して以前作ったwopenに引き渡すようにすればいい。今まではこの過程を手作業で行っていたのだ。
というわけで、Klipperの設定ダイアログ、動作タブで
^\d\d\d\d-\d\d-\d\d \d\d:\d\d$
という動作を作成し、そのコマンドに
Eterm -r wopen '%s'
を指定する。これだけで、開きたいサイトの更新時刻を選択すればウィンドウがポップアップしてwopenの実行が選べるようになる。うーん、なかなか便利になったぞ。
2003-05-17(土) [長年日記]
■ bsfilter
なんだか早起きしてしまったので、前からトライしてみようと思っていたベイジアン・フィルタ(Bayesian Filter、参考)を試してみることにした。使うのは日本語への対応にもトライしているbsfilterにした。
数日前からコレをやるつもりでspamを溜めておいたんだけど、元のメールサーバである程度フィルタしてしまっているせいで、やっと200通というところ。こんな数でいいのか知らん? まぁいいか。
まずはspam用のDBを作成。
% bsfilter -s ~/Maildir/_may_be_spam_/cur/*
続いて、openなせいでspamダダ漏れの某MLと、INBOXに溜めてあるcleanなメールのDBを作成。その他のメールを対象にしないのは、spamが混入しないMLのメールなので、bsfilterをかます前に振り分け済みだからだ。
% bsfilter -c ~/Maildir/cur/* ~/Maildir/.Software/ruby-www-admin/cur/*
#どこが「某」だか。
あとはこれらを元に確率を求める。
% bsfilter -u
これでデータベースが完成。~/.procmailに仕込む。まだDBの自動更新をさせるのは怖いので、-aは付けない。
:0 HB: * ? bsfilter $MAILDIR/._may_be_spam_/
さて、うまくいくかな……?
■ 第二tDiary.Net βテスト募集(3)
ホントに来ないよ(笑)。まいったなー。みんな夜間の重さには辟易してるはずだから、殺到するに違いないと思っていろいろ厳しくしたんだけど、やっぱり過剰だったか。おまけに土曜だし。マーケティングは難しい……。
というわけで、「βテスターとして期待する人」はばっさり消しました。あんまり気にせず、ガンガン応募してくらはい。
Before...
◆ たむら [笑たあるよ>脅し それはそうと、高木さんの日記なんか、かなり条件満たすと思うのだが # 安定してないと思ってる ?]
◆ nabeken [この例の通りに動く仕様に変更しようか迷ってます。]
◆ kjana [tdiary が FreeBSD の ports に入るかも? http://home.jp.freebsd.org..]
◆ ただただし [ふふ、すでにtDiary.orgからもdownload可能です。]
◆ yoichi [お。とりあえずつっこみ入れときました。]
◆ はじめ [第二tDiary.Net βテストに興味はあれど、第一のユーザでないため、応募できないという罠。ですた。]