トップ 最新

ただのにっき

2003-05-17(土) [長年日記]

bsfilter

なんだか早起きしてしまったので、前からトライしてみようと思っていたベイジアン・フィルタ(Bayesian Filter、参考)を試してみることにした。使うのは日本語への対応にもトライしているbsfilterにした。

数日前からコレをやるつもりでspamを溜めておいたんだけど、元のメールサーバである程度フィルタしてしまっているせいで、やっと200通というところ。こんな数でいいのか知らん? まぁいいか。

まずはspam用のDBを作成。

% bsfilter -s ~/Maildir/_may_be_spam_/cur/*

続いて、openなせいでspamダダ漏れの某MLと、INBOXに溜めてあるcleanなメールのDBを作成。その他のメールを対象にしないのは、spamが混入しないMLのメールなので、bsfilterをかます前に振り分け済みだからだ。

% bsfilter -c ~/Maildir/cur/* ~/Maildir/.Software/ruby-www-admin/cur/*

#どこが「某」だか。

あとはこれらを元に確率を求める。

% bsfilter -u

これでデータベースが完成。~/.procmailに仕込む。まだDBの自動更新をさせるのは怖いので、-aは付けない。

:0 HB:
* ? bsfilter
$MAILDIR/._may_be_spam_/

さて、うまくいくかな……?

第二tDiary.Net βテスト募集(2)

案内ページで脅し過ぎたのか、まだ1通も応募がない(笑)。

第二tDiary.Net βテスト募集(3)

ホントに来ないよ(笑)。まいったなー。みんな夜間の重さには辟易してるはずだから、殺到するに違いないと思っていろいろ厳しくしたんだけど、やっぱり過剰だったか。おまけに土曜だし。マーケティングは難しい……。

というわけで、「βテスターとして期待する人」はばっさり消しました。あんまり気にせず、ガンガン応募してくらはい。