ただのにっき
2003-05-17(土) [長年日記]
■ bsfilter
なんだか早起きしてしまったので、前からトライしてみようと思っていたベイジアン・フィルタ(Bayesian Filter、参考)を試してみることにした。使うのは日本語への対応にもトライしているbsfilterにした。
数日前からコレをやるつもりでspamを溜めておいたんだけど、元のメールサーバである程度フィルタしてしまっているせいで、やっと200通というところ。こんな数でいいのか知らん? まぁいいか。
まずはspam用のDBを作成。
% bsfilter -s ~/Maildir/_may_be_spam_/cur/*
続いて、openなせいでspamダダ漏れの某MLと、INBOXに溜めてあるcleanなメールのDBを作成。その他のメールを対象にしないのは、spamが混入しないMLのメールなので、bsfilterをかます前に振り分け済みだからだ。
% bsfilter -c ~/Maildir/cur/* ~/Maildir/.Software/ruby-www-admin/cur/*
#どこが「某」だか。
あとはこれらを元に確率を求める。
% bsfilter -u
これでデータベースが完成。~/.procmailに仕込む。まだDBの自動更新をさせるのは怖いので、-aは付けない。
:0 HB: * ? bsfilter $MAILDIR/._may_be_spam_/
さて、うまくいくかな……?
■ 第二tDiary.Net βテスト募集(3)
ホントに来ないよ(笑)。まいったなー。みんな夜間の重さには辟易してるはずだから、殺到するに違いないと思っていろいろ厳しくしたんだけど、やっぱり過剰だったか。おまけに土曜だし。マーケティングは難しい……。
というわけで、「βテスターとして期待する人」はばっさり消しました。あんまり気にせず、ガンガン応募してくらはい。