2003-05-17(土) [長年日記]
■ bsfilter
なんだか早起きしてしまったので、前からトライしてみようと思っていたベイジアン・フィルタ(Bayesian Filter、参考)を試してみることにした。使うのは日本語への対応にもトライしているbsfilterにした。
数日前からコレをやるつもりでspamを溜めておいたんだけど、元のメールサーバである程度フィルタしてしまっているせいで、やっと200通というところ。こんな数でいいのか知らん? まぁいいか。
まずはspam用のDBを作成。
% bsfilter -s ~/Maildir/_may_be_spam_/cur/*
続いて、openなせいでspamダダ漏れの某MLと、INBOXに溜めてあるcleanなメールのDBを作成。その他のメールを対象にしないのは、spamが混入しないMLのメールなので、bsfilterをかます前に振り分け済みだからだ。
% bsfilter -c ~/Maildir/cur/* ~/Maildir/.Software/ruby-www-admin/cur/*
#どこが「某」だか。
あとはこれらを元に確率を求める。
% bsfilter -u
これでデータベースが完成。~/.procmailに仕込む。まだDBの自動更新をさせるのは怖いので、-aは付けない。
:0 HB: * ? bsfilter $MAILDIR/._may_be_spam_/
さて、うまくいくかな……?
■ 第二tDiary.Net βテスト募集(3)
ホントに来ないよ(笑)。まいったなー。みんな夜間の重さには辟易してるはずだから、殺到するに違いないと思っていろいろ厳しくしたんだけど、やっぱり過剰だったか。おまけに土曜だし。マーケティングは難しい……。
というわけで、「βテスターとして期待する人」はばっさり消しました。あんまり気にせず、ガンガン応募してくらはい。
-s, -cは、ファイルもしくはディレクトリを1個しか取れないので、cur/*が複数ファイルにマッチするのであれば、xargsで回すなどして下さい。
ぎゃ、そうだったんですか。修正しておきます。
どうもDBが小さいと思ったんだよなー
笑たあるよ>脅し
それはそうと、高木さんの日記なんか、かなり条件満たすと思うのだが
# 安定してないと思ってる ?
この例の通りに動く仕様に変更しようか迷ってます。
tdiary が FreeBSD の ports に入るかも?
http://home.jp.freebsd.org/cgi-bin/showmail/ports-jp/13727
ふふ、すでにtDiary.orgからもdownload可能です。
お。とりあえずつっこみ入れときました。
第二tDiary.Net βテストに興味はあれど、第一のユーザでないため、応募できないという罠。ですた。