トップ «前日 最新 翌日» 編集
RSS feed

ただのにっき


2003-05-17(土) [長年日記]

bsfilter

なんだか早起きしてしまったので、前からトライしてみようと思っていたベイジアン・フィルタ(Bayesian Filter、参考)を試してみることにした。使うのは日本語への対応にもトライしているbsfilterにした。

数日前からコレをやるつもりでspamを溜めておいたんだけど、元のメールサーバである程度フィルタしてしまっているせいで、やっと200通というところ。こんな数でいいのか知らん? まぁいいか。

まずはspam用のDBを作成。

% bsfilter -s ~/Maildir/_may_be_spam_/cur/*

続いて、openなせいでspamダダ漏れの某MLと、INBOXに溜めてあるcleanなメールのDBを作成。その他のメールを対象にしないのは、spamが混入しないMLのメールなので、bsfilterをかます前に振り分け済みだからだ。

% bsfilter -c ~/Maildir/cur/* ~/Maildir/.Software/ruby-www-admin/cur/*

#どこが「某」だか。

あとはこれらを元に確率を求める。

% bsfilter -u

これでデータベースが完成。~/.procmailに仕込む。まだDBの自動更新をさせるのは怖いので、-aは付けない。

:0 HB:
* ? bsfilter
$MAILDIR/._may_be_spam_/

さて、うまくいくかな……?

第二tDiary.Net βテスト募集(2)

案内ページで脅し過ぎたのか、まだ1通も応募がない(笑)。

第二tDiary.Net βテスト募集(3)

ホントに来ないよ(笑)。まいったなー。みんな夜間の重さには辟易してるはずだから、殺到するに違いないと思っていろいろ厳しくしたんだけど、やっぱり過剰だったか。おまけに土曜だし。マーケティングは難しい……。

というわけで、「βテスターとして期待する人」はばっさり消しました。あんまり気にせず、ガンガン応募してくらはい。

本日のツッコミ(全8件) [ツッコミを入れる]
nabeken%tDiary.Netユーザ (2003-05-17(土) 18:54)

-s, -cは、ファイルもしくはディレクトリを1個しか取れないので、cur/*が複数ファイルにマッチするのであれば、xargsで回すなどして下さい。

ただただし (2003-05-17(土) 20:37)

ぎゃ、そうだったんですか。修正しておきます。
どうもDBが小さいと思ったんだよなー

たむら (2003-05-17(土) 22:09)

笑たあるよ>脅し
それはそうと、高木さんの日記なんか、かなり条件満たすと思うのだが
# 安定してないと思ってる ?

nabeken (2003-05-18(日) 01:52)

この例の通りに動く仕様に変更しようか迷ってます。

kjana (2003-05-18(日) 12:49)

tdiary が FreeBSD の ports に入るかも?
http://home.jp.freebsd.org/cgi-bin/showmail/ports-jp/13727

ただただし (2003-05-18(日) 15:14)

ふふ、すでにtDiary.orgからもdownload可能です。

yoichi (2003-05-18(日) 15:43)

お。とりあえずつっこみ入れときました。

はじめ (2003-05-18(日) 16:26)

第二tDiary.Net βテストに興味はあれど、第一のユーザでないため、応募できないという罠。ですた。


トップ «前日 最新 翌日» 編集
RSS feed