2006-03-18

SpamSieveの調教

家族用のメールアドレスにもかなりのSPAMが届くようになってきた。 あまりにひどいので、今月月初もう一台のiBookにもSpamSieveを購入して導入することに。その際、今までわたしのIBookで鍛えたSpamSieveの情報を移植をすれば、最初からかなりの効率でSPAMを仕分けることができるはずだと早速行動に移した。
そして、失敗した……

いままでのデータを誤って消失させてしまったのだ。
で、致し方なく今月から新たにSpamSieveの教育を始めていた。約500通のメッセージを受け取って、うち約3割がSPAMであった。見逃しが何件かあったが、まったく素の状態からはじめたのになかなかの率でSPAMをとらえてくれる。

さて、今回と最初から調教を始めようとした際、以前のSPAMメールがあればそれらである程度教育できるのに……なんて思った。折角なので同様にベイジアンフィルターを使った対SPAMソフトの調教用に、今回集まった約130通程度のSPAMをまとめて公開しておこうと思う。どうぞ、お使いください。

公開:Spam_Correction.mbox.sitx公開は中止しました。

  • このファイルに含まれているメールには、有害サイトへのリンクが含まれている可能性があります。このファイルによる損害について当方ではいっさいの責任を負いませんので、自己責任にてダウンロードし使用ください。
  • 当方のプライバシーにかかわるヘッダーや本文は削除しています。

今月のSpamSieveの実績統計

選別されたメール
正常なメッセージ: 313 通
スパムメッセージ: 133 通 (30%)
スパムメッセージ/日: 7 通

SpamSieve の精度
誤検出: 0 通
見逃し: 14 通
96.9% の正確さ

コーパス
正常なメッセージ: 184 通
スパムメッセージ: 129 通 (41%)
単語総数: 13074 個

ルール
ブロックリストルール: 57 件
ホワイトリストルール: 118 件

統計開始日時
06/03/01 12:00

0 件のコメント:

コメントを投稿