Last modified 3 years ago
SpamAssassinの日本語対応について
本家SpamAssassin自体は、日本語に完全に対応していません。UTF8 対応にはなっていますが、その機能も有効にするかどうかを選択する形になっています。そのまま利用して一番弊害が生じるのが「ベイジアン」の機能です。「ベイジアン」では、単語を切り出して、その単語の使用頻度に応じて「スパム」か「ハム(スパムでない)」かを確率計算します。個々の単語の確率を統合して、メール全体としてのスパムらしさの確率を計算します。この「ベイジアン」に特化したパッチを提供しているのが、SpamAssassin日本語対応パッチです。 あくまで、本家オリジナルでルールを構築するのが良いだろうという考えの下に、本家オリジナル用のルールをメンテナンスしている場合もありますし、このサイトのように日本語パッチ用ルールをメンテナンスしている場合もあります。選択肢は、
- 本家オリジナル SpamAssassin
- 日本語パッチ版 SpamAssassin
の2つがあります。
