Thunderbird は受信するべきメイルとスパムとをかなりよく,みわけてくれる. しかし,うまく識別できないものも当然ある. 学会から定期的に送付されてくる HTML メイルのおおくがスパムとみなされてしまう. それをゴミの山からすくいだそうとしたとたんに,それよりずっとおおくのスパムを目にしなければならない はめにおちいった.
学会からくるメイルのうち,論文リスト以外はあまりよくみていない. そのため,これまではスパムのなかにいれたままになっていた. しかし,できればこれらはスパムに分類してほしくない.
そこで,それらをひろいだしてスパムのマークをはずしてみた. その結果,スパムの一部もそうはみなされなくなってしまった. つまり,ひとの目には学会からくるメイルと広告メイルとはくべつがつくが, Thunderbird にはくべつがつかない. とくに,学会メイルについているおとなしい図と,広告メイルについているケバケバしい絵とをくべつするような手段はくみこまれていないだろう. したがって,学習させても,なかなか効果があがらない.
学会からのメイルをテキストにかぎればこうはならないが,HTML メイルのほうが便利なこともたしかだ. しばらくは,ひろいだされたスパムをみて教師つき学習をさせて,それでもダメなら,またなにかかんがえなければならない.
キーワード: