非まじめ旅行社 | 孤独 | グルメ | 結婚 | ソフト | 笑い | 芸能 | 美容・健康 | バカ企画 | その他 | 文例集 | 時候の挨拶 | 離婚 |


テグレット技術開発では各社員のアドレス宛に平均1日200件前後の迷惑メールが届きます。(株)テグレット技術開発は、実はソフト開発会社(笑)なので、開発陣の首を絞めながら「何とかせんかい!」頭を優しくなでながら「開発してください」と優しくお願いしたところ、構想10年開発1ヶ月でオーダーメードの迷惑メール対策のソフトが完成しました。

近日リリース予定!


今までの迷惑メール対策の問題点
通常の迷惑メールフィルターでは、「迷惑メールと判定されたもの」「そうでないもの」の二つの振り分けしか出来ません。

もちろんその判定基準の変更は出来ますが、「判定を厳しくする」と迷惑メールでないものまで迷惑メールに判定される可能性が上がります。これは特にビジネスで大切なメールを見落とす危険性があがるというデメリットがあります。

例えば、「エッチ」という言葉が迷惑メールでは多用されています。会社のアドレス宛に来たメールは過去4年間分をほとんど取っているのですが、「エッチ」を含むメールは1件のみです。内容も友人からきたくだけたものです。「エッチ」を含むメールの99.99...%は迷惑メールですが、「もしかしたら将来的にエッチアイエスからビジネスのメールが来るかもしれない」という0.001%の危険を考えれば「エッチ」を含むというだけで迷惑メールに振分けることはできません。

逆に「判定を甘くする」と迷惑メールが振り分けられずに受信フォルダに入ってしまう可能性が上がり、迷惑メールとそうでないメールの振り分けに時間がかかる結果になります。これでは、フィルタの効果が台無しです。

どちらをとっても「帯に短したすきに長し」で難しい選択です。せっかく迷惑メールを判定する機能があっても、これでは宝の持ち腐れです。そこで3日寝ずに考えました。そして思いついたのが

迷惑メールを高・中・低とランク分けで別フォルダに振り分ける

例えばメールが50件来て迷惑メールが48件、本来のメールが2件あったとき、従来の方法(判定を厳しく・判定を甘くのみ)とランクわけでは下表のような振り分けになります。(注:振り分け数等はあくまでイメージ値で実際の値ではありません)
振り分け方法
迷惑メールフォルダに
振り分けられる数
受信フォルダに
振り分けられる数
備考
判定を厳しく
47
3
デメリット:受信フォルダに振り分けるべきものを迷惑メールフォルダに振り分けてしまう可能性がある。
メリット:しかし受信フォルダには迷惑メールが入らない
判定を甘く
30
20
デメリット:受信フォルダに迷惑メールが多数振り分けられる。
メリット:迷惑メールに必要なメールが振り分けられる可能性が減る
ランク別分け
高ランクに30
中ランクに17
低ランクに2
1
ランク別に分かれるので、注意を払う度合いを分けてチェックできる。必要なメールが迷惑メールに振り分けられる場合も、ほとんど低ランクのため、仕分けが容易。



NGワードをポイント制に
さて、振り分けと言うアイデアは出たのですが、どういう方法でランク付けをするかを考えなくてはなりません。

研究の結果、本文に使われている言葉を利用して振り分けるのが一番現実的だという結論の達しました。
一番振り分けのポイントになるのは、「普通使われていない言葉(NGワード)を使っているかどうか」です。しかし、そういう言葉が使われているかどうかだけで迷惑メールを振り分ける事は出来ません。例えば「sex」という単語を含むメールがあったとします。「sex」だけなら性別という意味もあり、パスポートなどにも当り前のごとく使われています。しかし、アダルトな内容のメールにも頻繁に「sex」が使われています。従って「sex」が含まれるメールを全て排除するのも問題ですし、全く排除しないのも問題です。

そこでNGワードをポイント制にして、メールの迷惑度をランク付けする方法を考えました。具体的には各単語にNGポイントを設定し、その合計ポイントに応じて処理するかどうかを決定するという方法です。

例えばsexに1ポイント、fuckに5ポイントという点数をつけておいて、本文中で使われている数を合計ポイントとして段階分けをします。つまりあるメールのなかで、sex、fuckという単語があった場合は、
 NGワードポイント
sex
1
fuck
5
 合 計 
 6 

という具合に6ポイントとして処理を行います。
合計ポイントを元に
迷惑メール(高) 10ポイント以上
迷惑メール(中) 5〜9ポイント
迷惑メール(低) 3〜4ポイント
と言う具合にフォルダに振り分けます。
(※点数等のルールは実際のものとは違います)

また、日本製の迷惑メールの多くは、特定のURLにアクセスさせる事を目的としています。そこで特定のURLもNGワードとしてポイントをつけることで、かなり効率的に迷惑メールの排除を行う事が可能です。

迷惑メールの中には英語のものも多数あります。研究してみると、英語のメールはOUTLOOK EXPRESSのメール振分けをされないようにかなりの工夫がなされています。
例えば、viagra(バイアグラ)をわざとviaagraなどとスペルミスをして、振り分けられないようにするものもあります。この場合でも変なスペルミスの単語は高めのNGポイントをつけておけば、迷惑メール(高)に振り分けられるようになります。


ふざけた友人?偽装
メールソフトには「このアドレスから来たメールは迷惑メールに判定しない」という機能(ソフトによってはセーフリスト等と呼ばれています)があります。しかしこの機能、設定が面倒です。
そこで対策を考えました。社内で調査したところ、ほとんど例外なく自分が送信した事のある相手は、セーフリストに入れてもかまわないという結果が出たので、送信したことのある相手からのメールは全て「安全リスト」に自動登録しようと考えましたしました。

しかし、ここで問題が発生。迷惑メールの中には送信元アドレスを偽装した迷惑メールがあります。また自分のアドレスをアドレス帳に入れているような知人がウイルスに感染した場合、その知人のアドレスからメールが届くこともあります。
これだけなら、「本文の内容をチェックして振り分ければいい」という結果になるのですが、中には

ふざけてNGワードになるような言葉を入れてメールを送ってくる

という、迷惑なのか楽しいのかよくわからない友人もいます。

そこで安全リストに入っているアドレスから送信されてきたメールは、どんなにNGワードがちりばめられていても「迷惑メール(低)」に振り分けるようにしました。これで知人から来たメールのチェックが容易になります。たとえ仲のいい友人が冗談で送ってきた、NGワード満載のメールも
・送信元アドレスを偽装した迷惑メール

従いまして、この場合は

迷惑メール(低)

に振り分けられるようになっています。

またチェーンメール(※)のように、送信した友人自身がいたずらの輪の中に組込まれている、自分が迷惑メールを送信していることに気づいてないという場合もあります。
※チェーンメールとは
「富○通の主任プログラマー鈴木さんがウイルスを発見しました。このウイルスは非常に強力です。48時間以内にあなたの全ての友人にこの警告メールを転送してください」といった内容のもの。転送に転送が重なっているので、メールの下の方は > がたくさん付いていることがあります。

チェーンメールの例
鉄腕DASHのチェーンメールが一時はやりました。
「鉄腕DASHです! このメールを9人以上の友達に送って下さい。沖縄から始めました。何日間で北海道に届くか実験中! ○○(TOKIOのメンバーの名前)のチームです。これは本物です。署名をして、この文章を次の友達に!」

犯人探しメール:「○月○日、××で女子大生殺人事件が発生しました。犯人を捜査中です。心当たりの方は△△警察にすぐ連絡してください。このメールは国の公的機関が監視しています。○時間以内メールの転送をしなかった人は容疑者として扱われ、自宅に警察が急行します」などといった文面です。



URL(ドメイン)による選別
迷惑メールの中に頻繁に出てくるURL(ドメイン)を利用して判別します。
危険ドメインを含むメールを発見した場合、NGワードを含まないメールでも迷惑メールに振り分けられます。

ドメインの取得には年に約1万円(すごく安いので6000円位)がかかります。そのため、迷惑メール業者も無制限にドメインを取得できるわけではなく、確認した限りでは約300程度のドメイン数しかありませんでした。これらを迷惑メールに振り分けることで、特に国内産の迷惑メールはかなり振り分けられるようになりました。


戻る