ニュース

ディープラーニングで“Gmail”の悪意のあるドキュメント検出を改善 ~Googleが発表

既存のスキャナーと組み合わせつつ、今後も人工知能の活用を拡大

公式ブログ“Google Online Security Blog”

 米Googleが無償提供するメールサービス“Gmail”は機械学習ベースの保護システムを搭載しており、有害なコンテンツの実に99%を受信トレイに届く前にブロックしている。その保護技術の柱となっているのが、毎週3,000億以上の添付ファイルを調べるというマルウェアスキャナーだ。同社は2月25日(現地時間、以下同)、公式ブログ“Google Online Security Blog”で、マルウェアスキャナーに最近導入された改善の詳細を明らかにした。24日から米国で開催中の“RSA Conference”でも発表されている。

 前述の通り、“Gmail”のマルウェアスキャナーは日々膨大な数の添付ファイルを扱い、悪意あるものを排除しているが、そのの63%はその日によって異なるものだという。脅威は絶えず進化しているというわけだ。同社はこうした未知の脅威に対抗するため、2019年末に機械学習ライブラリ「TensorFlow」を活用した新しいスキャナーの運用を開始した。

 この新しいスキャナーは「TFX(TensorFlow Extended)」でトレーニングされた個別の「TensorFlow」ディープラーニングモデルと、ファイルの種類ごとにカスタムされたドキュメントアナライザーから成る。ドキュメントアナライザーはドキュメントの解析や一般的な攻撃パターンの特定、マクロの抽出、コンテンツの難読化解除および機能の抽出を担当する。

 同社によると、新しいスキャナーは日々検出される悪意あるオフィス文書のカバレッジを10%拡大させることに成功。敵対的な攻撃が集中するケースではとくに有効で、検出率の向上は150%に達するという。

既存のスキャナーと機械学習ベースのスキャナーを組み合わせて、検出精度を向上

 “Gmail”ユーザーをターゲットにしたマルウェアの58%は「Microsoft Office」のオフィス文書が占める。同社はこのスキャナーの強化に注力しているが、現在はオフィス文書のスキャンにのみこの新しいスキャナーを利用しているとのこと。同社は今後も既存のスキャナーも併用した多層防御アプローチによりマルウェアの検出率向上に努め、攻撃に先んじてユーザーの受信トレイを保護するために人工知能の利用を積極的に拡大していくとしている。

“Gmail”ユーザーをターゲットにしたマルウェアの58%は「Microsoft Office」のオフィス文書が占める