ニュース
ただの「Bing」ではない ~「Microsoft 365 Copilot」のWeb検索には4つの保護レイヤー
安全性、透明性、コントロール性、そして最小限のデータ送信
2025年10月9日 13:43
従来のWeb検索エンジンは、消費者の幅広いニーズに対応するように設計されている。しかし、「Microsoft 365 Copilot」のWeb検索はエンタープライズ指向となっており、プライバシー保護、安全性の確保、チャットAIの回答に対するグラウンディング(根拠付け)などを考慮し、消費者向けのWeb検索エンジンとは異なる多層構造になっているという。米国時間10月8日にMicrosoftが公式コミュニティ「Microsoft Community Hub」で公開した記事で、その内容が解説されている。
「Copilot」などで用いられる大規模言語モデル(LLM)は膨大なデータで訓練されているが、訓練が完了した後に起こった事柄や新しく生まれた知識は、当然のことながら知る由もない。LLMがいつまでの知識を学習したかをナレッジカットオフと呼ぶが、それ以降の情報が絡むリアルタイムな質問に対しては、Web検索で新しい情報を補いながら回答するわけだ。
こうしたリアルタイムな質問で「Copilot」チャットが扱うデータは、大きく分けて3つの部分にわけられる。
- プロンプト:ユーザーによる入力(質問)。質問は「Microsoft 365」内に保持され、外部に送出されることはない
- Webクエリ:必要に応じて短いキーワードに変換され、個人やテナント(組織)に関する情報は削除された上で「Bing」に送信される
- レスポンス:組織のデータも用いて、Webからの引用元を明記しながら(グラウンディング)、回答を出力する。ユーザーは引用元と「Bing」に送信されたキーワードを確認できる。回答は「Microsoft 365」内に保持され、外部に送出されることはない
つまり、「Copilot」は何でもかんでも「Bing」で検索しているわけではなく、プライバシーを保護したうえで、必要なキーワードだけを検索にかけているわけだ。
さらに、「Copilot」のWeb検索(Microsoft 365 Copilot Web Search)は4つの保護レイヤーで管理されているという。
- 管理者コントロール:Web検索の利用可否をユーザーやグループ単位で制御。すべてのWebクエリは監査ログに記録され、あとで追跡できる
- ユーザー保護:WebグラウンディングのON/OFFを切り替え可能([Work][Web]タブ)。Webのデータを利用するかどうかを選択できる。リスクをもたらす可能性のある特定の用語、フレーズ、またはパターンがあれば、それを自動で拒否するRAI(責任あるAI)保護も適用される。透明性を確保するため、「Copilot」がWebに送出したキーワードはあとから確認できる
- クエリ保護:必要最小限のキーワードのみ送信。個人・組織を識別するデータやファイルは送信されない
- 契約上のコミットメント:「Copilot」がユーザーに対し約束すること。クエリデータは広告やモデル学習に利用されない。Microsoft以外とは共有されず、顧客の機密情報として扱われる
とはいえ、これらに全面的に頼ってしまうのもよくないだろう。効果を測定しながら試験的に展開したり、ログ監査の仕組みを整備して利用状況を定期的に確認したり、データ損失防止(DLP)などの仕組みを活用して機密ファイルを保護したり、ユーザートレーニングを実施したりといった対策も同時に取る必要がある。