ニュース

Microsoftの調査エージェント「Researcher」、「Claude」も使えるマルチモデルに

レポートの執筆と検証を役割分担したり、それぞれレポート出させて競わせたり

Microsoft、調査エージェント「Researcher」に新しい2つのマルチモデル機能を導入

 米Microsoftは3月30日(現地時間)、「Microsoft 365 Copilot」の調査エージェント「Researcher」に新しい2つのマルチモデル機能を導入したと発表した。OpenAIの「GPT」モデルだけでなく、Anthropicのモデル「Claude」を組み合わせた調査を行う「Critique」と「Council」という機能が追加されている。

片方が書き、片方が検証する「Critique」

 これまでの調査エージェントは、AIモデルを一つだけ用いるのが一般的だった。しかし、「Critique」は2つのモデルを使い、片方に調査と草稿の生成を、もう片方にその内容の評価と改善を行わせる。つまり、2つのモデルに執筆と校正の役割分担をさせることで、レポートの品質を引き上げようというわけだ。

 実際、学術研究者によって考案されたディープリサーチのベンチマーク「DRACO」で調査能力を測ったところ、「Critique」は良好な成績を収めたという。

ベンチマーク「DRACO」で調査能力を測ったところ、「Critique」は良好な成績を収めた

 「Critique」は「Researcher」のモデルピッカーで「Auto」を選択したときのデフォルト動作となる。

「Researcher」のモデルピッカー

複数モデルを競わせる「Council」

 一方の「Council」は、レポートの生成をOpenAIモデルとAnthropicモデルの両方に行わせ、専門の審査員モデルが評価する仕組み。双方のレポートを比較して、一致する点、相違する点を列挙し、それぞれのモデル固有の貢献を指摘する。

レポートの生成をOpenAIモデルとAnthropicモデルの両方に行わせ、専門の審査員モデルが評価

 「Council」は「Researcher」のモデルピッカーで「Model Council」を選択すると利用できる。「Critique」も「Council」も使わず、これまで通り「GPT」だけ、「Claude」だけを選ぶことも可能だ。

 これらの機能は本日より、同社の先進的なAI機能をテストできる「Frontier」プログラムで広く提供される。従来のシングルモデルの調査エージェントよりも精度、深度、信頼性の高い結果が得られるだろう。