ニュース

Microsoft、オープンソースの新しい埋め込みモデル「Harrier」を発表

「Gemini Embedding 2」を凌駕、次世代「Bing」検索やエージェントのグラウンディング基盤

同社のアナウンス

 米Microsoftの「Bing」チームは4月7日(現地時間)、オープンソースの新しい埋め込みモデル「Harrier」を発表した。AIが“答える”だけの存在(チャット)から“行動する”存在(エージェント)へ進化するなか、「グラウンディング」(推論の根拠となる部分を示すこと)はAIエージェントに対するユーザーの信頼の基盤として重要性を増している。「Harrier」は、グラウンディングの品質向上に向けた同社の継続的な取り組みの成果だという。

 「Harrier」は以下の3サイズで展開されており、「Hugging Face」から入手可能。ライセンスは「MIT」。

ModelParametersEmbedding DimensionMax TokensMTEB v2 Score
harrier-oss-v1-270m270M64032,76866.5
harrier-oss-v1-0.6b0.6B1,02432,76869.0
harrier-oss-v1-27b27B5,37632,76874.3

 とくにフラグシップの「harrier-oss-v1-27b」は、OpenAIの「text-embedding-3-large」やGoogleの「Gemini Embedding 2」といった主要なプロプライエタリモデルを上回る性能を実現しているとのこと。多言語の「MTEB-v2」ベンチマークで「74.3」という総合スコアを記録しており、4月6日現在で1位だ。

 「Harrier」は100以上の言語に対応しており、多様な情報源から情報を検索・取得・整理し、それらを結びつけて、首尾一貫した意味のある応答を生成するプロセスを支える。今後は「Bing 検索」エンジンへの統合や、次世代AIエージェントのためのグラウンディングサービスへの組み込みで活用されるという。