ニュース

OpenAI、フラグシップモデル「GPT-5.2」を発表 ~知識業務タスクでも人間の専門家レベルに

有料「ChatGPT」「Microsoft 365 Copilot」で順次展開

OpenAI、「GPT-5.2」を発表

 米OpenAIは12月11日(日本時間)、フラグシップモデル「GPT-5.2」を発表した。専門的な知識業務において、これまででもっとも高度なモデルシリーズだという。

 「GPT-5.2」ファミリーは、以下のラインナップで提供される。

  • GPT‑5.2 Instant:日常の仕事や学習に役立つ高速で頼れるモデル。「GPT‑5.1 Instant」で導入された温かみのある対話トーンも引き継がれる
  • GPT‑5.2 Thinking:より深い思考を必要とするタスク向け。コーディングや長文ドキュメントの要約、アップロードしたファイルに関する質問への回答、数学やロジックの段階的な説明などに適する
  • GPT‑5.2 Pro:高品質な回答が求められる難しい質問に適した、同社でもっとも高度かつ信頼性の高いモデル

 いずれも多くのベンチマークで最高水準の結果を叩き出しており、とくに44の職種にまたがる知識業務タスクを評価するベンチマーク「GDPval」では、「GPT‑5.2 Thinking」が同社のモデルとしては初めて、人間の専門家レベルに達しているという。実世界のソフトウェアエンジニアリングを厳密に評価する「SWE-Bench Pro」、大学院レベルの科学・数学能力を問う「GPQA Diamond」、推論能力をより厳密に評価する「ARC-AGI-2」などでも最高スコアを叩き出している。最大256kトークンまで扱えることもあって長文コンテキストの推論にも優れる。

知識業務タスクを評価するベンチマーク「GDPval」では、「GPT‑5.2 Thinking」が同社のモデルとしては初めて人間の専門家レベルに
「SWE-Bench Pro」などでも高いスコアを記録

 それでいて、「GPT‑5.2 Thinking」は「GPT‑5.1 Thinking」に比べてハルシネーションが抑えられているとのこと。視覚モデルとしても優れており、チャート推論やソフトウェアインターフェイス理解におけるエラー率も約半分に削減された。

 「ChatGPT」では本日より、「GPT‑5.2」(Instant、Thinking、Pro)が有料プランで順次提供される。「GPT‑5.1」はレガシーモデルとして有料ユーザー向けに3カ月間提供されたのち、提供を終了する予定。

 また、「Microsoft 365 Copilot」および「Microsoft Copilot Studio」でも同日より「GPT‑5.2」(Instant、Thinking)が順次提供される。「Microsoft 365 Copilot」ライセンスがあれば、今後数週間以内にモデルセレクターで選べるようになるはずだ。「Microsoft 365 Premium」サブスクライバーにも、来年初頭から展開される。

「Microsoft 365 Copilot」および「Microsoft Copilot Studio」でも同日より「GPT‑5.2」(Instant、Thinking)が提供