ニュース

OpenAI、「GPT‑5.6」を発表 ~米国政府の要請で限定プレビュー、その後一般提供へ

フラグシップの「Sol」、バランスのとれた「Terra」、高速・低コストな「Luna」の3種

OpenAI、「GPT‑5.6」シリーズの限定プレビューを開始

 米OpenAIは6月26日(現地時間)、次世代大規模言語モデル「GPT‑5.6」シリーズを発表した。米国政府との調整により、まず“政府と共有された少数の信頼できるパートナー”に限ってプレビュー提供される。一般提供は数週間以内が見込まれている。

 「GPT‑5.6」シリーズでは新しい命名システムが導入され、バージョンナンバーはモデルの世代を、「Sol」「Terra」「Luna」が能力ティア(階層)を表すようになる。各ティアは独立したペースで強化されていき、ユーザーや開発者は必要なインテリジェンス・速度・コストのバランスを選択できる。

  • GPT‑5.6 Sol:最上位のフラグシップモデル。
  • GPT‑5.6 Terra:バランス型。「GPT‑5.5」に匹敵する性能を半額で提供
  • GPT‑5.6 Luna:高速・低コスト。大量処理に適する

 なかでも「GPT‑5.6 Sol」は、OpenAI史上もっとも高性能なモデルとなる。新たに「max」推論モードが導入され、より深い推論を行えるようになったほか、複数のサブエージェントを活用して複雑な作業を加速する「ultra」モードが用意されるのが特徴だ。

 コーディング面では、コマンドラインワークフローにおける計画・反復・ツール連携を評価する「Terminal‑Bench 2.1」で最高性能を達成。ゲノム解析などの生物学ワークフローでも、前モデル「GPT‑5.5」を上回りつつトークン消費を抑えている。サイバーセキュリティ分野でも大きく能力が向上しており、「ExploitBench」では競合となるAnthropicの「Mythos Preview」と同等の性能をわずか約3分の1のトークンで達成しているという。

コマンドラインワークフローのベンチマーク「Terminal‑Bench 2.1」で最高性能を達成
ゲノム解析などの生物学ワークフローを測る「GeneBench v1」
サイバーセキュリティ分野のベンチマーク「ExploitBench」でも、Anthropicの「Mythos Preview」と同等の性能をわずか約3分の1のトークンで達成

 安全性に関してもぬかりはなく、OpenAI史上もっとも厳格なセーフガードが導入されている。モデル自体の拒否能力、生成中のリアルタイム分類器、アカウントレベルの監視、差別化されたアクセス制御などを多層的に組み合わせており、こうした保護機能を破る“ジェイルブレイク”への対策にも多くの計算リソースが投入されているという。

 APIの価格は100万トークンあたり、「Sol」が入力5ドル/出力30ドル、「Terra」が入力2.5ドル/出力15ドル、「Luna」が入力1ドル/出力6ドル。明示的なキャッシュブレイクポイントと最低30分のキャッシュ寿命がサポートされるなど、プロンプトキャッシュの仕組みも刷新されており、トークンの浪費を削減できる。