ニュース

OpenAI、「GPT-4.1」をAPIで提供開始 ~「GPT-4.5」プレビューは3カ月後に廃止

最大100万トークンのロングコンテクスト、ナレッジカットオフは2024年6月

OpenAI、「GPT-4.1」を発表

 米OpenAIは4月14日(現地時間)、開発者向けに設計されたAPIファミリー「GPT-4.1」を発表した。性能や応答速度、価格の異なる「GPT-4.1」、「GPT-4.1 mini」、「GPT-4.1 nano」の3つのモデルが用意され、APIを介して利用できる。

「GPT-4.1」、「GPT-4.1 mini」、「GPT-4.1 nano」の3つのモデルを用意

 「GPT-4.1」ファミリーは「GPT-4o」や「GPT-4o mini」の性能を全面的に凌駕し、コーディングと命令追従性が大幅に向上しているとのこと。コンテキストウィンドウも拡大されており、最大100万トークンのコンテクストに対応。ナレッジカットオフは2024年6月で、その時点までの出来事を学習している。

「GPT-4o」や「GPT-4o mini」の性能を全面的に凌駕し、コーディングと命令追従性が大幅に向上

 各種ベンチマークにおいては、以下のような結果を残しているとのこと。

  • コーディング「SWE-bench」における「GPT-4.1」のスコアは54.6%で、「GPT-4o」より21.4%、「GPT-4.5」より26.6%向上
    「SWE-bench」で計測したコーディング性能
  • 指示への追従性:ユーザーとの会話が長くなっても当初の指示にちゃんと従うかどうかを測る「SEAL MultiChallenge」で「GPT-4.1」の33.2%に比べ大きく改善
    「GPT-4.1」は長い会話でも最初の内容をよく覚えているように訓練されており、より自然な会話が可能になっている
  • 長い文脈:ビデオ解析のベンチマーク「Video-MME」で、「GPT-4.1」は字幕なしの長文カテゴリーで72.0%の成績。「GPT-4o」より6.7%改善
    視覚とロングコンテキスト性能を試すベンチマークでも、「GPT-4.1」は優秀な成績

 同社は「GPT-4.1」モデルファミリーを低コストで卓越した性能を発揮すると評価している。実際、「GPT-4.1」はクエリの中央値で「GPT-4o」よりも26%安価だ。「GPT-4.1 nano」はこれまででもっとも安価かつ最速のモデルとなっている。「Visual Studio Code」の場合、無償の「GitHub Copilot」プランでも試すことができる。

 一方で、プレビュー提供されていた「GPT-4.5」はAPIで非推奨となる。移行のための猶予として3カ月が設定されており、2025年7月14日に停止される、