ニュース

OpenAIが「GPT-4 Turbo」のプレビューモデルを公開～「GPT-3.5 Turbo」は価格引き下げ

「GPT-3.5 Turbo」は来週アップデート、新しいEmbeddingモデルも発表

三好修太

2024年1月30日 08:32

Blog（OpenAI）

　米OpenAIは1月25日（現地時間）、新しいGPT-4 Turbo Previewモデル「gpt-4-0125-preview」をリリースした。「GPT-3.5 Turbo」の価格改定とアップデートや新しいEmbeddingモデルも発表されている。

　新しい「GPT-4 Turbo」のプレビューモデル「gpt-4-0125-preview」は、従来のプレビューモデルよりもコード生成などのタスクをより徹底的に完了し、“怠惰”となるケースを低減。新しいモデルには、英語以外のUTF-8に影響を与えるバグ修正も含まれる。自動アップグレードの対象は、「gpt-4-turbo-preview」エイリアスを使用しているユーザー。

　「GPT-3.5 Turbo」の価格は、入力が50％引き下げられて1,000トークンあたり0.0005米ドル、出力が25％引き下げられて1,000トークンあたり米0.0015ドル。アップデート版の「gpt-3.5-turbo-0125」は、要求された形式での応答精度が向上するほか、英語以外の言語で発生していた不具合も修正される。

　新しい導入されたEmbeddingモデルは「text-embedding-3-small」モデルと「text-embedding-3-large」モデル2種類。いずれも、APIに「dimensions」パラメータを渡すことで、その概念を失うことなく、Embeddingを短縮できる。

　“Embedding”とは、自然言語やコードなどのコンテンツ内の概念を表現するための、数学的な仮想ベクトル空間上の位置を示す一連の数値。機械学習モデルやアルゴリズムがコンテンツ間の関係を理解しやすくし、クラスタリングや情報取得などのタスクの実行を助ける。「ChatGPT」やAssistants API、多くの検索拡張世代（RAG）開発者ツールに寄与している。

Embeddingモデルイメージ

　「text-embedding-3-small」モデルは小さなテキストembeddingモデルであるが、2022年12月にリリースされた前身モデル「text-embedding-ada-002」と比べ、多言語検索ベンチマーク（MIRACL）の平均スコアは31.4％から44.0％に、英語タスクベンチマーク（MTEB）の平均スコアは61.0％から62.3％に向上している。

　「text-embedding-3-large」モデルは最大3,072次元までのembedding作成が可能な、次世代大型モデル。前身モデル「text-embedding-ada-002」と比べ、MIRACLの平均スコアは31.4％から54.9％に、MTEBの平均スコアは61.0％から64.6％に向上している。

ベンチマークスコア

　そのほか、無料モデレーションモデル「text-moderation-007」のリリースと、APIキー管理方法の改善が行われた。今後数カ月間で、特に大規模組織における開発者のAPI使用状況確認や、APIキーを管理できる機能を改善する予定。

Activity確認イメージ