ニュース

Anthropic、ハイブリッド推論モデル「Claude 3.7 Sonnet」を発表 ~1つのモデル、2つの考え方

コーディングAIエージェント「Claude Code」も

Anthropic、ハイブリッド推論モデル「Claude 3.7 Sonnet」を発表

 米Anthropicは2月25日(日本時間)、新しいAIモデル「Claude 3.7 Sonnet」を発表した。

 「Claude 3.7 Sonnet」は、一般的な大規模言語モデル(LLM)と推論モデルのハイブリッドになっているのが特徴。ほぼ瞬時に応答を生成する標準モードと、出力の前に熟考する拡張思考モードの2つを備える。標準モードでは、従来の「Claude 3.5 Sonnet」をアップグレードさせたものとして利用可能。拡張思考モードでは回答を出力する前に自己反省を行い、数学、物理、命令への追従、コーディング、その他多くのタスクのパフォーマンスを向上させる。

 人間は1つの脳ですぐに答えを出すときもあれば、時間をかけて考えたうえで答えを出すこともある。1つのモデルで2つの考え方を行う「Claude 3.7 Sonnet」は、それを模倣したものであるといえるだろう。拡張思考モードでは思考の内容を生成したり、APIユーザーであればモデルの思考時間を細かく制御することも可能だ。

 性能面でも飛躍的な進歩を遂げており、各種ベンチマークでは従来モデルである「Claude 3.5」はもちろん、OpenAIの「o1」「o3-mini」、「DeepSeek-R1」、「Grok 3」ベータ版を凌駕、もしくは同等の結果を残している。

ベンチマークテストでも従来モデルや競合モデルを凌駕

 また、エージェントコーディングのためのコマンドラインツール「Claude Code」も併せて発表された。限定的なリサーチプレビューとして提供されており、コードの検索と読み込み、ファイルの編集、テストの記述と実行、「GitHub」へのコードのコミットとプッシュ、コマンドラインツールの使用といったエンジニアリングタスクを委任することができる。

エージェントコーディングのためのコマンドラインツール「Claude Code」

 「Claude 3.7 Sonnet」は現在、Free、Pro、Team、Enterpriseを含むすべての「Claude」プラン、および「Anthropic API」、「Amazon Bedrock」、「Google Cloud」の「Vertex AI」で利用可能。拡張思考モードは、無料プラン以外で利用できる。価格は標準モードと拡張思考モードともに据え置きとなっており、入力トークン100万個につき3米ドル、出力トークン100万個につき15米ドルとなっている。