ニュース

Anthropic、最新鋭モデル「Claude Sonnet 4.5」を発表 ~推論・数学、PCの操作も得意

研究プレビューとして革命的開発AI「Imagine with Claude」も限定提供、5日間のみ

Anthropic、「Claude Sonnet 4.5」を発表

 米Anthropicは9月30日(日本時間)、「Claude Sonnet 4.5」を発表した。複雑なエージェントの構築やPCの操作にも長けた“世界最高のコーディングモデル”で、推論と数学能力で大幅な進歩を遂げているという。

 「Sonnet 4.5」は、コーディング能力を測定する「SWE-bench」で82.0%を記録しており、従来の「Opus 4.1」「Sonnet 4」を凌駕している。

「SWE-bench」で82.0%を記録

 また、実際のPCタスクでAIモデルをテストする「OSWorld」でも、「Sonnet 4.5」は前世代の「Sonnet 4」(42.2%)を上回る評価(61.4%)を得た。同社が提供を予定している「Claude for Chrome」拡張機能はこのPC操作能力を活用したもので、Webブラウザーを操作してスプレッドシートに入力するといったタスクを人間に代わってこなすことができる。

言葉で指示した通りにWebブラウザーを操作。スプレッドシートに入力するといったタスクを人間に代わってこなす

 そのほかにも、金融・法律・医療・STEM(科学・技術・工学・数学)といった各専門分野でも大幅な性能向上が図られた。また、AIモデルの整合性も改善されており、人間の指示に忠実に従う(アライメント)ほか、虚偽や権力志向、妄想の助長といった懸念行動が抑制されているという。「Sonnet 4.5」には「Opus 4」と同じくAI安全性基準「ASL-3」が適用されており、潜在的に危険な入出力――とくに化学兵器、生物兵器、放射線兵器、核兵器(CBRN)に関連するもの――を検出するフィルターが含まれる。

 ちなみに、価格は「Sonnet 4」と同じで100万トークンあたり入力3米ドル、出力15米ドル。「Claude Sonnet 4.5」のリリースに併せ、関連製品のメジャーアップグレードも実施される。

  • 「Claude Code 2.0」:作業を保存し、以前の状態へ即座にロールバックできるチェックポイント機能を追加。ネイティブの「Visual Studio Code」拡張機能をリリース
  • 「Claude API」:新しいコンテキスト編集機能とメモリツールを追加し、エージェントをより長く実行し、さらに複雑な問題を処理できるように
  • 「Claude」アプリ:会話内でコードの実行とファイル作成(スプレッドシート、スライド、ドキュメント)をサポート
  • 「Claude for Chrome」拡張機能:順番待ちに登録していた「Claude Max」(個人向け最上位の有償プラン)ユーザーに提供
  • 「Claude Agent SDK」:「Claude Code SDK」を発展させたもの。独自のエージェント構築できる

 加えて、研究プレビューとして「Imagine with Claude」(claude.ai/imagine)が「Claude Max」ユーザー限定で5日間公開される。これはコードを書くことなく、ユーザーの要求に応じてリアルタイムでソフトウェアを生成するというもので、プロトタイプの作成やUI/UXに革命をもたらす可能性がある。

研究プレビューとして「Imagine with Claude」が限定提供