ニュース

Google、「Gemini 3」を発表 ~“その場の空気を読む”までに進化した最新・最強のAI

Google検索、Geminiアプリなどにも本日より展開

Google、「Gemini 3」を発表

 米Googleは11月19日(現地時間)、「Gemini 3」を発表した。同社の最新かつもっとも高度なAIモデルで、最先端の推論力、深いマルチモーダル(テキスト、音声、動画など)理解、そして強力なエージェント機能を備えるという。同社のCEOであるSundar Pichai氏は、『その場の空気を読むまでに進化した』と述べている。

 「Gemini」は世代を重ねるごとに進化しており、「Gemini 1」(2023年12月)ではマルチモーダル理解をネイティブで獲得、コンテキストウィンドウが拡大され、処理できる情報の種類と量が大きく拡張された。「Gemini 2」では思考(thinking)、推論(reasoning)、Web検索などのツールを利用する能力などが付与され、複雑なタスクを人間に代わって行うAIエージェントとしての基盤が築かれた。

 「Gemini 3」はこれらすべての機能を統合した、これまででもっとも高性能なモデルになっているという。とくに推論能力において最先端のモデルで、複雑な問題を解きほぐすのが得意だ。また、ユーザーの要求の背後にある文脈や意図を把握する能力が飛躍的に向上しており、短いプロンプトでも必要な結果が得られるという。前述の『その場の空気を読むまでに進化した』という評価は、まさにそのことを表した言葉だ。

さまざまなベンチマークで過去のAIモデルの性能を凌駕

 とくに強化推論モード「Gemini 3 Deep Think」(数週間以内に「Google AI Ultra」ユーザーへ提供)は「Gemini 3」の推論能力とマルチモーダル理解力を飛躍的に向上させており、より複雑な問題を解決できるという。

「Gemini 3」の推論能力とマルチモーダル理解力を飛躍的に向上させる「Deep Think」

 また、「Gemini」はテキスト、画像、動画、音声、コードといった複数のモダリティにわたるあらゆるトピックの情報をシームレスに統合するように設計されている。「Gemini 3」は視覚と空間の理解、卓越した多言語性能にも優れており、100万トークンものコンテキストウィンドウで大量の情報も扱える。そのため、学習やアプリ開発、より長期的な視野に立った計画の立案にも向いている。

 「Gemini 3」は本日より、Googleのサービス全体に展開される。

  • Google 検索:初めてモデル発表とともに搭載。まずは米国の「AI モード」
  • 「Gemini」アプリ(gemini.google.com):「Thinking」を選択することで「Gemini 3 Pro」(プレビュー)が利用可能に。「Google AI」の有料ユーザー(Plus、Proおよび Ultra)にはより多くの利用枠が与えられる
    「Thinking」を選択することで「Gemini 3 Pro」が利用可能に
  • 「Google AI Studio」、「Vertex AI」、そして新しい開発プラットフォーム「Google Antigravity」で展開
  • サードパーティ:「Cursor」「GitHub」JetBrains社製のIDE「Replit」などが「Gemini 3 Pro」に対応。「Gemini CLI」「Android Studio」のAI支援機能でも利用できる