ニュース
「Google I/O 2025」で発表された「Gemini」アップデート、「Veo 3」「Imagen 4」も
さらに強力な「Gemini 2.5 Pro」、「Deep Research」と「Canvas」の強化など
2025年5月21日 08:06
米Googleは5月20日(現地時間)、開発者向けカンファレンス「Google I/O 2025」で、生成AI「Gemini」や「Gemini」アプリ(gemini.google.com)のアップデートを発表した。
「Gemini 2.5」の新機能
同社の最新鋭モデル「Gemini 2.5 Pro」がアップデートされ、これまで以上に優れたパフォーマンスを発揮するようになった。コーディング能力を測る「WebDev Arena」ではELOスコア1,420を獲得し、現在トップだ。また、さまざまなシナリオで人間の好みに合致するかを評価する「LMArena」でも首位を獲得している。100万トークンの巨大コンテキストウィンドウにより、長文コンテキストや動画の理解でも高いパフォーマンスを誇る。
また、教育専門家とともに構築した「LearnLM」を組み込むことにより、教育・学習分野においても最適なモデルになっているという。「Live API」でネイティブ音声出力による対話機能をプレビュー導入するほか、テキスト読み上げ(TTS)の新しいプレビューを開始するなど、音声関連の機能も強化される。
そのほかにも、応答前にモデルが複数の仮説を検討できるようにする高度な推論モード「Deep Think」のテストが開始される。「2.5 Pro Deep Think」は現在もっとも難しいとされる数学ベンチマークの1つ「2025 USAMO」で優れたスコアを獲得しており、コーディングやマルチモーダル推論にも優れる。
「Deep Research」と「Canvas」
「Deep Research」はユーザーに代わってオンラインで情報を収集し、調査結果をレポートとしてまとめてくれるパーソナルAIリサーチアシスタントだ。今回のアップデートでは、ソースの一部として自分のファイルや画像をアップロードできるようになったほか、「Canvas」との統合が図られた。
「Canvas」は「Gemini」と対話しながらドキュメントやソースコードをブラッシュアップしていけるホワイトボードのようなユーザーインターフェイス(UI)で、「Deep Research」で生成されたレポートをインタラクティブなコンテンツやテスト、アプリに変換し、より効率的な学習・理解へとつなげることができる。
また、「Gemini 2.5」の軽量版「2.5 Flash」が「Gemini」アプリの標準モデルとなった。優れた品質と短い応答時間を両立できる。「Deep Research」でも無料で試用可能だ。
最新動画生成モデル「Veo 3」
効果音、背景音、キャラクター間の対話をネイティブにサポートする世界初の動画生成モデル「Veo 3」が搭載され、8秒間の動画を音声付きで作成できるようになった。遊び心のあるアイデアをキャラクターのおしゃべりとともに形にしたり、BGMでシーンを盛り上げたり、サウンドエフェクトでリアルな演出を加えたりでき、ビジュアルストーリーテリングに新しい可能性をもたらす。
「Veo 3」は試験運用版として、「Google AI Ultra」サブスクリプションで優先提供される。得られたフィードバックをもとに改善したのち、対象ユーザーの拡大、言語サポートの拡充を行うとのこと。
「Imagen 4」で画像生成をアップグレード
高画質、優れたテキスト描写、そして処理速度の早さが特長の新しい画像生成モデル「Imagen 4」が搭載。さまざまなアスペクト比で最大2K解像度の画像を生成でき、印刷やプレゼンテーションにも耐える。文字表現やタイポグラフィの生成能力も大幅に向上しており、グリーティングカード、ポスター、漫画なども簡単に作成できる。
「Imagen 4」は「Gemini」アプリのほかにも「Whisk」、「Vertex AI」、そして「Google Workspace」の「スライド」、「Vids」、「ドキュメント」などで利用可能。「Imagen 3」と比較して最大10倍の高速処理を実現する「Imagen 4」の高速版も近日中に公開予定だという。