ニュース

GoogleのAIチャット「Gemini」にカスタマイズ機能「Gems」、画像生成も「Imagen 3」へ

「Google I/O」でお披露目されたAI機能がようやく実際に使えるように

対話型生成AI「Gemini」に「Gems」「Imagen 3」が投入

 米Googleは8月28日(現地時間)、対話型生成AI「Gemini」の新機能を2つ発表した。今年の「Google I/O」でお披露目されたエキサイティングなAI機能が、ようやく実際に利用できるようになる。

「Gemini」をカスタマイズする「Gems」

 「Gems」は、「Gemini」をカスタマイズして特定のトピックに関する“専門家”にする機能だ。あらかじめ用意された「Gems」もあり、汎用的なチャットAIではカバーできない分野や作業での回答の質を改善する。

  • Learning coach:複雑なトピックをわかりやすく解説
  • Brainstormer:テーマパーティの斬新な企画から、今度の誕生日にぴったりのプレゼントまで、アイデアをひねり出す際のお供に役立つ
  • Career guide:スキルを磨き、キャリア目標を達成するための詳細なプランを提案
  • Writing editor:文法から構成に至るまで、明確で建設的なフィードバックを通じてライティングの質を向上
  • Coding partner:プロジェクトを作りながらコーディングスキルのレベルアップを図る

 なお、利用には「Gemini Advance」や「Gemini Business」、「Gemini Enterpris」への加入が必要。150カ国以上のほとんどの言語に対応する。

あらかじめ用意された「Gems」も

「Imagen 3」で高品質な画像を生成

 画像生成モデルは最新の「Imagen 3」へアップグレードされ、「Imagen 2」より自然なタッチで画像を生成できるようになる。従来の画像生成AIが苦手としていた画像内に文字を組み込む指示もうまくこなす。「Imagen 2」と同様、「SynthID」透かしも含まれる。

 「Imagen 3」は言語を問わず利用できるが、まずは早期アクセスバージョンとして英語に限り、人物画像の生成で利用される予定。もちろん未成年者の描写、過度にグロテスクな暴力や性的なシーンの生成はブロックされる。いち早く試したい場合は「Gemini Advanced」か「Gemini for Workspace」へ申し込む必要があるが、いずれはすべてのユーザーに展開されるはずだ。

同じプロンプトで生成された画像。左が「Imagen 2」、右が「Imagen 3」