ニュース

「Gemini」の「Imagen 3」画像生成がついに日本語対応に、カスタムAI「Gems」も日本語で提供開始

Advanced、Business、Enterpriseで利用可能

「Gemini」の「Imagen 3」画像生成が日本語対応、カスタムAI「Gems」も日本語で提供開始

 米Googleは10月16日(現地時間)、日本語対応の画像生成や「Gems」などの新機能を「Gemini」アプリ(gemini.google.com)に追加したと発表した。今年の「Google I/O」でお披露目された目玉のAI機能が、日本語でもようやく利用できるようになる。

日本語対応の「Imagen 3」

 「Imagen 3」は同社最新の画像生成モデルで、従来の「Imagen 2」より自然なタッチで画像を生成できるのが特徴。「Gemini」にわずか数単語を入力するだけで、写実的な風景からテクスチャーのある油絵、気まぐれなクレイアニメのシーンなど、さまざまなスタイルの画像を生成できる。従来の画像生成AIが苦手としていた画像内に文字を組み込む指示もうまくこなす。

「Imagen 2」(左)と「Imagen 3」(右)。同じプロンプト(指令文)で生成したもの

 また、パフォーマンスにも優れており、さまざまなベンチマークで他の画像生成モデルとの比較し優れた性能を示しているとのこと。「Imagen 2」と同様、「SynthID」透かしも含まれており、安全性への考慮も万全だ。

 この機能は「Gemini」のAdvanced、Business、Enterpriseのすべてで利用可能。

「Gems」も日本語に対応

 「Gem」は目的や用途に応じてカスタムされた「Gemini」で、特定のトピックにおいて汎用的な「Gemini」よりも優れた回答を行う。そのトピックの専門家、エキスパートとしてユーザーを支えてくれる生成AIと考えればよいだろう。

カスタム「Gemini」を作成して、特定のトピックに特化させる「Gem」

 「Gem」は自分で作成することもできるが、あらかじめプログラムされたプリセットが用意されている。まずはこのプリセットで有用性を検証するとよいだろう。

  • 家庭教師:複雑なトピックを分解して、理解しやすくする
  • アイデア出し:パーティーのアイデアや、誕生日にぴったりのプレゼントなど、インスピレーションを得る
  • キャリア アドバイザー:スキルを磨き、キャリア目標を達成するための詳細な計画を助言
  • 編集者と校正役:文法や文章構造など、さまざまな点について明確で建設的なフィードバックを提供し、文章の質を高める
  • コーディング パートナー:コーディング スキルをレベルアップして、プロジェクトの構築と学習を手助けする

 「Gem」は詳細な手順を記憶できるため、退屈な繰り返し作業を任せるのにも向いている。この機能も「Gemini」のAdvanced、Business、Enterpriseで利用可能だ。