ニュース

Googleが新たなコンセプトのimg2img画像生成AI「Whisk」の日本展開を開始

モデル、シーン、スタイルのイメージ画像から思い通りの画像を生成

「Whisk」

 米Googleは2月12日(現地時間)、新たなコンセプトの画像生成AI「Whisk」のの試験運用版を、日本で順次提供開始すると発表した。

 モデル、シーン、スタイルの3つの画像を入力すると、それらを組み合わせて、選択したぬいぐるみなどのテンプレートに合わせたオリジナルの画像を作成できる。「Gemini」が画像の詳細なキャプションを作成し、最新の画像生成モデルである「Imagen 3」に入力して画像を生成する仕組み。

「Whisk」の動作イメージ

 なお、元画像から特徴のみを抽出するため、生成されるモデルの身長、体重、髪型、肌の色などがユーザーのイメージとは異なる可能性もあるとしている。そういった場合には、画像生成に使われた「Gemini」が生成したプロンプトを表示し、プロンプトを編集することが可能だ。ただし、プロンプトの編集で最大の効果を発揮するには英語の使用が推奨されている。

 今回、日本での提供にあわせて、日本文化からインスパイアされた[カプセルトイ]と[お弁当]のテンプレートが新たに追加された。また、バレンタインデーにあわせた特別なテンプレートも用意されている。