ニュース

Google、「Gemini 2.0 Flash」による画像生成の実験を開放

対話で画像の微調整や長文プロンプトも正確に反映

Google AI Studioに「Gemini 2.0 Flash」を使った画像生成機能を導入

 米Googleは3月12日(現地時間、以下同)、「Gemini 2.0 Flash」を使った画像生成機能の実験に、「Google AI Studio」でサポートしている全ての地域の開発者が利用できるようになったと発表した。「Google AI Studio」の実験版の「Gemini 2.0 Flash」とGemini APIを使用してのテストが可能だ。

 「Gemini 2.0 Flash」は、マルチモーダル入力、強化された推論、自然言語理解を組み合わせて画像を生成する。

 作りたい画像のイメージのストーリーを入力することで、キャラクターと設定を保持しながら、ユーザーによるフィードバックをもとに修正を行える。自然言語による対話で画像を繰り返し編集することもできる。

キャラクターと設定を保持しながら、ユーザーによるフィードバックをもとに修正可能
自然言語による対話で画像を繰り返し編集

 また、幅広い知識と強化された推論を利用し、リアルに近い画像を生成可能。例えば、レシピを紹介するときに画像も同時に生成して、ユーザーが内容に対して視覚的な理解を助けることができる。このほか、ほかの画像生成モデルが苦手とする、長文のプロンプトも正確に理解し、画像を生成することが可能だ。

Gemini 2.0 Flashは幅広い知識と強化された推論を利用し、リアルに近い画像を生成
長文のプロンプトも正確に理解