ニュース

OpenAI、「DALL-E 3」を発表 ~「ChatGPT」に統合、プロンプトに忠実な画像を生成

10月上旬にも「ChatGPT Plus」「ChatGPT Enterprise」で提供開始

画像生成AI「DALL-E 3」

 米OpenAIは9月21日(日本時間)、「DALL-E 3」を発表した。自然言語による説明テキストから画像を生成するAIモデル「DALL-E 2」の後継となる。

 最近の画像生成AIは単語や説明を無視する傾向があり、ユーザーは意図した通りの画像を生成するためにプロンプト(指示文)の試行錯誤を強いられている。このことはプロンプトエンジニアリングと呼ばれるが、「DALL-E 3」は従来の「DALL-E 2」よりもニュアンスやディテールをより深く理解し、ユーザーのアイデアを忠実にイメージへ変換できるようになっており、そうした工夫は不要になっているという。

従来の「DALL-E 2」よりもニュアンスやディテールをより深く理解し、ユーザーのアイデアを忠実にイメージへ変換できる
「DALL-E 2」(左)と「DALL-E 3」(右)。プロンプトは同じ「An expressive oil painting of a basketball player dunking, depicted as an explosion of a nebula.」で生成

 また、「DALL-E 3」は「ChatGPT」上でネイティブ構築されているのも特徴。チャットAIからシームレスに利用することができる。期待したものと異なる画像が生成されても、「ChatGPT」に一言添えるだけで微調整が可能だ。不適切な画像の生成を抑止する技術も引き続き改善されており、自分のコンテンツを学習に使われたくないというクリエイターの要望に応えた仕組みも導入されるようだ。

 「DALL-E 3」は現在、リサーチプレビュー中。10月上旬には「ChatGPT Plus」と「ChatGPT Enterprise」のユーザーに提供されるとのこと。「DALL-E 2」と同様、「DALL-E 3」で作成した画像は転載、販売、商品化する際にOpenAIの許可は必要ない。