ニュース

OpenAIの最新画像生成AI「DALL-E 3」が有料版の「ChatGPT」で利用可能に

従来よりもプロンプトに対して忠実に出力

 米OpenAIは10月19日(現地時間)、「ChatGPT」で「DALL-E 3」を用いた画像生成が可能になったことを発表した。「DALL-E 3」は同社最新のAIモデル。自然言語による説明テキストから画像を生成するAIモデル「DALL-E 2」の後継で、「Bing チャット」および「Bing Image Creator」で先行して提供を開始していた。

 「DALL-E 3」は、これまでプロンプト(指示文)の単語や説明を部分的に無視する傾向にあった旧モデルに比べて、ニュアンスやディテールをより深く理解し、ユーザーのアイデアを忠実にイメージへ変換できるよう改善されている。「ChatGPT」上で作成したい画像についてプロンプトを入力すると、4点の画像が生成される。

『I am doing a report on cirrus clouds for my science class. I need photorealistic images that show off how wispy they are. I am going to compare them to photos I took of puffy cumulonimbus clouds at my house yesterday.』と指示したときの出力結果

 Webデザインやビジネスロゴなど、必要なシーンに合わせて生成することもできる。期待したものと異なる画像が生成されても、「ChatGPT」に一言添えるだけで微調整が可能になっている。

『I am working with a web designer for a new website to sell bicycle helmets. Could you recommend a few website UI's that are both modern and simple that I can share with her as examples?』と指示したときの出力結果
『My business partner and I are creating a coffee shop inspired by our mutual love for rabbits. We have a logo we like a lot that is minimalist with a rabbit, but anxious to get your take on it.』と指示したときの出力結果

 また「DALL-E 3」は利用規約とコミュニティガイドラインに従い、権利を侵害したり、不適切な画像の生成を抑止する技術も備え、そのような画像の生成を制限するようになっている。自分のコンテンツを学習に使われたくないというクリエイターはオプトアウト可能だ。

 「DALL-E 3」の提供は「ChatGPT Plus」と「ChatGPT Enterprise」ユーザーが対象となる。「DALL-E 3」で作成した画像は転載、販売、商品化する際にOpenAIから許可を得る必要はない。