やじうまの杜

「ChatGPT」と「Bing」の生成AI「DALL-E3」はどこが違う? 試してみた

機能と可用範囲で差

 “やじうまの杜”では、ニュース・レビューにこだわらない幅広い話題をお伝えします。
「ChatGPT」の「DALL-E3」を使って生成した画像

 米OpenAIが10月19日(現地時間)、「ChatGPT」で「DALL-E3」を使った画像生成機能を開放しました。現在、この機能が利用できるのは「ChatGPT Plus」もしくは「ChatGPT Enterprise」を利用しているユーザーだけとなっています。

 「DALL-E3」はOpenAIによって開発されたAIモデルで、テキストの記述から画像を生成できます。

 10月3日にはMicrosoftが提供している「Bingチャット」、そして「Bing イメージクリエーター」では「DALL-E3」が利用できるようになっていましたが、いよいよ「ChatGPT」からも「DALL-E3」が使えるようになったというわけです。

 ですが、この両者は細かい点がいくつか異なります。

 最も大きな違いとして、Bing版は商用利用不可、「ChatGPT」版は商用利用が可能であることが挙げられます。

Bingのイメージクリエーターの規約には「non-commercial purpose.」という文言があり、商用利用ができないことが明示的に記載されています
一方の「ChatGPT」のDALL-Eの規約には「you own the images you create with DALL·E, including the right to reprint, sell, and merchandise」という文言があり、生成した画像は生成者の所有物であり、転載、販売、商品化する権利がある旨が記載されています

 そのため個人的に使用するイラストやイメージ画像を生成する場合は無料で利用できるBingの方に軍配があがりますが、商用利用まで考えると企業ユース向けの「ChatGPT Enterprise」、もしくは月額20米ドルを支払う有料サービスの「ChatGPT Plus」を使う必要があります。

 またアスペクト比の変更ができるのも「ChatGPT」の特徴です。正方形に加え、1,792x1,024ピクセルの横長、1,024×1,792ピクセルの縦長が選べますが、Bingは正方形のみです。

 それでは早速それぞれを使って画像を生成したので見ていきましょう。

Bingも「ChatGPT」もプロンプト次第で似たような画像が生成可能。「ChatGPT」の方が柔軟か

 できるだけ差ができないように最初に入力するプロンプトは同じテキストを使います。

 まずは先に公開されたBingの方を見ていきます。

Bingで画像を生成してみました。アニメ調の画像で、違和感の少ない画像が出力されました

 特にタッチや画風などは指定していませんが、アニメ調の画像が出力されました。

 続いて全く同じプロンプトで「ChatGPT」で生成してみます。

全く同じプロンプトを使って「ChatGPT」で生成してみます。タッチが異なる2種類の画像が生成されました

 こちらは実写に近い画像と、イラスト風の2種類の画像が生成されました。何度か試してみたのですが、大雑把なプロンプトを与えた場合、「ChatGPT」はタッチが異なる複数の画像を生成してくれるようです。

 それぞれの画像の中で、指の本数など少し不自然な部分は残りますが、全体として良質な画像が出力されたと感じます。

 それではBingに寄せるため「日本のアニメ調のイラストで」を追加してみます。

アニメ調の画像が生成されたBingに寄せるために追加のプロンプトを入力します。かなりBingで生成した画像に近いタッチの画像が生成されました

 またそれぞれタッチが少し異なる画像が出力されました。Bingで生成した左のイラストと、「ChatGPT」で出力した右側の画像は似たテイストを感じますね。やはり両者とも同じ「DALL-E3」を使っているため、ある程度似た画像を出力できます。

Bingと「ChatGPT」で出力した画像の比較

 次に正方形以外の画像生成にチャレンジしてみます。まずはBingからです。

「生成します」という回答が返ってきたものの、画像の生成は上手くいきませんでした

 「生成します」という回答が返ってきていますが、上手く生成することができませんでした。やはりこちらはまだ対応していないと判断して良さそうです。

 それでは「ChatGPT」版にも入力してみます。

1度出力した画像を縦長や横長に出力するのは苦手なようです

 何度か試したのですが、エラーが出てそもそも生成されないか、縦長ではあるのですが向きが異なる画像が出力されました。ですが最初から縦長、もしくは横長の画像で出力するように入力すると比較的上手くいきました。

最初から「縦長で」というプロンプトを入力すると上手くいくことが多かったです
横長の画像も同様で、最初に入力するのがコツのようです

 改めて画像を出力してみて「DALL-E3」の実力をかなり感じました。改めて画像生成AIの進化のスピードに驚かされるばかりです。

 Bingでも「ChatGPT」でも同等のクオリティの画像が生成できるので、商用利用を目的としている、また縦長・横長の画像を生成したい場合は「ChatGPT」版の「DALL-E3」を、商用利用目的ではない、正方形の画像で問題がない場合はBingという使い分けをするのが良さそうですね。