やじうまの杜
「ChatGPT」と「Bing」の生成AI「DALL-E3」はどこが違う? 試してみた
機能と可用範囲で差
2023年11月2日 06:55
米OpenAIが10月19日(現地時間)、「ChatGPT」で「DALL-E3」を使った画像生成機能を開放しました。現在、この機能が利用できるのは「ChatGPT Plus」もしくは「ChatGPT Enterprise」を利用しているユーザーだけとなっています。
「DALL-E3」はOpenAIによって開発されたAIモデルで、テキストの記述から画像を生成できます。
10月3日にはMicrosoftが提供している「Bingチャット」、そして「Bing イメージクリエーター」では「DALL-E3」が利用できるようになっていましたが、いよいよ「ChatGPT」からも「DALL-E3」が使えるようになったというわけです。
ですが、この両者は細かい点がいくつか異なります。
最も大きな違いとして、Bing版は商用利用不可、「ChatGPT」版は商用利用が可能であることが挙げられます。
そのため個人的に使用するイラストやイメージ画像を生成する場合は無料で利用できるBingの方に軍配があがりますが、商用利用まで考えると企業ユース向けの「ChatGPT Enterprise」、もしくは月額20米ドルを支払う有料サービスの「ChatGPT Plus」を使う必要があります。
またアスペクト比の変更ができるのも「ChatGPT」の特徴です。正方形に加え、1,792x1,024ピクセルの横長、1,024×1,792ピクセルの縦長が選べますが、Bingは正方形のみです。
それでは早速それぞれを使って画像を生成したので見ていきましょう。
Bingも「ChatGPT」もプロンプト次第で似たような画像が生成可能。「ChatGPT」の方が柔軟か
できるだけ差ができないように最初に入力するプロンプトは同じテキストを使います。
まずは先に公開されたBingの方を見ていきます。
特にタッチや画風などは指定していませんが、アニメ調の画像が出力されました。
続いて全く同じプロンプトで「ChatGPT」で生成してみます。
こちらは実写に近い画像と、イラスト風の2種類の画像が生成されました。何度か試してみたのですが、大雑把なプロンプトを与えた場合、「ChatGPT」はタッチが異なる複数の画像を生成してくれるようです。
それぞれの画像の中で、指の本数など少し不自然な部分は残りますが、全体として良質な画像が出力されたと感じます。
それではBingに寄せるため「日本のアニメ調のイラストで」を追加してみます。
またそれぞれタッチが少し異なる画像が出力されました。Bingで生成した左のイラストと、「ChatGPT」で出力した右側の画像は似たテイストを感じますね。やはり両者とも同じ「DALL-E3」を使っているため、ある程度似た画像を出力できます。
次に正方形以外の画像生成にチャレンジしてみます。まずはBingからです。
「生成します」という回答が返ってきていますが、上手く生成することができませんでした。やはりこちらはまだ対応していないと判断して良さそうです。
それでは「ChatGPT」版にも入力してみます。
何度か試したのですが、エラーが出てそもそも生成されないか、縦長ではあるのですが向きが異なる画像が出力されました。ですが最初から縦長、もしくは横長の画像で出力するように入力すると比較的上手くいきました。
改めて画像を出力してみて「DALL-E3」の実力をかなり感じました。改めて画像生成AIの進化のスピードに驚かされるばかりです。
Bingでも「ChatGPT」でも同等のクオリティの画像が生成できるので、商用利用を目的としている、また縦長・横長の画像を生成したい場合は「ChatGPT」版の「DALL-E3」を、商用利用目的ではない、正方形の画像で問題がない場合はBingという使い分けをするのが良さそうですね。