ニュース

OpenAI、画像生成モデル「GPT Image 1.5」を発表 ~「ChatGPT」に写真加工ページも

従来より最大4倍の速さ、ディテールを保ったまま指示通りに画像の生成・編集

「ChatGPT Images」(chatgpt.com/images/)。新しい画像生成モデルのフラグシップ「GPT Image 1.5」が用いられている

 米OpenAIは12月16日(現地時間)、新しい画像生成モデルのフラグシップ「GPT Image 1.5」を発表した。「ChatGPT Images」(chatgpt.com/images/)のバックエンドとして採用されており、ディテールを保ったまま指示通りに画像の生成・編集が行えるほか、生成速度も最大4倍にまで高められているという。

 「GPT Image 1.5」の特徴は、ライティングや構図、人物の外見といった重要な要素はそのまま、ユーザーの意図に即した画像の生成・編集を行う点だ。複数の人物や動物の写真を被写体の特徴を保ったまま合成して新たな写真を作り出したり、さらにその背景だけ差し替えたり、レトロアニメなスタイルに変更したり、みんなに同じ服を着せたりできる。

 テキストやレイアウトなどの要素だけを変更することもできるので、映画のポスターやファッション広告のようにしてほしいといった要望にも応えてくれる。テキストレンダリングの精度も向上しており、写真に写った新聞のような、より密度が高く小さなテキストも処理できる。

 もしプロンプト(指令文)を考えるのが苦手でも、「ChatGPT」(chatgpt.com)アプリに新設された[画像]セクション(ChatGPT Images)ならば、プリセットされたスタイルを適用して画像生成を楽しめる。『私がK-POPスターだったら、どんな感じ?』などのおすすめのプロンプトを試してみてもよいだろう。「ChatGPT Images」は複数の画像を並行して生成できるので、待ち時間中に新しいプロンプトを試すこともできる。

『私がK-POPスターだったら、どんな感じ?』というプリセットを実行。長いプロンプトが実行される
完成。「ChatGPT Images」は複数の画像を並行して生成できるので、待ち時間中に新しいプロンプトを試すこともできる

 「GPT Image 1.5」モデルを活用した「ChatGPT Images」は、同日よりすべての「ChatGPT」ユーザーへ段階的に展開される。

 API経由でも利用可能で、入出力は「GPT Image」モデルより20%安価だ。同じ予算でも「GPT Image 1.5」の方がより多くの画像を生成できる。なお、企業向け(Business/Enterprise)は後日提供される。