ニュース

Stability AIが「Stable Diffusion 3」を発表 ~テキスト入り画像の生成を改善

先行プレビューのウェイティングリスト登録を受付開始

プロンプト「Epic anime artwork of a wizard atop a mountain at night casting a cosmic spell into the dark sky that says "Stable Diffusion 3" made out of colorful energy」で生成した画像

 英Stability AIは、画像生成AI「Stable Diffusion」の最新版「Stable Diffusion 3」を2月23日に発表し、先行プレビューのウェイティングリスト登録を受付開始した。従来のバージョンと比べて、複数の主題(被写体)のプロンプト入力、画像の品質、スペリング能力が向上している。

パラメータ数の向上

 「Stable Diffusion 3」は、800Mから8Bまでの幅広いパラメータ数を選択できる。拡張性の面でもニーズに合わせた柔軟なモデル構築を実現し、従来よりも高品質な画像生成や特定の用途に適した開発が可能になる。

テキストを埋め込んだ画像の生成

「Stable Diffusion 3」で生成した画像(画像内に文字を含む)

 従来モデルでは困難だった、文字を含む画像の生成に対応した。

拡散トランスフォーマー・アーキテクチャとフロー・マッチング

Stable Diffusion3で生成した画像

 「Stable Diffusion 3」は、拡散トランスフォーマー・アーキテクチャとフロー・マッチング技術を組み合わせて利用しているという。Stability AIは近日中に詳細な技術レポートを発表する予定。今後、性能と安全性の検証と向上を進め、早期公開を目指すとしている。