ニュース

Stability AI、画像生成AIの新モデル「Stable Diffusion 3.5」を発表

「Stable Diffusion 3 Medium」の反省をもとに、時間をかけて開発

「Stable Diffusion 3.5」で出力された画像

 英Stability AIは10月22日(現地時間)、「Stable Diffusion 3.5」を発表した。比較的寛容な「Stability AI Community License」のもと、商用・非商用を問わず無料で利用できる。

 「Stable Diffusion 3.5」は、同社の画像生成API「Stable Diffusion」の最新モデル。6月に「Stable Diffusion 3」シリーズで初めてオープンリリースされた「Stable Diffusion 3 Medium」が期待に応えたものではなかったことを反省し、急場しのぎの修正ではなく、時間をかけて開発が行われたという。

 「Stable Diffusion 3.5」には複数のバリエーションが含まれており、いずれも「Hugging Face」から入手可能。「Stability AI API」をはじめ、各種AIプラットフォームでも提供される。

  • Stable Diffusion 3.5 Large:80億のパラメーター、「Stable Diffusion」でもっとも強力
  • Stable Diffusion 3.5 Large Turbo:「Large」をコンパクトにし、わずか4ステップで高品質な画像を生成。スピードを重視する用途に
  • Stable Diffusion 3.5 Medium:25億のパラメーター、コンシューマー向けのハードウェアで「すぐに使える」ように設計

 なお、「Stable Diffusion 3.5 Medium」のみ、少し遅れて10月29日にリリースされるとのこと。

性能の比較

 モデルの開発にあたっては、カスタマイズ性が重視されている。そのため、異なるシードを用いた同じプロンプトでも、出力に比較的大きなばらつきが生じる可能性があるが、これは意図的なものだという。また、長大なプロンプトを書かなくても多様なアプトプットが可能で、たとえば人を出力するときも特定の特徴を持つ人ばかり出力されるということはない。3D、写真、絵画、線画など、幅広いスタイルにも対応する。

長大なプロンプトを書かなくても多様なアプトプットが可能。3D、写真、絵画、線画など、幅広いスタイルにも対応する

 なお、営利目的の場合、無料で利用できるのは年間収益100万米ドルまでだ。それ以上の場合、エンタープライズライセンスの問い合わせが必要となる。