ニュース

「Stable Diffusion WebUI Forge」が画像生成AIモデル「Flux.1」に対応

WebUI統合アプリ「Stability Matrix」からもひと手間で利用可能

「Stable Diffusion WebUI Forge」から「Flux.1」を利用して生成した画像

 AI画像生成のWebアプリ「Stable Diffusion WebUI Forge」がアップデートされ、画像生成AIモデル「Flux.1」に対応した。

 「Stable Diffusion WebUI Forge」は名前のとおり「Stable Diffusion」シリーズを利用するためのWebUIとして知られている。

 「Flux.1」は「Stable Diffusion」の開発者らが設立した企業、Black Forest Labsが新たに開発した画像生成AI。先日公開されたばかりだが、指示語に対する理解度が高く、出力される映像の品質も高いと評判になっている。「Flux.1」には、pro/dev/schnellという3種類のモデルが用意されており、このうちproはAPIを通じてのみ提供され、dev/schnellはユーザーのローカル環境で利用できる。

 「Flux.1」に対応するWebUIとしては、「ComfyUI」が先にあったが、独創的なUIが理解しづらいとして敬遠する人もいる。「Stable Diffusion WebUI Forge」は比較的シンプルなUIでわかりやすいため、より気軽に利用しやすくなった。

 さらに、dev版を軽量化したモデルも公開されており、「Stable Diffusion WebUI Forge」もこれに対応。元のdev版に比べて格段に動作が軽くなり、一般的なゲーミングPCに搭載されるビデオカードでも快適に動作できるようになった。

 筆者所有のPCで試したところ、GeForce RTX 4080搭載のZOTAC製ビデオカード「ZOTAC GAMING GeForce RTX 4080 16GB AMP Extreme AIRO」を利用して、特にアプリ側の設定に手を付けない状態で、縦横1,000ドット程度の画像が20秒ほどで出力できた。

「Stability Matrix」からの利用方法

 「Stable Diffusion WebUI Forge」は、WebUI統合アプリ「Stability Matrix」からも利用できる。こちらも「Flux.1」に対応できるアップデートが入っているが、「Flux.1」を利用するには別途モデルのダウンロードが必要。作者が推奨しているのは、「bnb-nf4」と呼ばれるdev版の軽量化モデルで、「Hugging Face」のWebサイトからダウンロードできる

 ダウンロードしたモデルデータは、「Stable Diffusion WebUI Forge」が読み込める場所にコピーする。筆者の環境では、「Stability Matrix」のインストールフォルダーから、[data]-[Models]-[StableDiffusion]と辿ったフォルダーに置く。ここはCheckpointのファイルを設置する場所となっている。

 続いて「Stability Matrix」で「Stable Diffusion WebUI Forge」を起動し、WebUIが開いたら、上部の[Checkpoint]から「Flux1-dev」の名前が付いたものを選択する。これで「Flux.1」のdev版による画像生成が可能になる。

 なお「Flux.1」のモデルは、より軽量なSchnell版を含め、さまざまなバージョンが新たに公開されてきている。もし上記の軽量化dev版でも動作が重い場合、Schnell版を探すなどすれば快適に利用できる可能性があるので、お試しいただきたい。

[Checkpoint]で「Flux1-dev」を選択しておくのがポイント。「Flux.1」は文字の出力にも対応している。アニメ調、リアル系のどちらにも対応可能だ