生成AIストリーム

AI画像生成の新時代! 「Stability Matrix」で最新の画像生成を体感せよ!

「Stability Matrix」で最新の画像生成を体感せよ!

 画像生成AI「Stable Diffusion」の環境構築、面倒だと思っていませんか? 生成AIの進化を日々調査している「生成AIストリーム」ですが、「Stable Diffusion」の公開から16ヶ月。世界中のオープンソースコミュニティで日々多様に進化する関連ツールに、高速化や動画といった要素が加わり、そろそろ常識が根底から置き換わりつつあります。

 今回の「生成AIストリーム」は、そんな「新時代」にそなえて、「画像生成の各種ツール(Webで使えるユーザーインタフェイスなので以下総称して「WebUI」と呼びます)を環境構築なしで使える「Stabillity Matrix」を紹介しておきたいと思います。

まずは「Stability Matrix」をオススメしたい

 5月のこちらの記事では便利なインストーラー「A1111-Web-UI-Installer」を紹介してきたのですが、現在は開発終了してしまいました。残念です。

 そこで2023年12月現在、生成AIを始める方にも、いままで触ってきた方にも最高におすすめしたいツールは「Stability Matrix」です。

GitHubのページ

 なお、今回の記事では『高価なGPUがないからなあ……』という方も、なんとかなる!かもしれない情報についても紹介していきます。NVIDIAのGPUがない環境では難度が少しだけ高いですが、不可能という程ではなくなってきています。

「Stability Matrix」とは

 「Stable Diffusion」を中心とするAI画像生成ための各種「WebUI」を「Python」や「GitHub CLI」「GitHub Desktop」などのインストール不要で環境構築できるオープンソースプロジェクトです。つまりプロの開発者でも面倒だったPythonのバージョン管理を気にする必要がありません。なお「Stable Diffusion」を作ったStability AI社とは関係がないそうです。

 「AUTOMATIC1111」や最近話題の「ComfyUI」、「Foocus」といった「Stable Diffusion」での画像生成を高度に利用できる各種WebUIを無料で、日本語化されたUIで利用できる。しかもクリックだけで知識不要、迷うことなくインストールできるという手軽さ。それだけでなく、常に最新のモデルを追いかけているようなプロフェッショナルな方々にも利便性があります。

 巨大なファイルだったAIモデル(checkpointファイル)を各WebUI間で共通管理でき、同様に「LoRA」、「LyCORIS」・「VAE」・「Embedding」なども各WebUI間で共通管理することで、ディスクの容量やダウンロード時間を節約できます。「CivitAI」を使ったモデルのブラウズ、ドラッグ&ドロップでローカルのモデルを利用できるように統合されており、しかも「Stability Matrix」のシステム自身のアップデートも簡単にできるのが魅力的です。

 公式にサポートしている主なWebUIパッケージは以下の通りです。

  • Automatic1111:世界で最も使われているStable DiffusionのWebUI
  • Fooocus:Midjourneyのようなシンプルさと高画質を追求したWebUI
  • VoltaML:美しいUIと速度・カスタマイズ性、CPUでの動作が魅力。
  • InvokeAI:タブレット環境、イラストや広告素材などプロ向けレタッチ作業にオススメ
  • ComfyUI:最近登場した高速でノードベースのWebUI
  • kohya_ss:@kohya_tech氏(日本人!)が開発したファインチューニングのためのツール集「sd-scripts」がbmaltais氏によって使いやすくまとめられたWebUI
公式にサポートしている主なWebUIパッケージ

 更新頻度も速く、これからも数多くの魅力あるパッケージがサポートされていくものと予想します。

「Stability Matrix」のインストール

 GitHubで最新のインストーラーが公開されています。

Releases · LykosAI/StabilityMatrix

 こちらのリリースページから最新インストーラーをダウンロードしましょう。本稿執筆時点ではv2.6.7が最新のようです。Windows版「StabilityMatrix-win-x64.zip」をダウンロードして展開すると「StabilityMatrix.exe」というファイルが1つ存在しますのでダブルクリックして実行しましょう。「Windows Defender」の警告が表示される場合がありますが、そのまま実行しても問題ありません。

怖い画面だけど大丈夫

 [詳細情報]をクリックして[実行]ボタンを押せばインストーラーが起動します。

[詳細情報]をクリックして展開
[実行]ボタンを押す
インストーラーの画面

 使用許諾契約書を確認し、[続ける]を選択して次に進みましょう。

 次に、「Stability Matrix」のインストール先を選択します。権限があって自分のわかりやすい場所でよいです。

「Stability Matrix」のインストール先を選択

 ここで[Portableモード]にチェックを入れておきます。Portableモードではすべてのデータと設定はアプリケーションと同じフォルダーに保存されます。その中にある「Data」フォルダーにすべてがまとまりますので、別のフォルダー(例えばUSBメモリやSDカード)や、別のコンピューターへ簡単に移動できるようになります。

[Portableモード]にチェック

 「Stability Matrix」のインストールが完了したら実行しましょう。

[インストール]ボタンを押せばインストールが開始される

 ここまでの日本語化もかなり行き届いており、特に難しい知識は必要ありません。なにか不具合があった時はアンイストールもすぐにできますし、環境変数にも触れないのでPython環境を破壊することもありません。

元祖「AUTOMATIC1111」のインストールがクリックひとつで簡単に

 まずは例として定番・元祖の「AUTOMATIC1111/stable-diffusion-webui」(通称:AUTOMATIC1111)をインストールしてみましょう。

 先ほどの画面右のUIのリストから、[Stable Diffusion WebUI By AUTOMATIC1111]を選択し、緑色の[インストール]ボタンをクリックします。ダウンロードとセットアップに数十分はかかりますので、おまかせしてしばらく待ちましょう。

[Stable Diffusion WebUI By AUTOMATIC1111]を選択(①)して[インストール]ボタンを押す(②)
インストールが開始される

 起動できない時は、「Launch(起動)」の横にあるギアアイコンで起動オプションを見直すことで、GPUメモリが小さい環境などでも起動できるようになっています(例えばVRAM項目の[--lowvram]にチェックを入れます)。特に最近は、セキュリティ上の問題として生成AIのWebUIで広く使われている「Gradio」でのリモート・コード実行エクスプロイトがあり、企業内のネットワークや会社管理のPC環境では実行できない可能性がありますので[Extra Launch Arguments]の「--share=True」は削除しておきましょう。

[Extra Launch Arguments]の「--share=True」は削除しておく

エクスプロイトへの警告

「窓の杜」をお気に入りのモデルで生成してみました
モデル「blue_pencil-v9b」にて「A lady in Santa suit standing in a forest of windows, looking back, backlighting 」で生成

 拡張機能のインストール、パス指定に若干の不具合が存在しますが、既存の「Automatic1111」のインストールの大変さ(Python環境やGitHubのインストール)に比べればなんということはありません。既存ユーザーであれば特に困ることは無いはずです。

 「Autmatic1111」についての詳細は今回割愛して、次回は魅力的なWebUIを紹介していきます。