生成AIストリーム

GPUなしでもできる画像生成AI ~Web UI「A1111」の環境構築と利用方法を伝授

広告フォトを作ってみよう

 画像生成AIの市場拡大に伴い、画像生成サービスやプラットフォームが次々と増加しています。画像生成を利用してみたいとは思っているものの、料金体系や機能、要求されるPCのスペックなどに戸惑いなかなか前に進めていない方もいるかもしれません。

 そんな読者に向けて、「Stable Diffusion」と付き合いが長い筆者として『画像生成AI Stable Diffusionスタートガイド』という書籍を執筆しました。今回はこの書籍で解説している「AUTOMATIC1111/Stable Diffusion WebUI」(以下「A1111」)の内容を凝縮してお届けしつつ、この新年度の時期に需要がありそうな「広告ビジュアル作成」という身近で社会的な関心も高いテーマに沿って進めてみます。

AUTOMATIC1111 で画像を生成している様子

 GPU搭載PCがなくても、画像生成AIの初心者でも今すぐ始められる「A1111」を使って、社内や学校のサークルや募集などにバエる画像を作ってください! 今回は「A1111」の導入方法と基本的な使い方を解説していきます。

完成画像

 まずは、完成した画像をお見せしましょう。

最終成果物(1) 1人の女性の唇の赤色にフォーカスしたビジュアルが印象的な口紅の広告
最終成果物(2) 3人の丸眼鏡をかけた今風のファッションの女性が特徴的な眼鏡の広告

AUTOMATIC1111とは

 「A1111」とは、Stability AI社が開発している画像生成AI「Stable Diffusion」をWebブラウザーで操作するために開発されたWeb UIです。オープンソースで開発されており、GitHubで公開されているプログラムを実行することで誰でも無償で利用することができます。

 「A1111」はローカルでも実行できますが、Google Colaboratory(以下Colab)で使用できるスクリプトがいくつか開発、公開されています。Colabを使用することで、GPUなどを搭載していないPCでも月1,179円(2024年4月現在)で「Stable Diffusion」を使用することができます。

 今回はTheLastBen さんが開発したスクリプトをもとに、筆者が日本語解説や設定を加えた開発したスクリプトを使用していきます。これは広告用画像を生成するために実写系の画像を生成するモデルを自動でインストールするように作られており、実行するだけですぐに写真のような画像が生成できるようになっています。

A1111を起動しよう

まずはColabで「A1111」を起動しましょう。以下に掲載した先ほどのスクリプトへのリンク

https://j.aicu.ai/SDPH

をクリックしてください。すると筆者のGitHubが開きます。

 すると[Preview]画面の左に、[Open in Colab]ボタンが表示されます。ここをクリックすると、Colabでこのノートブックが開きます。

[review]画面の[Open in Colab]ボタン

 Colabの画面に移動できたら、[ドライブにコピー]をクリックして自分の「Google Drive」にノートブックをコピーしましょう。この作業を忘れても問題はありませんが、実行結果を残すために、自分のドライブに保存した方のノートブックを使用することをおすすめします。

[ドライブにコピー]をクリック

 次にランタイムに接続し、実行していきますが、ここでは有料のプランへの加入が必要なので、加入していない場合は加入しましょう。

 推奨はColab Proプラン月間100コンピューティングユニット、月額1,179円)です。1カ月で解約することもできるので、気軽に始めてみることができます。なお、今回の用途ですと、会社のアカウントよりは個人のアカウントがリスク管理上、オススメかもしれません(「Google Drive」内にたくさんのファイルが生成されます)。

Colabのプラン一覧

 加入したら、[Connect Google Drive]から[Start Stable-Diffusion]までのセルの左上にある矢印を上から順番にクリックし、セルを実行していきます。

セルの左上にある矢印を上から順番にクリック

 実行すると、Google アカウントへのアクセス許可を求めるウインドウが表示されるので、確認して接続を許可します。

Google アカウントへのアクセス許可を求めるウインドウで接続を許可

 今回の記事では「ControlNet」は使用しないため、[ControlNet]のセルは実行しなくても問題ありません。使ってみたい読者さんでストレージ容量が21GB増えてもよい人はv1_modelのプルダウンで[All(21GB)]を選んでください。ダウンロード自体はGoogleのコンピューターなのでとても高速に完了します。

[ControlNet]のセルは実行しなくてもよい

 最後のセル[Start Stable-Diffusion]までの実行が全て終わると、実行結果にURLが表示されます。
「https://○○○○.gradio.live」と表示されているハイパーリンクがあれば成功です。

「https://○○○○.gradio.live」と表示されているハイパーリンクがあれば成功

 これが起動した「A1111」に世界中のインターネットからアクセスできる48時間有効なURL です。これをクリックすると、「A1111」のWeb UIが開きます。これで起動は終了です。万が一、インストール中に不具合があっても該当のセルの実行を停止し、エラーなどをChatGPTなどでをみて確認して再度実行ボタンを押せば解決できる事が多いです。

「A1111」のWeb UI

画像を生成しよう

 早速画像を生成してみましょう。このスクリプトではあらかじめ画像生成モデル「yayoi_mix」をインストールしています。画像生成モデルとは、画像生成AIにおける脳に当たる巨大なcheckpointファイルのことです。

 「yayoi_mix」は、こたじろうさん(@AiCreatorS1881)さん開発の「Stable Diffusion 1.5」系のモデルで、日本風の顔立ちをした女性を生成するのが得意なモデルになっています(ライセンスはこちら)。作者の支援はこちらから。

 画像を生成するには、Web UI上部の[Prompt]欄に、生成してほしいものを英単語、英文で入力します。

「yayoi_mix」がインストールされている

 まずは、女性を1人生成してみましょう。[Prompt]に「1girl」と入力し、画面右のオレンジ色の[Generate]ボタンをクリックします。

[Prompt]に「1girl」と入力し、[Generate]ボタンをクリックした結果

 右下に画像が生成されました。生成した画像は画像右上のダウンロードアイコンでPCにダウンロードできるほか、ドライブにも自動で保存されています。

 PCに保存する場合は以下の画像で囲った下向きの矢印のアイコンをクリックします。

下向き矢印のアイコンで画像をダウンロードできる

 ドライブでは、[マイドライブ]の[sd]-[stable-diffusion-webui]-[output]-[txt2img-images]-[(日付)]のフォルダーに格納されています。Colab 上の画面でも確認ができます。

生成した画像は[sd]-[stable-diffusion-webui]-[output]-[txt2img-images]-[(日付)]フォルダーに保存される

 画面右のフォルダーアイコンをクリックしてドライブのファイルを確認できます。画像ファイルはダブルクリックで表示できます。

「A1111」の各種設定を確認しよう

 基本的な画像の生成方法がわかったので、次は画像サイズ等の基本的な設定を確認していきましょう。主な機能は[Generation]タブにあります。初心者が覚えておきたい機能は以下の通りです。

「A1111」の主なユーザーインターフェイス

①Prompt
生成したいものを英語で入力します。
例「1girl」

②Negative Prompt
プロンプトの逆で、生成したくないものを入力します。
例「worst quality, normal quality, bad finger, cross finger, ugly, NSFW」

③Width, Height
生成する画像の縦横サイズを設定します。単位はpixelです。YayoiMixはSD1.5系なので横幅を伸ばすなら768×512や1,024×512といった512ピクセルの倍数を設定するとよいでしょう。SDXL系は1,024×1,024から開始すると高画質高品質の結果を得ることができます。

④Batch count&Batch size
Batch countでは1度に生成する画像の枚数を設定します。最大100枚まで指定できます。
Batch size では並行して生成する画像の枚数を指定します。クラウドGPUを利用するなど大容量のVRAMを使えるとき以外は基本的に1枚を指定します。

⑤Generate
生成を開始します。右クリックすると「Generate forever」、繰り返し無限に生成するというオプションが選択できます。

⑥生成された画像が表示されます。プレビュー、PCへのダウンロードを行います。

春ファッションの広告画像を生成した

 筆者は春ファッションが好きなので、こんな感じのプロンプトを打ち込んでいきます。

masterpiece, best quality, cinematic lighting, intricate composition,looking at viewer, 2 girls, cheek, earrings, short bob cut, thin arm around glasses, beret, summer muffler, blue brown contact lens, catch light on the eyes, pink lips, fingernails
ネガティブプロンプト:worst quality, normal quality, bad finger, cross finger, ugly, NSFW

結果はGoogle Drive上に生成される。眼福です。

 この他にも「A1111」にはたくさんのオプションやできることがあるので、もっと深く学んでみたいという方は、書籍『画像生成 AI Stable Diffusion スタートガイド』を参考にしてみてください。

 後編では、実際に広告として使用できるようなハイクオリティな画像を生成していきます。

広告写真フォトグラファーになったつもりでいろんなショットを撮影していきましょう

まとめ

 以上、GPUなしでもできる画像生成AI Stable Diffusion 「AUTOMATIC1111 WebUI」のはじめかたについて紹介しました。

 より深めていきたい方々には3月29日に発売されたばかりの書籍「画像生成AI Stable Diffusion スタートガイド」がおすすめです。