ニュース

NovelAIが最新画像生成AIモデル「NovelAI Diffusion V4 Full」を公開

生成画像の複雑なプロンプトやマルチキャラ生成に対応

「NovelAI Diffusion V4 Full」が公開

 米Anlatanは3月1日、同社が提供している画像・ストーリー生成AIサービス「NovelAI」において、最新の画像生成モデル「NovelAI Diffusion V4 Full」を公開した。利用には、新しい決済システムへの移行が必須となっているが、請求や支払いのスケジュールは変更されない。また、手動で更新した場合には、クレジットカードなら5,000Anlas、PayPalは2,000Anlasが進呈される。

 今回のモデルは、現在提供されている「NovelAI Diffusion V4 Curated」に1カ月分の学習データが追加され、約23万時間分のH100コンピューティングリソースが使用されている。今回のモデルで追加された機能は以下の通り。

自然言語のプロンプトでの生成が可能に

 自然言語のプロンプトは最優先機能としてサポートされており、英語でシーンを描写可能。テキストの理解力が大幅に向上し、プロンプトの文脈サイズを512トークンに拡張、CLIPテキストエンコーダーをT5テキストエンコーダーに置き換えたことで、より詳細な説明文での画像生成が可能になった。

自然言語のテキストによるプロンプトの理解力が大幅に向上

各キャラクターを個別に指定できるマルチキャラクタープロンプト機能

 マルチキャラクタープロンプト機能では、1つの画像に最大6人のキャラクターを同時に配置でき、各キャラクターのプロンプトやポジションを個別に指定することが可能。また、アクションタグを使用することで、“誰が誰を抱きしめているか”、“誰が誰に話しかけているか”などキャラクター間のやりとりも指定できる。

各キャラクターのプロンプトやポジションを個別に指定できる

 キャラクターの画像を保存し、ドラッグ&ドロップしてキャラクタープロンプトもインポートできる。

画像の一部分を高画質に修正できる機能

 画像の一部を高画質に修正できる機能も追加され、修正したい部分を選択して[生成ボタン]を押すことで修正が可能。選択した部分は、自動的に拡大されるため細部まで調整することができる。ほかにも、画像の鮮明さや詳細な画像の生成が可能になった。

画像の一部を高画質のまま修正できる

テキストレンダリング機能が追加

 生成画像にテキストを配置することができ、英語の自然言語を使用することで、スタイルや配置の指定も可能。ほかにも、デフォルトの品質タグに「no text」タグが追加され、プロンプトで指定したテキストには影響を与えず、不必要なテキストを生成から除外する。

生成された画像にテキストの配置が可能

 今後は「Vibe Transfer(バイブストランスファー)」の機能も追加される予定。