ニュース
NovelAIが最新画像生成AIモデル「NovelAI Diffusion V4 Full」を公開
生成画像の複雑なプロンプトやマルチキャラ生成に対応
2025年3月10日 06:45
米Anlatanは3月1日、同社が提供している画像・ストーリー生成AIサービス「NovelAI」において、最新の画像生成モデル「NovelAI Diffusion V4 Full」を公開した。利用には、新しい決済システムへの移行が必須となっているが、請求や支払いのスケジュールは変更されない。また、手動で更新した場合には、クレジットカードなら5,000Anlas、PayPalは2,000Anlasが進呈される。
今回のモデルは、現在提供されている「NovelAI Diffusion V4 Curated」に1カ月分の学習データが追加され、約23万時間分のH100コンピューティングリソースが使用されている。今回のモデルで追加された機能は以下の通り。
自然言語のプロンプトでの生成が可能に
自然言語のプロンプトは最優先機能としてサポートされており、英語でシーンを描写可能。テキストの理解力が大幅に向上し、プロンプトの文脈サイズを512トークンに拡張、CLIPテキストエンコーダーをT5テキストエンコーダーに置き換えたことで、より詳細な説明文での画像生成が可能になった。
各キャラクターを個別に指定できるマルチキャラクタープロンプト機能
マルチキャラクタープロンプト機能では、1つの画像に最大6人のキャラクターを同時に配置でき、各キャラクターのプロンプトやポジションを個別に指定することが可能。また、アクションタグを使用することで、“誰が誰を抱きしめているか”、“誰が誰に話しかけているか”などキャラクター間のやりとりも指定できる。
キャラクターの画像を保存し、ドラッグ&ドロップしてキャラクタープロンプトもインポートできる。
画像の一部分を高画質に修正できる機能
画像の一部を高画質に修正できる機能も追加され、修正したい部分を選択して[生成ボタン]を押すことで修正が可能。選択した部分は、自動的に拡大されるため細部まで調整することができる。ほかにも、画像の鮮明さや詳細な画像の生成が可能になった。