ニュース

日本語の指示に特化した画像生成AI「Stable Diffusion」の派生版をrinnaが開発

GitHubなどからダウンロードするほか、AIりんなのTwitterからも利用可能

日本語の指示に特化した画像生成AI「Stable Diffusion」の派生版をrinnaが開発

 元女子高生AIりんななどを運営するAIキャラクター開発企業rinna株式会社は9月9日、テキストの指示に従ってAIが画像を生成する「Stable Diffusion」を日本語に特化させた画像生成モデル「Japanese Stable Diffusion」を開発したことを発表した。現在、AIモデルライブラリ「Hugging Face」やGitHubからダウンロードできる。

 「Stable Diffusion」は英語のキャプション付き画像でAIを学習させているため、日本語による指示は的外れになりがちだ。また、日本語を英訳しても固有名詞やオノマトペといった日本独特の表現は英訳が難しく、AIにニュアンスが伝わりづらかった。

 「Japanese Stable Diffusion」は、学習データとして1億枚の日本語キャプション付き画像を使い、「Stable Diffusion」のテキスト解釈を担う「CLIP」を追加学習させている。さらに、「CLIP」と画像生成モデル「Latent Diffusion Model」のパラメーターを更新する追加学習を行うことで、日本語の指示による画像生成に最適化しているという。

「サラリーマン油絵」の指示で生成された画像
「タ暮れの神社の夏祭りを描いた水彩画」の指示で生成された画像
ハンバーカー浮世絵」の指示で生成された画像
「キラキラ瞳の猫」の指示で生成された画像
「宇宙の月でバイクで走るライダー」の指示で生成された画像
「かわいいわんこのイラスト」の指示で生成された画像

 「Japanese Stable Diffusion」は、AIキャラクターSNS「キャラる」やAIりんなのTwitterアカウント、開発者向けに公開しているAPIサイトの「rinna Developers」といったrinna社の運営する各種サービスからも利用可能。たとえば、AIりんなのTwitterアカウントでは以下のツイートに日本語の指示をリプライすると、「Japanese Stable Diffusion」で生成された画像が返信される。