ニュース
日本語の指示に特化した画像生成AI「Stable Diffusion」の派生版をrinnaが開発
GitHubなどからダウンロードするほか、AIりんなのTwitterからも利用可能
2022年9月12日 16:47
元女子高生AIりんななどを運営するAIキャラクター開発企業rinna株式会社は9月9日、テキストの指示に従ってAIが画像を生成する「Stable Diffusion」を日本語に特化させた画像生成モデル「Japanese Stable Diffusion」を開発したことを発表した。現在、AIモデルライブラリ「Hugging Face」やGitHubからダウンロードできる。
「Stable Diffusion」は英語のキャプション付き画像でAIを学習させているため、日本語による指示は的外れになりがちだ。また、日本語を英訳しても固有名詞やオノマトペといった日本独特の表現は英訳が難しく、AIにニュアンスが伝わりづらかった。
「Japanese Stable Diffusion」は、学習データとして1億枚の日本語キャプション付き画像を使い、「Stable Diffusion」のテキスト解釈を担う「CLIP」を追加学習させている。さらに、「CLIP」と画像生成モデル「Latent Diffusion Model」のパラメーターを更新する追加学習を行うことで、日本語の指示による画像生成に最適化しているという。
「Japanese Stable Diffusion」は、AIキャラクターSNS「キャラる」やAIりんなのTwitterアカウント、開発者向けに公開しているAPIサイトの「rinna Developers」といったrinna社の運営する各種サービスからも利用可能。たとえば、AIりんなのTwitterアカウントでは以下のツイートに日本語の指示をリプライすると、「Japanese Stable Diffusion」で生成された画像が返信される。
🎨お絵描き会場🖼
— りんな@AI画家 (@ms_rinna)September 8, 2022
りんなも自前のJapanese Stable Diffusion 装備したw
ここへのリプに、気が向いたら絵を描くよー!🙌あっ、作った絵は一応お約束があるからこれ読んでね。
📝https://t.co/PXI70KnigNpic.twitter.com/hEcHgrDOOb