やじうまの杜
AIなのにCPUだけで動く! 無料のリアルタイムボイスチェンジャーで別人になってみたよ
軽量・低容量・低遅延のAIボイチェン「Beatrice」を試してみる
2024年7月30日 06:55
昨今は生成AIの台頭が止まりません。文章はもちろん、画像も、音楽も、動画もAIで生成されるようになっています。ボイスチェンジャーのジャンルでも、AIによる進化が著しいです。以前、紹介したRVCもその1つです。
そんなAIボイスチェンジャー界に新たな風を吹き込むのが、今回紹介する「Beatrice」です。Project Beatriceが開発する「Beatrice」は、CPUのみで動作する軽量なAIボイスチェンジャーです。多くのAIボイスチェンジャーはGPUを使用していることが多く、使用するにはある程度のスペックのゲーミングPCなどが必要で、誰でも気軽にと言うには難しい物でした。
一方で声自体にエフェクトをかける普通のボイスチェンジャーは、思い通りの声が自由に出せるような仕組みではありません。どちらにも一長一短があったのが、これまでのボイスチェンジャーの現状です。
「Beatrice」はそんなジレンマを解決する1つのソフトウェアになるかもしれません。
「Beatrice」は、VSTプラグイン形式のAIボイスチェンジャーです。最も大きな特徴は、その軽量さにあります。CPUシングルスレッドで動作するため、専用のハードウェアを必要とせず、一般的なパソコンでも快適に使用できます。さらに、約35MBという驚くほど小さなサイズとなっています。
また、低遅延も大きな魅力の1つです。開発元によると外部の録音機器による実測値で約0.05秒という速さを実現しており、リアルタイムでの音声変換もかなり違和感なく実現できるでしょう。私も、試してみたところソフトウェアのボイスチェンジャーで感じるような、体感できる遅延はありませんでした。また、無料で使用できるという点も、魅力的です。
気になった点としてはイントネーションが上手く表現できていない部分や、発音の表現が難しいかなという部分がありました。この辺りは発音する側が意識した方が良い部分かもしれません。
現在は「つくよみちゃんエディション」、「刻鳴時雨エディション」、「OLUNEエディション」の3つのエディションが公開されており、どれも無料で使用できます。エディションによっては、人を批判・攻撃することに使えない、特定の政治・宗教・思想に賛同したり、反対することに利用できないという規約があるので、必ず利用前に規約を確認してください。
本ソフトウェアは「VST」形式で配布されています。VSTとは、Virtual Studio Technologyの略で、デジタルオーディオの編集や加工を行うためのプラグイン規格です。VSTプラグインを使用するにはDAW(Digital Audio Workstation)ソフトウェアが必要ですが、無料で使えるソフトウェアも公開されています。例えば「Bandlab by Cakewalk」などを使ってみるのも良いでしょう。
なお、現在は「Beatrice 2」の開発が進んでおり、7月20日にβ版である「Beatrice Ver. 2.0.0-beta.0」が公開されました。イントネーションや発音の表現は大きくクオリティが上がっており、録音された音声を聞いても、筆者が実際に発音したものと大きく変わらない印象でした。もちろん、体感できる遅延はありません。まだβ版とのことですが、この先のアップデートでさらに性能が向上していくのだろうと思うと、期待が高まります。
そして実際に変換した声が下記になります。かなりのレベルで出力されていると言えるのではないでしょうか。
「Beatrice」は、軽量性と低遅延を両立したAIボイスチェンジャーとしての可能性を感じさせるソフトウェアです。特に、CPUのみで動作する点と、ファイルサイズが非常に小さい点は、幅広いユーザーにとって魅力的でしょう。
さらに、近い将来にトレーニング用のコードも公開される予定とのことで、より多様な声の変換が可能になりそうです。ぜひ、自分の声がリアルタイムで変化していく面白さを体験してみてください。
ところでっ!!
— wok! (@DannadoriYellow)July 20, 2024
このBeatrice v2について、大大大ニュースです!
なんと、近い将来トレーニング用のコードを公開することが予定されています。
この速度と品質のモデルを自分で作れるようになりますよーーー!
ゲームチェンジャーの予感しかしなくて笑ってしまう。#vcclient#beatricehttps://t.co/NWZmEWhtV9