ニュース

商用可・無料のAI音声読み上げツール「VOICEVOX」v0.12はテキストでキャラのスタイル指定が可能に

イントネーションをリセットする機能や全テキストを繋げて書き出す機能も

「VOICEVOX」v0.12.1

 好みのキャラクターにテキストを読み上げさせられる音声合成ツール「VOICEVOX」の最新版v0.12.1が5月31日に公開された。最新版では、起動が大幅に高速化したほか、セリフを記述したテキストでキャラクターのスタイルを指定できるようになった。

スタイル名が指定されたTXTファイルを読み込み可能に

 テキスト上のセリフ冒頭に「[キャラクター名]([スタイル名]),」の書式でキャラとスタイルを指定することで、キャラの「あまあま」や「セクシー」といったスタイルを指定可能。これにより、外部のテキストエディターなどで作成した台本でも、声の雰囲気を変えたバリエーション豊かな演出が行なえるだろう。

 また、[ファイル]メニューに[テキストを繋げて書き出し]コマンドを追加。キャラ名とスタイルを指定した状態で、全テキスト欄の文章を一括してテキストファイルへに書き出すことができる。これらにより、テキストファイルにキャラクターのスタイル情報まで含めてエクスポート・インポート可能になった。

 さらに、書き出されるファイル名の書式をユーザーが自由にカスタマイズできる機能も追加された。[設定/オプション]画面から開ける[書き出しファイル名パターン]ダイアログで、「$連番$」や「$スタイル$」といったタグを指定することで利用可能。

ファイル名のカスタマイズ機能を追加
キャラ名とともに全テキスト欄の文章を一括して書き出す機能も

 そのほか、イントネーションのリセット機能も追加されている。リセット機能は初期設定で、[Ctrl]+[G]キーを押すと全体のイントネーションを、[R]キーを押すと選択中の語句のイントネーションをリセット可能。万が一、不自然なイントネーションになってしまったときに使用してみるといいだろう。

イントネーションリセットのキー割り当て

 なお、現在の最新版v0.12.1では、GPU版で正しく音声合成できない不具合が報告されているとのこと。また今回より試験的に、AMD製のGPUでも高速に動作するDirectML版の配布も開始されている。

 「VOICEVOX」は、手軽にAI技術を活用した音声合成を利用できるツール。有償ツールほどの機能は持たないが、誰でもすぐに扱えて簡単なイントネーションなどの調整まで行なえる柔軟性を持つ。商用・非商用を問わず無料で利用可能で、ライセンスは「LGPL v3」(キャラクターに関してはそれぞれのライセンスに準拠)。

 対応OSはWindows/Mac/Linuxで、編集部にてWindows 10で動作確認した。現在、公式サイトからダウンロード可能。なお、ZIP版の展開後のサイズが1GB近くあるので、ダウンロード先やインストール先の容量に注意してほしい。

ソフトウェア情報

「VOICEVOX」
【著作権者】
Hiroshiba Kazuyuki 氏
【対応OS】
Windows/Mac/Linux(編集部にてWindows 10で動作確認)
【ソフト種別】
フリーソフト
【バージョン】
0.12.1(22/05/31)