ニュース

「にじボイスAPI」が正式公開 ~入力テキストに応じて感情表現を変化、“空気を読んだ”音声生成が可能に

利用はプリペイド式、10,000文字あたり825円

「にじボイスAPI」が正式公開

 (株)Algomaticは12月11日、AIを活用した音声生成プラットフォーム「にじボイス」において、動画コンテンツ配信者向けに「にじボイスAPI」v1.0を正式公開した。アプリやサービスへの組み込み利用はプリペイド式で、1万文字あたり825円。初回特典として、新規登録アカウントには5,000文字分が無料で付与される。

「にじボイスAPI」の価格表

 「にじボイス」は、AIを活用した感情豊かな音声を生成するプラットフォーム。キャラクターを選択してテキストを入力することで、誰でも簡単に感情豊かな音声を生成することができる。2024年12月に正式リリースされ、ボイスパートナーへの収益還元を開始。生成対象の文字数に140字の制限がありながらも、約1カ月間での累積生成文字数は約3,000万文字規模に到達している。

 今回、正式公開された「にじボイスAPI」では、入力テキストに応じて自動的に感情表現を変化させるTTS(Text-to-Speech)機能を中心にAPIとして拡張。感情パラメーターを逐一設定する必要がないため、大規模コンテンツの制作においても、“空気を読んだ”音声生成を実現することが可能となり、ライブ配信や動画自動生成といった事前チェックが難しい場面においても、ユーザーに最適化した音声コンテンツをスピーディーに提供することができる。

 また、既存システムと連携したリアルタイムでの音声生成や、モバイルアプリやIoTデバイスなどのアプリケーションへの組み込みによる動的な音声生成に加えて、下記のような活用を促進するという。

  1. リアルタイム配信システムとの統合
    配信プラットフォームと連携し、コメントやコンテンツなどでのライブ情報に合わせて音声を生成し、より優れたコンテンツを提供
  2. 大規模コンテンツの効率化
    複数トラックへの一括での音声生成、字幕の自動音声化、研修コンテンツやマニュアルの音声生成など、音声を含む大規模なコンテンツ制作での生産性向上を実現
  3. 多彩なキャラクターによる高度な音声体験
    キャラクター情報取得APIを活用し、計100体の老若男女さまざまなキャラクター情報を参照可能。ユーザーの応答や利用状況に合わせて適切なキャラクターを選択し、より深い没入感のある音声体験を実現

 「にじボイスAPI」を試すには、にじボイスAPIの管理画面にログインしてAPIキーを取得し、APIリファレンスからAPIの種類と利用方法を把握して利用すればよい。ボイス一覧のコピーボタンから、各キャラクターのIDをコピーすることができる。

 なお、生成された音声を使用したコンテンツ内、もしくは、コンテンツ概要欄のいずれかには「にじボイス」または「NIJI Voice」が含まれるクレジットを記載する必要がある。

「にじボイスAPI」APIリファレンスの画面