ニュース

OpenAI、ChatGPT向け「GPT-4o」ベースの高度なボイスモードをリリース延期

アルファ版のローンチ基準に達するまでもう1カ月必要に

「GPT-4o」ベースの高度なボイスモードがリリース延期に

 米OpenAIは6月26日、AIチャットボット「ChatGPT」において、最新AIモデル「GPT-4o」をベースとした高度なボイスモード(advanced Voice Mode)のアルファ版リリースを、当初予定していた6月下旬より延期すると発表した。同社のローンチ基準に到達するまでにはあと1カ月かかるとしている。



 新たに提供される予定の高度なボイスモードは、「GPT-4o」のお披露目の場となった、今年2024年5月に実施された発表イベントにて予告されたもの。ボイスモードはすでに全ユーザーが利用可能な機能ではあるが、今回のモードでは、感情や非言語的なサインを理解して応答することができるようになり、AIとのリアルタイムで自然な会話体験が提供可能になるという。

Interview roleplay with GPT-4o voice and vision
Character voices with GPT-4o voice

 高度なボイスモードについて今後は、アルファ版が少数のユーザーから提供開始され、今秋にはすべての「ChatGPT Plus」(有料版)ユーザーがアクセスできるようになる予定。

 また同社では、特定のコンテンツを検出して応答を拒否できるようモデルの能力を改善しているほか、ユーザーエクスペリエンスを向上させ、リアルタイムのレスポンスを維持しながら数百万人規模に提供拡大するためのインフラを準備していると明らかにしている。

 なお、別途デモが披露された動画機能および画面共有機能の展開にも取り組んでいるとのこと。こちらの提供時期は未定で、タイムラインは後日発表される。