ニュース

Google Geminiにも音声会話機能、GPT-4oの高度な音声モードに対抗する「Gemini Live」

Gemini Advanced加入者向けに、英語での提供を開始

Geminiに音声会話機能「Gemini Live」

 米Googleは8月13日(現地時間)、同社の生成AI「Gemini」モバイル版において、音声会話機能「Gemini Live」をリリースすると発表した。Androidの「Gemini Advanced」プラン(月額2,900円、初月無料)加入者向けに、同日より英語での提供を開始し、今後数週間以内にiOSと多くの言語に対応を拡大する予定。

Go Live with Gemini

 「Gemini Live」は、Geminiと自由に会話できる新たなAI機能で、米OpenAIが「ChatGPT」にアルファ版として搭載したばかりの「高度な音声モード(advanced Voice Mode)」と同様のサービス。YouTubeやGmailなどとの連携も可能になれば、強力な対抗馬となりそうだ。今年5月に開催された「Google I/O 2024」でプロトタイプ版が披露されており、いよいよモバイル向けの「Gemini」アプリへ実装される形となる。

 今回のバージョンでは「Nova」や「Vega」といった星座の名前があてられた男女合わせて10種類の音声から、自分に最適なトーンとスタイルを選択可能。Geminiの応答の途中で特定の内容をさらに深く掘り下げたり、会話を中断したところから元の話題に戻ったりすることもできる。同社は「Gemini Live」をブレインストーミングや重要な場面での会話の練習に活用できるとしている。

 また「Gemini Live」は、ハンズフリーでも利用可能。将来的には、ライブ会話中にスマートフォン内蔵のカメラアプリにも接続できるようになり、カメラに映し出されたものについて会話するといったマルチモーダルな体験が可能になるとのこと。