ニュース
Google Geminiにも音声会話機能、GPT-4oの高度な音声モードに対抗する「Gemini Live」
Gemini Advanced加入者向けに、英語での提供を開始
2024年8月14日 12:05
米Googleは8月13日(現地時間)、同社の生成AI「Gemini」モバイル版において、音声会話機能「Gemini Live」をリリースすると発表した。Androidの「Gemini Advanced」プラン(月額2,900円、初月無料)加入者向けに、同日より英語での提供を開始し、今後数週間以内にiOSと多くの言語に対応を拡大する予定。
「Gemini Live」は、Geminiと自由に会話できる新たなAI機能で、米OpenAIが「ChatGPT」にアルファ版として搭載したばかりの「高度な音声モード(advanced Voice Mode)」と同様のサービス。YouTubeやGmailなどとの連携も可能になれば、強力な対抗馬となりそうだ。今年5月に開催された「Google I/O 2024」でプロトタイプ版が披露されており、いよいよモバイル向けの「Gemini」アプリへ実装される形となる。
今回のバージョンでは「Nova」や「Vega」といった星座の名前があてられた男女合わせて10種類の音声から、自分に最適なトーンとスタイルを選択可能。Geminiの応答の途中で特定の内容をさらに深く掘り下げたり、会話を中断したところから元の話題に戻ったりすることもできる。同社は「Gemini Live」をブレインストーミングや重要な場面での会話の練習に活用できるとしている。
また「Gemini Live」は、ハンズフリーでも利用可能。将来的には、ライブ会話中にスマートフォン内蔵のカメラアプリにも接続できるようになり、カメラに映し出されたものについて会話するといったマルチモーダルな体験が可能になるとのこと。
Here's a first look at the vision for Gemini Live. In the future, it will be a multi-modal experience that allows you to explore the world in a whole new way and even connect to your apps during your Live conversation. Stay tuned.pic.twitter.com/Y0HjX8S5e7
— Google Gemini App (@GeminiApp)August 13, 2024