ニュース

Google DeepMind、「Gemini Robotics」を発表～「Gemini 2.0」をロボット制御に

周囲の環境を理解して人間のように適切に反応する「身体性推論」（ER）能力を実現

樽井秀人

2025年3月19日 06:45

Google DeepMind、「Gemini Robotics」を発表

　米Googleは3月13日（現地時間）、「Gemini 2.0」を基盤とする新しい人工知能（AI）モデル「Gemini Robotics」を発表した。2023年4月にGoogle Brainと統合した子会社Google DeepMindがロボット工学のために設計したという。

　Google DeepMindはテキスト、画像、音声、動画といったさまざまな情報を理解するマルチモーダル推論を通じて多くの課題を解決してきたが、それはおもにデジタル領域での活用にとどまっていた。「Gemini Robotics」は周囲の環境を理解し、それに応じて適切に反応する人間のような「身体性推論」（Embodied Reasoning, ER）能力を実現することで、物理的な世界にもAIの支援をもたらす。

　今回発表されたモデルは「Gemini Robotics」と「Gemini Robotics-ER」の2つ。1つ目の「Gemini Robotics」は「Gemini 2.0」を基盤とし、ロボットを直接制御することを目的に物理的な動作を新たな出力形式として加えた、高度な視覚・言語・行動（VLA）モデルとなっている。もう1つの「Gemini Robotics-ER」は高度な空間認識能力を備えた「Gemini」モデルで、ロボット研究者が「Gemini」の身体性推論能力を活用して、独自のプログラムを実行できるよう設計されているという。