谷歌DeepMind实验室于2025年3月13日宣布推出两款基于Gemini 2.0的新型人工智能模型:Gemini Robotics和Gemini Robotics-ER。这两款模型旨在提升机器人在复杂环境中的适应性和任务执行能力,推动机器人技术向更智能、更通用的方向发展。
![]() Gemini Robotics是一款集视觉、语言和行动于一体的模型,能够理解自然语言指令并执行复杂任务。例如,它可以通过听懂人类的语言来完成简单的拼写任务,甚至能够执行精细的操作,如折叠纸张或开启瓶盖。此外,Gemini Robotics还具备环境适应能力,能够在多种场景中灵活应对新挑战。 Gemini Robotics-ER则专注于空间推理和具身推理,帮助机器人更好地理解周围环境,并支持开发者利用其推理能力运行自己的程序。这款模型的推出进一步强化了机器人在复杂环境中的适应性和任务执行能力。 谷歌表示,这些新模型将推动机器人技术在更多场景中的应用和普及,包括人形机器人、工厂和仓库中的其他类型机器人。然而,谷歌也强调,这项工作仍处于早期探索阶段,并计划逐步部署这些机器人,以确保它们与人类保持安全距离。 Gemini Robotics和Gemini Robotics-ER的推出标志着机器人技术的重大突破,为机器人赋予了更强的通用性和灵活性,同时也为未来机器人技术的广泛应用奠定了基础。 |