智元机器人于2025年3月10日发布了其首个通用具身基座大模型——智元启元大模型(Genie Operator-1,简称GO-1)。这一模型的推出标志着机器人技术进入了一个新的智能化时代,为家庭服务、商业应用和工业生产等领域带来了革命性的变革。
GO-1大模型的核心在于其创新的Vision-Language-Latent-Action(ViLLA)架构,结合了多模态大模型(VLM)和混合专家(MoE)技术。这一架构使机器人能够通过学习人类视频和操作数据,实现小样本快速泛化和跨场景适应能力。具体而言,GO-1能够在极少甚至零样本的情况下快速适应新任务,并在倒水、清理桌面、补充饮料等家务任务中表现出色,成功率较现有模型提高了32%。 GO-1大模型还具备“一脑多形”的特性,能够支持不同形态机器人的灵活应用。例如,它可以通过数据回流系统从实际执行中获取数据,不断进化学习,从而提升任务成功率。这种持续进化的能力使得机器人能够更好地适应家庭环境和商业场景,成为日常生活中的“助手”。 在数据和技术支持方面,智元机器人通过建设全球首个数采超级工厂和开源AgiBotWorld数据集,积累了大量真值数据。这些数据为GO-1模型的训练提供了坚实的基础,并使其在多种复杂任务中表现出色。此外,GO-1的成功率提升也得益于其对人类行为的深度理解,这使得机器人能够更好地完成如递送水杯、制作餐点和迎接客人等任务。 智元机器人创始人彭志辉表示,GO-1的推出不仅降低了具身智能的门槛,还为机器人从依赖特定任务的工具向具备通用智能的自主体转变奠定了基础。未来,机器人将不再局限于单一任务,而是能够适应更多复杂场景,成为人类生活和工作中的重要伙伴。 智元启元大模型GO-1的发布不仅是机器人技术的一次重大突破,也为智能家居、服务行业和工业生产等领域带来了无限可能。这一模型的推出将加速具身智能的普及,推动机器人技术向更高级别的智能化迈进。 |