基于云的SDK在机器人技术中的重要性可能听起来并不引人注目,但它对推动该行业的发展至关重要。 如果你身处科技圈,你每天都会听到关于云平台的讨论,这些讨论很少能激发想象力。 然而,对于人形机器人和在物理世界中的操作员来说,云模拟工具包是任何试图扩展其训练的开发者的核心需求。 准确的虚拟世界模拟是目前机器人技术中最受追捧的商品之一。研究人员正在进行无尽的实验,以确定哪些真实和合成数据的组合能为训练任务生成最精确的结果。 是的,像特斯拉这样的公司由于从其车队收集的神经网络数据而拥有巨大的先发优势,尽管这些数据在通过现实训练模拟付诸实践之前,仅仅是原始信息。 对于其他人来说,获取那种级别的数据甚至是驱动它的硬件,除非你是一家资金雄厚的公司,否则根本不是一个选项。 这就是云模拟的用武之地。通过将机器人训练和测试转移到基于云的虚拟环境中,任何人都可以访问所需的计算能力并进行扩展。云平台可以集中共享这些模拟、结果和数据。 你实际上是在抽象化这些十亿美元公司所拥有的闭门访问权限,广泛的实验室硬件组件,并将数据集带入公众视野,使开源贡献成为创新的整体+EV。 这一商业模式已经通过Hugging Face的LeRobot(开源倡议)与Nvidia的合作得到了验证,以连接他们的框架,使研究人员能够在云上共享模型、数据集和模拟环境。 最终目标是创建一个数据飞轮,随着人们向开放库贡献模拟数据和训练策略,它加速了其他人的进展,从而生成更多全球可访问的数据。 大量工作正在通过缩小“模拟到现实”的差距而被投入其中。模拟器往往无法达到现实,机器人会在虚拟世界中学习到的行为无法转移到现实世界,因为物理或视觉效果不够准确。由于更好的模拟保真度和混合训练方法,这一差距现在正在迅速缩小。 机器人技术中最新的基础模型(如NVIDIA的Isaac GROOT和Figure的Helix VLA)使用双系统架构,模拟人类认知。它们在世界模拟中的数据训练方式也是如此。模型的一部分是在真实世界的人类演示数据上训练,而另一部分则是在通过高保真模拟器生成的大量合成数据上训练。 通过结合物理和模拟训练,模型学习到的准确技能具有更好的泛化能力。真实数据为AI提供了真相,而模拟数据则提供了在物理世界中收集不切实际的规模和多样性。开发者甚至可以使用额外的真实或合成数据对模型进行微调或后期训练,以针对特定任务,使训练管道极其灵活。 Figures Helix VLA使用系统1/系统2方法,仅在数百小时的远程操作训练(通过模拟和智能标记增强)上进行训练,Helix可以通过自然语言处理新家务任务,而无需自定义编码。这展示了多模态模型和合成训练如何显著减少数据需求。 @codecopenflow正在应用相同的原则,使用Octo,一个集成到其Optr SDK中的开放VLA,能够以更小的数据集和更低的计算能力实现多摄像头感知和语言引导控制。 ...