熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
雲端 SDK 對於機器人技術的重要性可能聽起來不那麼引人注目,但對於推進這個領域來說,它絕對是至關重要的。
如果你身處科技圈,你每天都會聽到雲端平台的消息,這些消息很少能激發想像力。
然而,對於人形機器人和在物理世界中的操作員來說,雲端模擬工具包是任何試圖擴展其訓練的開發者的核心需求。
準確的虛擬世界模擬是目前機器人技術中最受追捧的商品之一。研究人員正在進行無數實驗,以確定哪些真實數據和合成數據的組合能為訓練任務產生最精確的結果。
是的,像特斯拉這樣的公司因為從其車隊中收集的神經網絡數據而擁有巨大的先發優勢,儘管這些數據在通過現實的訓練模擬付諸實踐之前僅僅是原始信息。
對於其他人來說,獲得這種數據水平甚至是驅動它的硬體都不是一個選項,除非你是一家資金雄厚的公司。
這就是雲端模擬的用武之地。通過將機器人的訓練和測試移入基於雲端的虛擬環境,任何人都可以訪問所需的計算能力並擴展。雲端平台可以集中共享這些模擬、結果和數據。
你基本上是在抽象化這些十億美元公司所擁有的封閉門戶訪問權,將實驗室中使用的廣泛硬體組件帶入公眾視野,讓開源貢獻成為創新的整體 +EV。
這種商業模式已經通過 Hugging Face 的 LeRobot(開源倡議)與 Nvidia 的合作而證明了自己,讓研究人員可以在雲端共享模型、數據集和模擬環境。
最終目標是創建一個數據飛輪,隨著人們向開放的庫貢獻模擬數據和訓練策略,它加速了其他人的進步,反過來又產生了更多全球可訪問的數據。
大量的工作正在通過縮小“模擬到現實”的差距而被投入其中。模擬器往往無法達到現實,機器人在虛擬世界中學習的行為無法轉移到現實世界,因為物理或視覺不夠準確。由於更好的模擬真實性和混合訓練方法,這一差距現在正在迅速縮小。
機器人技術中最新的基礎模型(如 NVIDIA 的 Isaac GROOT 和 Figure 的 Helix VLA)使用模仿人類認知的雙系統架構。這同樣適用於他們在世界模擬中的數據訓練。模型的一部分是基於來自現實世界的人類示範數據進行訓練,而另一部分則是基於通過高保真模擬器生成的大量合成數據進行訓練。
通過結合物理和模擬訓練,模型學會了更準確的技能,這些技能能更好地進行概括。真實數據為 AI 提供了真相,而模擬數據則提供了在物理世界中收集不切實際的規模和多樣性。開發者甚至可以使用額外的真實或合成數據對模型進行微調或後期訓練,以針對特定任務,使訓練流程極具靈活性。
Figures Helix VLA 使用系統 1/系統 2 方法,僅在數百小時的遠程操作下進行訓練(通過模擬和智能標記增強),Helix 可以通過自然語言處理新家務任務,而無需自定義編碼。這展示了多模態模型和合成訓練如何大幅減少數據需求。
@codecopenflow 正在應用相同的原則,使用 Octo,這是一個集成到其 Optr SDK 中的開放 VLA,實現多攝像頭感知和語言引導控制,所需數據集和計算能力都大幅減少。
...

熱門
排行
收藏