1/ Google DeepMind 正在將 AI 帶入物理世界:Gemini Robotics 1.5 將語言模型轉變為一個可以指導機器人並逐步掌握複雜任務的代理人。這是將思考與行動聯繫起來的一個重要步驟! 讓我們來分析一下 🧵:
2/ 機器人長期以來一直在日常任務中掙扎:過於僵化,過於依賴精確的指令,無法適應。即使是像「清理桌子」這樣簡單的事情,沒有上下文和計劃能力也很困難。
Sundar Pichai
Sundar Pichai13 小時前
新的 Gemini 機器人 1.5 型號將使機器人能夠更好地推理、提前計劃、使用數位工具如搜尋,並將學習從一種機器人轉移到另一種。我們邁向真正有用的通用機器人的下一個重大步驟——您可以在下面的視頻中看到機器人在整理衣物時的推理過程。
3/ Gemini Robotics 1.5 融合了語言、視覺和規劃。它理解人類的意圖,設計一系列行動,解釋其推理——然後指揮機器人執行。思考與行動,終於連接在一起。
4/ 機器人現在可以適應現實情況:從幫助家庭到管理工廠的物流。這不僅僅是自動化——這是與我們周圍世界的智能互動。
Google DeepMind
Google DeepMind13 小時前
我們日常活動中的許多步驟需要多次完成,對於機器人來說可能非常具有挑戰性。想像一下問: “根據我的位置,你能把這些物品分類到正確的堆肥、回收和垃圾桶嗎?” 🗑️ 機器人必須在網上搜索當地指導方針,查看物品,弄清楚如何分類,然後完成任務。 ↓
8.38K