機器人硬體變得便宜得驚人:服務機器人現在約為 11,500 美元(兩年前為 21,000 美元),而可打印的人形機器人套件則低於 6,000 美元(去年最低為 16,000 美元)。 同時,像 GPT-4V、Gemini Robotics 和 ViLa 這樣的視覺模型在從攝像頭影像中判斷應該做出什麼物理動作方面變得非常出色。 實際上,利用這些技術構建一些東西仍然是一場噩夢。你必須面對驅動程式、混亂的介面、數據流、後端雜亂無章的代碼和安全系統。這種工作會讓小團隊崩潰。 我一直在構建解決這個問題的基礎: - 處理機器人、桌面自動化、網頁抓取等的 SDK... - 插件系統,讓其他開發者可以用 OCR 工具、導航、語音控制等擴展它。 - 內建的支付功能:許可證金鑰、使用追蹤和計費。 - 還有無需編碼的建構工具 👀。 市面上有很多代理框架,但幾乎沒有一個能讓你在單一視覺畫布中融合物理和數位行動。 這個 SDK 將與機器人合作的門檻從需要博士學位降低到周末專案,讓任何人都能構建、發佈和獲利於具身 AI 操作員。
13.47K