Phần cứng robot đang trở nên rẻ đến điên rồ: robot dịch vụ hiện có giá khoảng 11.5k USD (giảm từ 21k USD chỉ hai năm trước), và bạn có thể mua các bộ kit người máy in được với giá dưới 6k USD (tối thiểu 16k USD năm ngoái). Cùng lúc đó, các mô hình thị giác như GPT-4V, Gemini Robotics và ViLa đang trở nên rất giỏi trong việc xác định các động tác vật lý cần thực hiện từ các luồng camera. Thực sự xây dựng một cái gì đó với tất cả những điều này vẫn là một cơn ác mộng. Bạn bị mắc kẹt với các trình điều khiển, giao diện lộn xộn, luồng dữ liệu, spaghetti backend và các hệ thống an toàn. Đây là loại công việc giết chết các nhóm nhỏ. Tôi đã xây dựng các khối để giải quyết điều này: - SDK xử lý robot, tự động hóa máy tính, thu thập dữ liệu web, v.v... - Hệ thống plugin nơi các nhà phát triển khác có thể mở rộng nó với các công cụ OCR, điều hướng, điều khiển bằng giọng nói và nhiều hơn nữa. - Các công cụ thanh toán tích hợp: khóa bản quyền, theo dõi sử dụng và lập hóa đơn. - Cùng với các công cụ cho những người xây dựng không cần mã 👀. Có rất nhiều khung tác nhân ở đó, nhưng hầu như không có cái nào cho phép bạn kết hợp các hành động vật lý và kỹ thuật số trên một canvas hình ảnh duy nhất. SDK này hạ thấp rào cản từ việc tôi cần có bằng tiến sĩ để làm việc với robot đến một dự án cuối tuần, vì vậy bất kỳ ai cũng có thể xây dựng, vận chuyển và kiếm tiền từ các nhà điều hành AI hiện thân.
13,46K