Аппаратное обеспечение роботов становится невероятно дешевым: сервисные роботы стоят около 11,5 тыс. долларов (снизились с 21 тыс. всего за два года), а печатные гуманоидные наборы можно купить менее чем за 6 тыс. долларов (минимум 16 тыс. в прошлом году). В то же время модели визуализации, такие как GPT-4V, Gemini Robotics и ViLa, становятся действительно хорошими в определении физических движений на основе видеопотоков с камер. На самом деле, создание чего-то с использованием всего этого все еще является кошмаром. Вы застряли в работе с драйверами, неуклюжими интерфейсами, потоками данных, запутанным бэкендом и системами безопасности. Это работа, которая убивает небольшие команды. Я создаю блоки для решения этой проблемы: - SDK, который обрабатывает роботов, автоматизацию рабочего стола, веб-скрейпинг и т.д... - Система плагинов, где другие разработчики могут расширять ее инструментами OCR, навигацией, голосовым управлением и многим другим. - Встроенные платежные функции: лицензионные ключи, отслеживание использования и выставление счетов. - Плюс инструменты для создателей без кода 👀. Существует множество фреймворков агентов, но почти ни один из них не позволяет сочетать физические и цифровые действия на одном визуальном холсте. Этот SDK снижает порог от "мне нужна степень доктора философии, чтобы работать с робототехникой" до "выходные проекты", так что любой может создавать, отправлять и монетизировать воплощенные AI-операторы.
13,45K