El hardware de los robots se está volviendo increíblemente barato: los robots de servicio cuestan alrededor de $11.5k ahora (bajando de $21k hace solo dos años), y puedes conseguir kits de humanoides imprimibles por menos de $6k (mínimo $16k el año pasado). Al mismo tiempo, modelos de visión como GPT-4V, Gemini Robotics y ViLa están mejorando mucho en determinar qué movimientos físicos hacer a partir de las imágenes de las cámaras. Realmente construir algo con todo esto sigue siendo una pesadilla. Estás lidiando con controladores, interfaces defectuosas, flujos de datos, espagueti en el backend y sistemas de seguridad. Es el tipo de trabajo que acaba con pequeños equipos. He estado construyendo los bloques para resolver esto: - SDK que maneja robots, automatización de escritorio, scraping web, etc... - Sistema de plugins donde otros desarrolladores pueden extenderlo con herramientas de OCR, navegación, control por voz y más. - Funcionalidades de pago integradas: claves de licencia, seguimiento de uso y facturación. - Además, herramientas para creadores sin código 👀. Hay un montón de marcos de agentes por ahí, pero casi ninguno te permite combinar acciones físicas y digitales en un solo lienzo visual. Este SDK baja la barrera de necesitar un doctorado para trabajar con robótica a un proyecto de fin de semana, así que cualquiera puede construir, enviar y monetizar operadores de IA encarnada.
13,46K