1/ Google DeepMind está llevando la IA al mundo físico: Gemini Robotics 1.5 convierte un modelo de lenguaje en un agente que puede guiar robots y dominar tareas complejas paso a paso. ¡Un gran paso en la conexión entre el pensamiento y la acción! Desglosemos esto 🧵:
2/ Los robots han tenido dificultades durante mucho tiempo con las tareas cotidianas: demasiado rígidos, demasiado dependientes de comandos exactos, incapaces de adaptarse. Incluso algo tan simple como "limpiar la mesa" era difícil sin contexto y habilidades de planificación.
Sundar Pichai
Sundar Pichai26 sept, 00:05
Los nuevos modelos de Gemini Robotics 1.5 permitirán a los robots razonar mejor, planificar con anticipación, utilizar herramientas digitales como la búsqueda y transferir el aprendizaje de un tipo de robot a otro. Nuestro próximo gran paso hacia robots de propósito general que sean realmente útiles: puedes ver cómo el robot razona mientras clasifica la ropa en el video a continuación.
3/ Gemini Robotics 1.5 fusiona el lenguaje, la visión y la planificación. Entiende la intención humana, diseña una secuencia de acciones, explica su razonamiento—y luego dirige a un robot para llevarlo a cabo. Pensar y hacer, finalmente conectados.
4/ Los robots ahora pueden adaptarse a situaciones reales: desde ayudar en el hogar hasta gestionar la logística en fábricas. Esto no es solo automatización, es una interacción inteligente con el mundo que nos rodea.
Google DeepMind
Google DeepMind26 sept, 00:02
Muchas de nuestras actividades diarias requieren muchos pasos para completarse y pueden ser extremadamente desafiantes para los robots. Imagina preguntar: “¿Basado en mi ubicación, puedes clasificar estos objetos en los contenedores correctos de compostaje, reciclaje y basura?” 🗑️ El robot tiene que buscar en la web las pautas locales, observar los objetos, averiguar cómo clasificarlos y luego completar la tarea. ↓
12,01K