Latencia = física. La mayor parte del "retraso de IA" no es código, es distancia. Piensa en el ping de los videojuegos. La inferencia quiere ejecutarse cerca del usuario, no en algún centro de datos lejano. Por eso, las redes con GPUs en la periferia reducen significativamente la latencia. DeAI es el CDN para la inteligencia.