Latencia = física. La mayor parte del "retraso de la IA" no es código, es distancia. Piensa en el ping de los juegos. La inferencia quiere ejecutarse cerca del usuario, no en un centro de datos lejano. Es por eso que las redes con GPU en la periferia reducen significativamente la latencia. DeAI es la CDN de la inteligencia.