Latence = physique. La plupart des "lags d'IA" ne sont pas dus au code, mais à la distance. Pensez au ping dans les jeux. L'inférence doit s'exécuter près de l'utilisateur, et non dans un centre de données éloigné. C'est pourquoi les réseaux avec des GPU en périphérie réduisent considérablement la latence. DeAI est le CDN pour l'intelligence.