Latenza = fisica. La maggior parte del "lag dell'AI" non è codice, è distanza. Pensa al ping nei giochi. L'inferenza vuole essere eseguita vicino all'utente, non in qualche lontano data center. Ecco perché le reti con GPU alla periferia riducono significativamente la latenza. DeAI è il CDN per l'intelligenza.