Latență = fizică. Cea mai mare parte a "AI lag" nu este cod, ci distanță. Gândiți-vă la ping de jocuri. Inferența vrea să ruleze în apropierea utilizatorului, nu într-un centru de date îndepărtat. De aceea, rețelele cu GPU-uri la periferie reduc semnificativ latența. DeAI este CDN-ul pentru inteligență.