Latens = fysik. Det mesta "AI-lagg" är inte kod, det är avstånd. Tänk spelping. Slutsatsdragning vill köras nära användaren, inte i något avlägset datacenter. Det är därför nätverk med GPU:er i periferin minskar latensen avsevärt. DeAI är CDN för intelligens.