Latentie = fysica. De meeste "AI-latentie" is geen code, het is afstand. Denk aan gaming ping. Inferentie wil dicht bij de gebruiker draaien, niet in een ver weg datacenter. Dat is waarom netwerken met GPU's aan de rand de latentie aanzienlijk verlagen. DeAI is de CDN voor intelligentie.