Latence = fyzika. Většina "zpoždění AI" není kód, ale vzdálenost. Vzpomeňte si na herní ping. Inference chce běžet v blízkosti uživatele, ne v nějakém vzdáleném datovém centru. Proto sítě s GPU na periferii výrazně snižují latenci. DeAI je CDN pro inteligenci.