Latensi = fisika. Sebagian besar "AI lag" bukanlah kode, melainkan jarak. Pikirkan ping game. Inferensi ingin berjalan di dekat pengguna, bukan di pusat data yang jauh. Itulah sebabnya jaringan dengan GPU di pinggiran mengurangi latensi secara signifikan. DeAI adalah CDN untuk kecerdasan.