Latência = física. A maior parte do "atraso da IA" não é código, é distância. Pense em ping de jogos. A inferência quer ser executada perto do usuário, não em algum data center distante. É por isso que as redes com GPUs na periferia reduzem significativamente a latência. DeAI é o CDN para inteligência.