🚀 A análise detalhada do SGLang sobre o NVIDIA DGX Spark está AO VIVO! Graças ao programa de acesso antecipado da @NVIDIA, o SGLang faz sua primeira aparição em um produto de consumo, o novíssimo DGX Spark. A memória unificada de 128 GB do DGX Spark e a arquitetura Blackwell estabelecem um novo padrão para prototipagem de IA local e computação de borda. Estamos entusiasmados em trazer esses insights de desempenho de ponta e suporte de software para a comunidade de desenvolvedores. Nossa análise se aprofunda em como implantar e acelerar com eficiência grandes modelos como Llama 3.1 70B, GPT-OSS usando a decodificação especulativa EAGLE3 da SGLang e @Ollama nesta bela peça de engenharia. 👇 Vídeo de unboxing e blog de tecnologia no tópico #SGLang #NVIDIA #SparkSomethingBig #Blackwell #DGXSpark #AIInference #LLMServing