🚀 A análise aprofundada do SGLang sobre o NVIDIA DGX Spark está AO VIVO! Graças ao programa de acesso antecipado da @NVIDIA, o SGLang faz sua primeira aparição em um produto de consumo, o novíssimo DGX Spark. A memória unificada de 128GB e a arquitetura Blackwell do DGX Spark estabelecem um novo padrão para prototipagem de IA local e computação de borda. Estamos entusiasmados em trazer essas percepções de desempenho de ponta e suporte de software para a comunidade de desenvolvedores. Nossa análise explora como implantar e acelerar eficientemente grandes modelos como Llama 3.1 70B, GPT-OSS usando a decodificação especulativa EAGLE3 do SGLang e @Ollama nesta bela peça de engenharia. 👇 Vídeo de unboxing e blog técnico no tópico #SGLang #NVIDIA #SparkSomethingBig #Blackwell #DGXSpark #AIInference #LLMServing