🚀 ¡La revisión en profundidad de SGLang de NVIDIA DGX Spark está EN VIVO! Gracias al programa de acceso anticipado de @NVIDIA, SGLang hace su primera aparición en un producto de consumo, el nuevo DGX Spark. La memoria unificada de 128 GB y la arquitectura Blackwell de DGX Spark establecen un nuevo estándar para la creación de prototipos de IA local y la computación de borde. Estamos encantados de llevar estos conocimientos de rendimiento de vanguardia y soporte de software a la comunidad de desarrolladores. Nuestra revisión se sumerge en cómo implementar y acelerar de manera eficiente modelos grandes como Llama 3.1 70B, GPT-OSS utilizando la decodificación especulativa EAGLE3 de SGLang y @Ollama en esta hermosa pieza de ingeniería. 👇 Video de unboxing y blog de tecnología en el hilo #SGLang #NVIDIA #SparkSomethingBig #Blackwell #DGXSpark #AIInference #LLMServing