.@vllm_project rapidamente se tornou um mecanismo de código aberto para inferência eficiente de modelos de linguagem grande, equilibrando desempenho com uma forte experiência de desenvolvedor. Na NVIDIA, as contribuições diretas para projetos como o vLLM refletem um compromisso com o avanço da infraestrutura de IA de código aberto para todos. Nesta sessão de perguntas e respostas, Benjamin Chislett, Engenheiro Sênior de Software de Sistemas da NVIDIA e Committer do vLLM, compartilha sua perspectiva sobre como moldar o futuro do projeto, seu trabalho em decodificação especulativa e por que a colaboração de código aberto é importante para a IA em escala. 🔗