.@vllm_project 已迅速成为高效大型语言模型推理的首选开源引擎,平衡了性能与强大的开发者体验。在 NVIDIA,直接参与 vLLM 等项目体现了对推动开源 AI 基础设施的承诺,造福每一个人。 在这次问答中,NVIDIA 的高级系统软件工程师兼 vLLM 的提交者 Benjamin Chislett 分享了他对塑造项目未来的看法,他在推测解码方面的工作,以及为什么开源协作对大规模 AI 重要。 🔗