如果你可以向聊天机器人提出一个相当于整个百科全书大小的问题,并实时得到答案,会怎样? Helix Parallelism 现在可以进行数百万个令牌查询,用户增加 32 倍,这是 #NVIDIAResearch 的一项创新,可大规模推动推理。 🔗