Et si vous pouviez poser à un chatbot une question de la taille d’une encyclopédie entière et obtenir une réponse en temps réel ? Il est désormais possible d’effectuer des requêtes de plusieurs millions de jetons avec 32 fois plus d’utilisateurs grâce à Helix Parallelism, une innovation de #NVIDIAResearch qui permet l’inférence à grande échelle. 🔗