🤔 ¿Qué es la tasa de error de palabras (WER) y cómo la calculo correctamente para comparar los modelos ASR? WER mide cuántas palabras se equivoca un sistema de voz a texto, en comparación con una transcripción humana. El cálculo es WER = (Sustituciones + Inserciones + Supresiones) / Palabras en referencia 👀 Echa un vistazo a dos de nuestros modelos #opensource, NVIDIA Canary-Qwen-2.5B y Parakeet-TDT-0.6B-V2, que acaban de encabezar la última tabla de clasificación de transcripción del Índice de Tasa de Error de Palabras de @ArtificialAnlys (AA-WER) con récord WER. 🏆 Tabla de ➡️ clasificación 📥 Canary Qwen 2.5B ➡️ 📥 Periquito TDT 0.6B V2 ➡️