🤔 Was ist die Wortfehlerquote (WER) und wie berechne ich sie richtig, um ASR-Modelle zu benchmarken? WER misst, wie viele Wörter ein Spracherkennungssystem falsch erkennt, im Vergleich zu einem menschlichen Transkript. Die Berechnung lautet WER = (Substitutionen + Einfügungen + Löschungen) / Wörter im Referenztext 👀 Schaut euch zwei unserer #opensource Modelle an, NVIDIA Canary-Qwen-2.5B und Parakeet-TDT-0.6B-V2, die gerade die neueste Transkriptions-Bestenliste von dem @ArtificialAnlys Word Error Rate Index (AA-WER) mit Rekord-WER angeführt haben. 🏆 Bestenliste ➡️ 📥 Canary Qwen 2.5B ➡️ 📥 Parakeet TDT 0.6B V2 ➡️