🤔 Cos'è il Word Error Rate (WER) e come posso calcolarlo correttamente per valutare i modelli ASR? Il WER misura quanti errori fa un sistema di riconoscimento vocale rispetto a una trascrizione umana. Il calcolo è WER = (Sostituzioni + Inserimenti + Cancellazioni) / Parole nel Riferimento 👀 Dai un'occhiata a due dei nostri modelli #opensource, NVIDIA Canary-Qwen-2.5B e Parakeet-TDT-0.6B-V2, che hanno appena raggiunto il primo posto nella classifica di trascrizione più recente dell'Indice Word Error Rate di @ArtificialAnlys (AA-WER) con un WER da record. 🏆 Classifica ➡️ 📥 Canary Qwen 2.5B ➡️ 📥 Parakeet TDT 0.6B V2 ➡️