FireRedASR est un modèle de reconnaissance automatique de la parole (RAP) en mandarin standard industriel open source, adoptant une architecture intégrée Encodeur-Décodeur et LLM. Il comprend deux variantes : FireRedASR-LLM et FireRedASR-AED, conçues respectivement pour des exigences de hautes performances et d'efficacité énergétique. Ce modèle offre d'excellents résultats aux tests de référence en mandarin standard, et affiche également de bonnes performances pour la reconnaissance de la parole en dialectes et en anglais. Il convient aux applications industrielles nécessitant une transcription vocale efficace, telles que les assistants intelligents et la génération de sous-titres vidéo. Le modèle étant open source, il est facile à intégrer et à optimiser pour les développeurs.