FireRedASR-AED-L est un modèle de reconnaissance automatique de la parole (RAP) industriel open source, conçu pour répondre aux besoins de reconnaissance vocale haute performance et haute efficacité. Ce modèle utilise une architecture encodeur-décodeur basée sur l'attention, et prend en charge plusieurs langues, notamment le mandarin, les dialectes chinois et l'anglais. Il a atteint de nouveaux sommets lors de tests de référence de reconnaissance vocale en mandarin standard, et offre d'excellentes performances dans la reconnaissance des paroles de chansons. Ses principaux avantages incluent des performances élevées, une faible latence et une large applicabilité, le rendant adapté à divers scénarios d'interaction vocale. Son caractère open source permet aux développeurs d'utiliser et de modifier librement le code, stimulant ainsi le développement de la technologie de reconnaissance vocale.