FireRedASR
开源的工业级普通话自动语音识别模型,支持多种应用场景。
普通产品生产力语音识别开源
FireRedASR 是一个开源的工业级普通话自动语音识别模型,采用 Encoder-Decoder 和 LLM 集成架构。它包含两个变体:FireRedASR-LLM 和 FireRedASR-AED,分别针对高性能和高效能需求设计。该模型在普通话基准测试中表现出色,同时在方言和英文语音识别上也有良好表现。它适用于需要高效语音转文字的工业级应用,如智能助手、视频字幕生成等。模型开源,便于开发者集成和优化。
FireRedASR 最新流量情况
月总访问量
1072
跳出率
49.83%
平均页面访问数
1.4
平均访问时长
00:00:17