zh
红薯智语
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
红薯智语
搜索全球AI产品动态
搜索全球AI信息,发现AI新机遇
新闻资讯
产品应用
变现案例
AI教程
类型 :
新闻资讯
产品应用
变现案例
AI教程
2024-08-26 14:31:02
.
AIbase
.
11.3k
摩尔线程宣布开源音频理解大模型MooER
摩尔线程宣布开源其音频理解大模型MooER,成为首个基于国产全功能GPU的大型开源语音模型。MooER支持中英文语音识别与翻译,采用三部分模型结构,展现强大多语言处理能力。已开源推理代码与5000小时数据训练的模型,计划进一步开源训练代码与8万小时数据训练的增强版。在对比测试中,MooER-5K表现出色,中文CER为4.21%,英文WER为17.98%,特别是在Covost2zh2en测试集上,BLEU分数高达25.2,领先其他开源模型。基于8万小时数据训练的MooER-80k模型,中文CER降至3.50%,英文WER优化到12.66%,显示了巨大性能提升潜力。此次开源不仅展示了国产GPU在AI领域的应用实力,也为全球音频AI技术发展注入活力,期待MooER在语音识别、翻译等领域带来更多创新突破。
2024-08-26 08:37:00
.
AIbase
.
11.3k
摩尔线程开源音频理解大模型MooER摩耳
摩尔线程公司宣布开源其自主研发的音频理解大模型MooER,这是首个基于国产全功能GPU训练和推理的大型开源语音模型。MooER在摩尔线程夸娥智算平台上,仅用38小时完成了大规模音频数据的训练,展现出在中文、英文语音识别及中译英语音翻译上的优异性能,特别是在Covost2中译英测试集中取得了接近工业级效果的25.2 BLEU分数。摩尔线程计划进一步开源训练代码和基于更大数据集训练的模型。MooER模型结构包括Encoder、Adapter和Decoder,并采用Paraformer和Qwen2-7B-instruct作为初始化模块,性能优于其他开源模型。此举旨在为开发者提供资源支持,促进人工智能领域的技术创新和应用。
2024-07-26 15:47:28
.
AIbase
.
10.6k
确认!ChatGPT高级语音模式将于下周对ChatGPT Plus订阅用户开放
GPT-4o,OpenAI的旗舰模型,于五月份发布时以其音频理解能力引人注目,平均320毫秒的响应速度接近人类对话速度。该模型通过端到端训练将文本、视觉和音频三种模态融合,展示了在多种输入输出上的潜力。OpenAI计划在六月份将高级语音模式功能,通过ChatGPT Plus向部分用户推出,尽管因需改进模型检测和拒绝内容能力,推出时间推迟一个月。新功能将使ChatGPT用户实现无延迟的流畅对话体验。此外,OpenAI还推出了SearchGPT,一个原型版本的人工智能搜索工具,能从清晰相关来源快速提供准确答案。