zh
红薯智语
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
红薯智语
搜索全球AI产品动态
搜索全球AI信息,发现AI新机遇
新闻资讯
产品应用
变现案例
AI教程
类型 :
新闻资讯
产品应用
变现案例
AI教程
2024-11-05 10:30:08
.
AIbase
.
13.0k
新开源语音识别模型Moonshine:速度比OpenAI Whisper快五倍
美国初创公司 Useful Sensors 推出了一款名为 Moonshine 的开源语音识别模型。Moonshine 的设计旨在更高效地处理音频数据,相比于 OpenAI 的 Whisper,它在计算资源的使用上更为经济,处理速度快五倍。这一新模型专为在资源有限的硬件上实现实时应用而打造,具有灵活的架构。与 Whisper 将音频分为固定的30秒片段处理不同,Moonshine 根据实际音频长度调整处理时间。这使得它在处理较短音频片段时表现出色,减少了由于零填充而产生的处理开销。Moonshine 有两个版本:小型的 Tiny 版本参数量为2710万,
2024-08-07 09:11:21
.
AIbase
.
10.9k
以色列公司推出速度提升50%的开源语音识别模型Whisper Medusa
以色列AI公司aiOla发布了一款名为Whisper Medusa的开源语音识别模型,该模型基于改进的架构设计,引入多头注意力机制,使其处理速度比OpenAI的Whisper模型快50%。Whisper Medusa通过并行预测十个tokens,而非传统的一次一个,显著提高了语音识别速度,同时保持了性能不减。其创新的训练方法采用弱监督学习,冻结主干系统并使用模型生成的音频转录作为标签训练其他模块。这一开源模型的发布,将为语音识别技术的发展带来深远影响,推动更快速、高效的语音处理应用,并可能在智能助手、实时翻译和语音控制系统等领域实现性能提升。
2024-08-02 09:21:02
.
AIbase
.
10.8k
aiOla推超高速开源语音识别模型Whisper-Medusa,比OpenAI的Whisper快50%
以色列AI初创公司aiOla发布了一款名为Whisper-Medusa的开源语音识别模型,比OpenAI的Whisper快50%。该模型基于Whisper构建,采用了创新的“多头注意力”架构,能一次预测更多代币,速度提升显著而准确性不变。Whisper-Medusa已在Hugging Face上以麻省理工学院许可发布,允许研究和商业使用。aiOla通过弱监督机器学习方法训练模型,冻结了Whisper的主要组件,并使用模型生成的音频转录作为标签来训练额外的token预测模块。该模型在真实企业数据用例上测试过,能在实际场景准确运行,有望在语音应用中加快响应速度,提升效率和降低成本。