zh
AI产品榜
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
AI产品榜
搜索全球AI产品动态
搜索全球AI信息,发现AI新机遇
新闻资讯
产品应用
变现案例
AI教程
类型 :
新闻资讯
产品应用
变现案例
AI教程
2024-12-16 14:41:42
.
AIbase
.
14.0k
Nexa AI 发布 OmniAudio-2.6B:用于边缘部署的快速音频语言模型
Nexa AI近日推出了其全新的OmniAudio-2.6B音频语言模型,旨在满足边缘设备的高效部署需求。与传统的将自动语音识别(ASR)和语言模型分开的架构不同,OmniAudio-2.6B将Gemma-2-2b、Whisper Turbo以及定制的投影仪集成到一个统一框架中,这一设计消除了传统系统中各个组件链接所带来的低效率和延迟,特别适用于计算资源有限的设备。主要亮点:处理速度: OmniAudio-2.6B在性能上表现出色。在2024Mac Mini M4Pro上,使用Nexa SDK并采用FP16GGUF格式时,模型可实现每秒35.23个令牌的处理速度,而在Q4_K_M GGUF格式下,
2024-08-21 10:15:24
.
AIbase
.
11.2k
字节跳动自动语音识别模型Seed-ASR,各种口音和方言统统能听懂!
字节跳动推出的Seed-ASR引擎,通过海量训练数据,实现了对普通话、13种中国方言及7种外语的高精度识别,显著提升了跨语言交流的便利性。其关键优势在于出色的上下文感知能力,能结合历史信息准确识别人名、地名和关键词,尤其在特定场景下表现优异,提升识别精度。无论是在日常对话、复杂会议还是多人交谈、背景噪音环境中,Seed-ASR均能精准转录。它还能识别各种专业领域术语,适用于智能助手、语音搜索等场景,大幅改善用户体验。
2023-11-27 10:02:37
.
AIbase
.
3.5k
亚马逊推出全新ASR系统,支持100多语言
["亚马逊发布新一代ASR系统,覆盖100多语言,提供全面自动语音识别服务。","语音基础模型提升20%至50%准确度,在电话语音等挑战领域提高30%至70%准确度。","系统支持多项特性,包括自动标点、自定义词汇、自动语言识别、说话人分离等。","成千上万企业利用Amazon Transcribe解锁音频内容见解,提高可访问性和可发现性。"]