AI产品榜

AI产品榜

搜索全球AI产品动态

搜索全球AI信息，发现AI新机遇

新闻资讯
产品应用
变现案例
AI教程

类型 :

新闻资讯
产品应用
变现案例
AI教程

2024-12-16 14:41:42.AIbase

Nexa AI 发布 OmniAudio-2.6B：用于边缘部署的快速音频语言模型

Nexa AI近日推出了其全新的OmniAudio-2.6B音频语言模型，旨在满足边缘设备的高效部署需求。与传统的将自动语音识别（ASR）和语言模型分开的架构不同，OmniAudio-2.6B将Gemma-2-2b、Whisper Turbo以及定制的投影仪集成到一个统一框架中，这一设计消除了传统系统中各个组件链接所带来的低效率和延迟，特别适用于计算资源有限的设备。主要亮点:处理速度: OmniAudio-2.6B在性能上表现出色。在2024Mac Mini M4Pro上，使用Nexa SDK并采用FP16GGUF格式时，模型可实现每秒35.23个令牌的处理速度，而在Q4_K_M GGUF格式下，

Nexa AI 发布 OmniAudio-2.6B：用于边缘部署的快速音频语言模型

2024-08-21 10:15:24.AIbase

字节跳动自动语音识别模型Seed-ASR,各种口音和方言统统能听懂！

字节跳动推出的Seed-ASR引擎，通过海量训练数据，实现了对普通话、13种中国方言及7种外语的高精度识别，显著提升了跨语言交流的便利性。其关键优势在于出色的上下文感知能力，能结合历史信息准确识别人名、地名和关键词，尤其在特定场景下表现优异，提升识别精度。无论是在日常对话、复杂会议还是多人交谈、背景噪音环境中，Seed-ASR均能精准转录。它还能识别各种专业领域术语，适用于智能助手、语音搜索等场景，大幅改善用户体验。

字节跳动自动语音识别模型Seed-ASR,各种口音和方言统统能听懂！

2023-11-27 10:02:37.AIbase

亚马逊推出全新ASR系统，支持100多语言

["亚马逊发布新一代ASR系统，覆盖100多语言，提供全面自动语音识别服务。","语音基础模型提升20%至50%准确度，在电话语音等挑战领域提高30%至70%准确度。","系统支持多项特性，包括自动标点、自定义词汇、自动语言识别、说话人分离等。","成千上万企业利用Amazon Transcribe解锁音频内容见解，提高可访问性和可发现性。"]