AI新闻资讯

AI资讯

不错过全球AI革新的每一个时刻

AI日报

每天三分钟关注AI行业趋势

AI时间线

AI行业大事记

Al硬件

列出所有AI硬件产品。

AI变现指南

图片合集

AI图片制作变现案例分享

视频合集

AI视频制作变现案例分享

音频合集

AI音频制作变现案例分享

文案合集

AI内容写作变现案例分享

AI教程

AI产品榜

AI产品排行榜

展示AI网站的总访问量排名

AI产品流量增速榜

追踪AI网站访问量增长最快产品

AI产品流量下降榜

关注访问量下降明显的AI网站

AI产品周榜

展示AI网站的周访问量排名

AI开源项目库

全景图

github热门AI开源项目总览

产品库工具导航

SenseVoice

多语种语音理解模型，提供高精度语音识别与情感识别。

普通产品其他语音识别情感分析

打开网站

SenseVoice是一个包含自动语音识别(ASR)、语音语言识别(LID)、语音情感识别(SER)和音频事件检测(AED)等多语音理解能力的语音基础模型。它专注于高精度多语种语音识别、语音情感识别和音频事件检测，支持超过50种语言，识别性能超越Whisper模型。模型采用非自回归端到端框架，推理延迟极低，是实时语音处理的理想选择。

打开网站

SenseVoice 最新流量情况

月总访问量

521149929

跳出率

35.96%

平均页面访问数

6.1

平均访问时长

00:06:29

SenseVoice 访问量趋势

SenseVoice 访问地理位置分布

SenseVoice 流量来源

SenseVoice 替代品

SenseVoice — 多语种语音理解模型，提供高精度语音识别与情感识别。

其他

•语音识别•情感分析

1656

EMOVA — 情感丰富的多模态语言模型

其他

AI资讯

AI日报

AI时间线

Al硬件

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图

SenseVoice

SenseVoice 最新流量情况

SenseVoice 访问量趋势

SenseVoice 访问地理位置分布

SenseVoice 流量来源

SenseVoice 替代品

SenseVoice — 多语种语音理解模型，提供高精度语音识别与情感识别。

EMOVA — 情感丰富的多模态语言模型

SenseVoiceSmall — 多语种高精度语音识别模型

FunAudioLLM — 自然交互的语音理解和生成基础模型

小冰 — 亿万⼈中的你

Atypica.AI — 为主观世界建模，理解消费者决策的智能体框架。

Amazon Nova Sonic — 亚马逊全新基础模型理解语气、语调与节奏，提升人机对话自然度。

Currents AI — AI 社交媒体深度研究工具，提供实时市场洞察与情感分析。

音刻 — 音刻转录是一款快速、精准、丝滑的音视频转录工具。

DuRT — DuRT 是一款 macOS 上的实时语音识别和翻译软件，致力于提供高效、准确的语音处理服务。

ElevenLabs Scribe — Scribe 是全球最准确的语音转文字模型，支持99种语言。

Phi-4-multimodal-instruct — Phi-4-multimodal-instruct 是微软开发的轻量级多模态基础模型，支持文本、图像和音频输入。

FireRedASR-AED-L — 开源工业级自动语音识别模型，支持普通话、方言和英语，性能卓越。

FireRedASR — 开源的工业级普通话自动语音识别模型，支持多种应用场景。

Bulletpen — 将口语转化为优雅文字的AI写作工具，让写作变得轻松自然。

Whisper Turbo.online — Whisper Turbo 是一款免费在线快速准确的语音识别工具。

RealtimeSTT — 一个具有先进语音活动检测、唤醒词激活和即时转录功能的稳健、高效、低延迟的语音到文本库。

北极象沉浸式翻译 — 一款支持多浏览器的高质量翻译插件，提供PDF翻译、学术翻译等多种功能。

xiaozhi-esp32 — 基于ESP32的AI聊天机器人项目，可实现多语言对话与声纹识别

通义浏览器插件 — 全能AI助手，提供语音识别、字幕翻译、文档速读等功能

Robo Blogger — 将语音转换为博客文章的助手

Moonshine Web — 实时浏览器端语音识别应用

OmniAudio-2.6B — 世界上最快的边缘部署音频语言模型

Megrez-3B-Omni — 端侧全模态理解开源模型

Shortcut by Poised — 语音驱动的AI助手，提升工作效率。

Coval — AI代理测试和评估平台

whisper-ner-v1 — 联合语音转录和实体识别的先进模型

ultravox-v0_4_1-mistral-nemo — 多模态语音大型语言模型

ultravox-v0_4_1-llama-3_1-70b — 多模态语音大型语言模型

ultravox-v0_4_1-llama-3_1-8b — 多模态语音大型语言模型