AI新闻资讯

AI资讯

不错过全球AI革新的每一个时刻

AI日报

每天三分钟关注AI行业趋势

AI时间线

AI行业大事记

AI变现指南

最新案例

AI变现案例分享

图片合集

AI图片制作变现案例分享

视频合集

AI视频制作变现案例分享

音频合集

AI音频制作变现案例分享

文案合集

AI内容写作变现案例分享

AI教程

最新教程

免费分享最新AI教程内容

AI产品榜

AI产品排行榜

展示AI网站的总访问量排名

AI产品流量增速榜

追踪AI网站访问量增长最快产品

AI产品流量下降榜

关注访问量下降明显的AI网站

AI产品周榜

展示AI网站的周访问量排名

热门国家排行榜

美国

美国用户最喜欢的AI网站

中国

中国用户最喜欢的AI网站

印度

印度用户最喜欢的AI网站

巴西

巴西用户最喜欢的AI网站

热门分类榜

图片生成

AI图片生成网站总访问量榜单

个人助理

AI个人助理网站总访问量榜单

角色生成网站

AI角色生成网站总访问量榜单

视频生成

AI视频生成网站总访问量榜单

热门开源数据榜单

AI项目榜单

热门AI项目总Start榜单

AI项目增速榜

热门AI项目增速榜

AI开发者排名

热门AI开发者排名

AI组织排名

热门AI组织排名榜单

热门开源分类

deepseek

热门deepseek开源项目

TTS

热门TTS开源项目

LLM

热门LLM开源项目

ChatGPT

热门ChatGPT开源项目

AI开源项目库

全景图

github热门AI开源项目总览

产品库工具导航

StreamSpeech

实时语音翻译，跨语言沟通的桥梁。

优质新品生产力实时翻译多任务学习

StreamSpeech是一款基于多任务学习的实时语音到语音翻译模型。它通过统一框架同时学习翻译和同步策略，有效识别流式语音输入中的翻译时机，实现高质量的实时通信体验。该模型在CVSS基准测试中取得了领先的性能，并能提供低延迟的中间结果，如ASR或翻译结果。

StreamSpeech

StreamSpeech 最新流量情况

月总访问量

暂无数据

跳出率

暂无数据

平均页面访问数

暂无数据

平均访问时长

暂无数据

StreamSpeech 访问量趋势

暂无访问量数据

StreamSpeech 访问地理位置分布

暂无地理位置分布数据

StreamSpeech 流量来源

暂无流量来源数据

StreamSpeech 替代品

StreamSpeech

StreamSpeech — 实时语音翻译，跨语言沟通的桥梁。

•实时翻译•多任务学习

TransLinguist

TransLinguist — 实时在任何平台上用您的语言与世界交流！

•远程口译•语音识别

NewTranx Subtitler - Real-time voice recognition and AI translation

NewTranx Subtitler - Real-time voice recognition and AI translation — 学习外语看海外剧集的浏览器字幕翻译工具

•字幕翻译•语音识别

speakSync

speakSync — 实时语音翻译APP

•翻译•语音识别

GOPilotX

GOPilotX — GOPilotX - 驭未来

•语音识别•智能助手

Hanami Live Translator

Hanami Live Translator — 实时翻译器，捕捉来自WINDOWS扬声器和麦克风的任何音频

•实时翻译•音频处理

Turn photo into barbie doll

Turn photo into barbie doll — 生产力娱乐一体化AI助手

•AI助手•生产力

Neon AI

Neon AI — 易用的对话式人工智能，满足企业和家庭需求

•对话式人工智能•语音识别

音刻 — 音刻转录是一款快速、精准、丝滑的音视频转录工具。

•转录•语音识别

Pinch

Pinch — Pinch 是一款支持 30 多种语言的实时 AI 语音翻译工具，专为视频通话和网络研讨会设计。

•实时翻译•视频通话

DuRT

DuRT — DuRT 是一款 macOS 上的实时语音识别和翻译软件，致力于提供高效、准确的语音处理服务。

•语音识别•翻译

ElevenLabs Scribe

ElevenLabs Scribe — Scribe 是全球最准确的语音转文字模型，支持99种语言。

•语音识别•多语言

Phi-4-multimodal-instruct

Phi-4-multimodal-instruct — Phi-4-multimodal-instruct 是微软开发的轻量级多模态基础模型，支持文本、图像和音频输入。

•多模态•语音识别

FireRedASR-AED-L

FireRedASR-AED-L — 开源工业级自动语音识别模型，支持普通话、方言和英语，性能卓越。

•语音识别•开源

FireRedASR

FireRedASR — 开源的工业级普通话自动语音识别模型，支持多种应用场景。

•语音识别•开源

Hibiki

Hibiki — Hibiki 是一款用于流式语音翻译（即同声传译）的模型，能够实时逐块生成正确翻译。

•语音翻译•实时翻译

Bulletpen

Bulletpen — 将口语转化为优雅文字的AI写作工具，让写作变得轻松自然。

•AI写作•语音识别

TalkAI练口语

TalkAI练口语 — 与先进AI学习60种外语，跨越语言边界，提升口语能力。

•口语学习•多语言

Whisper Turbo.online

Whisper Turbo.online — Whisper Turbo 是一款免费在线快速准确的语音识别工具。

•语音识别•转录

RealtimeSTT

RealtimeSTT — 一个具有先进语音活动检测、唤醒词激活和即时转录功能的稳健、高效、低延迟的语音到文本库。

•语音识别•实时转录

inFin

inFin — 一款简单易用的无限录音转文字APP，支持中英双语实时翻译。

•语音笔记•实时翻译

xiaozhi-esp32

xiaozhi-esp32 — 基于ESP32的AI聊天机器人项目，可实现多语言对话与声纹识别

• 聊天机器人•ESP32

通义浏览器插件

通义浏览器插件 — 全能AI助手，提供语音识别、字幕翻译、文档速读等功能

•语音识别•实时字幕

Robo Blogger

Robo Blogger — 将语音转换为博客文章的助手

•自然语言处理•内容创作

Moonshine Web

Moonshine Web — 实时浏览器端语音识别应用

•语音识别•自动语音识别

Ray-Ban Meta Glasses

Ray-Ban Meta Glasses — 智能眼镜，集成AI、实时翻译和音乐识别功能

•智能眼镜•实时AI

OmniAudio-2.6B

OmniAudio-2.6B — 世界上最快的边缘部署音频语言模型

•音频处理•边缘计算

Megrez-3B-Omni

Megrez-3B-Omni — 端侧全模态理解开源模型

•全模态理解•图像识别

Shortcut by Poised

Shortcut by Poised — 语音驱动的AI助手，提升工作效率。

•AI助手•语音识别

Coval

Coval — AI代理测试和评估平台

•AI代理•测试