去除背景噪声阿里通义实验室开源语音处理技术ClearerVoice-Studio

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Dec 6, 2024

682

阿里巴巴达摩院的通义实验室近期宣布开源一项名为ClearerVoice-Studio的语音处理技术，旨在提升语音质量和可懂度。随着语音技术的广泛应用，语音质量受到越来越多人的关注，尤其是在环境噪声、混响和设备拾音等情况下，语音处理技术的需求日益迫切。

ClearerVoice-Studio集成了语音增强、语音分离和音视频说话人提取等功能，通过融合复数域深度学习算法，大幅提升了语音降噪和分离的性能。该技术能够最大限度地消除背景噪声，保留语音清晰度，同时保持语音失真最小化。

阿里云、通义千问

ClearerVoice-Studio的核心模型与算法包括在2022年IEEE/INTER Speech DNS Challenge中获得整体第二的FRCRN模型，以及在语音分离任务中表现卓越的MossFormer系列模型。基于MossFormer2的48kHz语音增强模型在有效抑制噪声的同时，大幅降低了语音失真。

阿里巴巴通义实验室希望通过ClearerVoice-Studio平台，为开发者、研究者和企业提供强大的语音处理工具，助力创新应用落地。用户可以通过在线体验Demo，准备一段包含噪声的语音文件，上传至指定页面，一键处理后在线试听或下载处理结果，即刻获得清晰的音质和卓越的降噪效果。

GitHub 仓库:https://github.com/modelscope/ClearerVoice-Studio

在线体验 Demo:https://huggingface.co/spaces/alibabasglab/ClearVoice

ClearerVoice-Studio 语音处理阿里巴巴深度学习算法

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

AI日报：阿里最新视觉推理模型QVQ-Max；可灵AI上新AI音效功能；GPT-4o升级后性能飙升；Midjourney V7将于下周发布

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、阿里巴巴发布最新视觉推理模型QVQ-Max阿里巴巴旗下的AI研究团队Qwen发布了其最新的视觉推理模型QVQ-Max。尽管中美科技竞争加剧，该公司仍在寻求美国风投支持，因其专注于应用程序开发不受投资禁令限制。

2025年3月28号 15:40

700

中国初创公司蝴蝶效应谋求5亿美元融资，Manus AI智能体备受瞩目

据theinformation报道，蝴蝶效应（Butterfly Effect），一家运营AI智能体Manus的中国初创公司，正在与美国风投机构洽谈新一轮融资，目标估值达到5亿美元，较此前估值增长约五倍。该公司目前正在寻求数千万美元的融资，旨在扩大其全球AI产品的影响力。Manus是一款能够执行多种任务（如旅行预订、股票分析等）的AI智能体，迅速在社交媒体平台X(原Twitter)上引起了广泛关注。其热度部分源于美国市场对中国制造的AI产品兴趣的上升，这与中国量化对冲基金DeepSeek的成功密切相关。蝴蝶效应的目标市

2025年3月28号 11:12

3.2k

阿里巴巴发布最新视觉推理模型 QVQ-Max

2025 年 3 月 28 日，阿里巴巴旗下的AI研究团队Qwen再次掀起波澜，于凌晨三点正式发布了其最新的视觉推理模型——QVQ-Max。这一消息迅速在业界引发热烈讨论，众多科技爱好者和行业专家纷纷表达了对这一全新AI模型的期待与关注。QVQ-Max：视觉与推理的突破性结合根据阿里巴巴Qwen团队的官方公告，QVQ-Max是一款仍在不断进化中的视觉推理模型。作为此前QVQ-72B-Preview的正式升级版，该模型针对传统AI在视觉信息处理上的不足进行了大幅优化。它不仅能够"看懂"图片和视频，还能结合这些多模态信

2025年3月28号 8:40

4.7k

AI产品榜发布最新统计数据，夸克成国内唯一月活破亿AI应用

3月27日消息，AI产品榜最新统计数据显示，2025年2月份中国AI应用中仅夸克MAU破亿。AI产品榜认为，中国互联网巨头即将拉开AI 超级应用争夺战，而阿里夸克凭借MAU优势取得领先身位。AI产品榜指出，以阿里、腾讯、字节为代表的中国互联网巨头纷纷将战略重心转向 AI，他们将重燃战火，争夺 AI 时代的超级应用。最新消息显示，3月13日，阿里巴巴宣布推出AI旗舰应用——新夸克。全新夸克基于阿里通义领先的推理及多模态大模型，宣布告别传统搜索，升级为一个All in One的“AI超级框”，满足用

2025年3月27号 14:45

2.8k

阿里巴巴发布首个全模态大模型 Qwen2.5-Omni，挑战全球科技巨头

3月27日，阿里巴巴在凌晨时分隆重推出了其首个全模态大模型 —— 通义千问 Qwen2.5-Omni-7B。这款模型具有强大的功能，能够同时处理文本图像、音频和视频等多种输入方式，并且可以实时生成文本与自然语音输出。这一创新的技术突破，标志着阿里在人工智能领域的又一次进步。在权威的多模态融合任务 OmniBench 的评测中，Qwen2.5-Omni 取得了令人瞩目的成绩，刷新了行业纪录，全面超越了 Google 的 Gemini-1.5-Pro 等同类模型。这一结果不仅展现了 Qwen2.5-Omni 的强大能力，也进一步巩固了阿里在全

2025年3月27号 9:36

4.6k

蔡崇信警示AI数据中心泡沫!阿里重启招聘并定义AI战略三分类

3月25日，阿里巴巴集团董事会主席蔡崇信在汇丰全球投资峰会上发表观点，指出当前人工智能（AI）数据中心建设已初现泡沫迹象，他认为美国许多数据中心的投资公告存在“重复”或相互重叠的情况。与此同时，蔡崇信透露，阿里巴巴的员工数量已经触底，公司将重启招聘计划。针对当前蓬勃发展的AI浪潮，蔡崇信将参与其中的公司大致划分为三类:第一类是专注于模型研究与开发的企业，例如OpenAI和DeepSeek等;第二类是投资于基础设施建设的公司，例如数据库企业;而阿里巴巴则定位为第三

2025年3月26号 10:14

1.6k

iOS18.4正式版要来了：iOS 18.4 RC版发布苹果AI支持中文

苹果公司正式推送了iOS18.4的候选版本（RC版），这一版本通常预示着正式版即将在不久后发布，除非发现重大问题。此次更新的一大亮点是苹果AI功能的中文版本即将上线。

2025年3月26号 8:29

3.7k

阿里推出全新多模态模型 Qwen2.5-VL-32B：兼顾视觉语言与数学推理

在人工智能领域，阿里巴巴再次带来了重磅消息。近日，阿里开源了最新的多模态模型 ——Qwen2.5-VL-32B-Instruct。这款新模型是 Qwen2.5系列中的一员，其他版本包括3B、7B 和72B，而32B 版本在保持性能的同时，更加注重便捷的本地运行体验。Qwen2.5-VL-32B 经过强化学习的优化，在多个方面表现出色。首先，它的回答更加符合人类的认知习惯，这意味着用户在与模型互动时，将能获得更自然和流畅的交流体验。其次，这款模型在数学推理能力方面的提升也十分显著。无论是复杂的数学题还是几何体

2025年3月25号 10:03

2.3k

国产AI芯片崛起！消息称蚂蚁集团训练成本骤降20%，媲美英伟达

据彭博社援引知情人士报道，蚂蚁集团在人工智能领域取得了重大突破，通过采用阿里巴巴和华为生产的中国芯片，成功将AI模型的训练成本削减了20%。这一消息无疑为中国在关键技术领域的自主可控注入了新的动力。报道进一步指出，蚂蚁集团的内部测试显示，这些中国制造的AI芯片在性能上能够与行业领导者英伟达的同类产品相媲美。这一结果如果得到广泛验证和应用，将可能显著改变全球AI芯片市场的格局。图源备注：图片由AI生成，图片授权服务商Midjourney此前，市场曾有传言称中国

2025年3月25号 9:39

2.4k

DeepSeek概念股今日走强，百度、金山云、阿里巴巴领涨

港股DeepSeek概念股今日表现抢眼，多数个股强势上涨。截至发稿，百度集团-SW上涨9.18%，金山云上涨5.03%，阿里巴巴-W上涨4.58%。这一波行情背后，既有百度文心大模型技术迭代的催化，也受腾讯加速布局大模型引发的算力需求激增推动，叠加政策与市场情绪共振，科技板块热度持续升温。百度大模型技术突破3月16日，百度正式发布文心大模型4.5和文心大模型X1，两款模型已在文心一言官网免费向用户开放，并计划于6月30日开源4.5系列。据官方介绍，文心4.5在编程能力和多语言推理上显著提升

2025年3月18号 13:52

1.2k

AI资讯

AI日报

AI时间线

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图

去除背景噪声 阿里通义实验室开源语音处理技术ClearerVoice-Studio