AudioSep

基于自然语言查询的开放领域音频源分离模型

普通产品音乐音频分离自然语言查询

AudioSep是一种基于自然语言查询的开放领域音频源分离模型。它由文本编码器和分离模型两个关键组件组成。我们在大规模多模态数据集上训练AudioSep，并在许多任务上广泛评估其能力，包括音频事件分离、乐器分离和语音增强。AudioSep表现出强大的分离性能和令人印象深刻的零样本泛化能力，使用音频标题或文本标签作为查询，大大优于以前的音频查询和语言查询声音分离模型。为了保证本工作的可重复性，我们将发布源代码、评估基准和预训练模型。

Best AI Websites & Tools

AudioSep

AudioSep 最新流量情况

AudioSep 访问量趋势

AudioSep 访问地理位置分布

AudioSep 流量来源

AudioSep 替代品

UVR5-UI — 使用Gradio UI的Ultimate Vocal Remover 5，分离音频文件。

MVSEP — MVSEP能够将音频中的语音和音乐部分分离。

Ultimate Vocal Remover GUI — 免费人声分离工具 分离伴奏背景音乐提取

Soundify — Soundify是一个 AI 驱动的音频编辑工具

InspireMusic — 基于 PyTorch 的音乐、歌曲和音频生成工具包，支持高质量音频生成

Narrative BI AI Data Analyst — Narrative BI AI Data Analyst 提供自然语言查询和生成式 AI 数据分析，帮助用户快速获取数据洞察。

AIVocal — AI智能在线人声消除工具

OmniAudio-2.6B — 世界上最快的边缘部署音频语言模型

Vocal Remover Online — 在线人声消除工具，分离伴奏和人声

ComfyUI-MMAudio — ComfyUI节点，用于MMAudio模型的音频处理

Auralis — 快速文本转语音引擎

SongCleaner — AI技术去除歌曲中的不适当词汇

Suno v4 — 音乐创作平台，提供高质量音频和歌词创作。

Moises App — 音乐人的AI音频分离工具

Mikrotakt — 使用先进AI技术从歌曲或视频中提取人声、伴奏等音频。

AI Voice Lab — 在线将文字转换为逼真的语音

OuteTTS-0.1-350M — 一款通过纯语言模型实现的文本到语音合成模型

Analytics Model — 即时、可操作的洞察力分析平台

hertz-dev — 开源的全双工音频生成基础模型

Fish Agent V0.1 3B — 高精度环境音频信息捕捉与生成的语音转语音模型

Browser AI Kit — 在浏览器中直接运行的AI工具箱

Universal-2 — 下一代语音AI，提供卓越的音频数据处理能力。

Cartesia Voice Changer — 音频变声技术，转换声音同时保留原始表达和情感

易我人声分离 — 利用AI技术分离音乐/视频中的人声和伴奏

DiariZen — 一个用于说话人分割的工具包

AILIBRI — 一个全面的AI神经网络工具目录

AI Tools List — AI工具大全，发现并使用最佳的AI工具。

EzAudio — 高效生成高质量文本到音频模型

Seed-Music — 音乐生成系统，支持多语言声乐生成和音乐编辑。

Ultimate Vocal Remover GUI — 免费人声分离工具分离伴奏背景音乐提取