AI新闻资讯

AI资讯

不错过全球AI革新的每一个时刻

AI日报

每天三分钟关注AI行业趋势

AI时间线

AI行业大事记

Al硬件

列出所有AI硬件产品。

AI变现指南

最新案例

AI变现案例分享

图片合集

AI图片制作变现案例分享

视频合集

AI视频制作变现案例分享

音频合集

AI音频制作变现案例分享

文案合集

AI内容写作变现案例分享

AI教程

最新教程

免费分享最新AI教程内容

AI产品榜

AI产品排行榜

展示AI网站的总访问量排名

AI产品流量增速榜

追踪AI网站访问量增长最快产品

AI产品流量下降榜

关注访问量下降明显的AI网站

AI产品周榜

展示AI网站的周访问量排名

热门国家排行榜

美国

美国用户最喜欢的AI网站

中国

中国用户最喜欢的AI网站

印度

印度用户最喜欢的AI网站

巴西

巴西用户最喜欢的AI网站

热门分类榜

图片生成

AI图片生成网站总访问量榜单

个人助理

AI个人助理网站总访问量榜单

角色生成网站

AI角色生成网站总访问量榜单

视频生成

AI视频生成网站总访问量榜单

热门开源数据榜单

AI项目榜单

热门AI项目总Start榜单

AI项目增速榜

热门AI项目增速榜

AI开发者排名

热门AI开发者排名

AI组织排名

热门AI组织排名榜单

热门开源分类

deepseek

热门deepseek开源项目

TTS

热门TTS开源项目

LLM

热门LLM开源项目

ChatGPT

热门ChatGPT开源项目

AI开源项目库

全景图

github热门AI开源项目总览

产品库工具导航

CSM 1B

CSM 1B 是一个由 Sesame 开发的文本到语音生成模型，可生成高质量的音频。

普通产品其他语音合成文本到语音

CSM 1B 是一个基于 Llama 架构的语音生成模型，能够从文本和音频输入中生成 RVQ 音频代码。该模型主要应用于语音合成领域，具有高质量的语音生成能力。其优势在于能够处理多说话人的对话场景，并通过上下文信息生成自然流畅的语音。该模型开源，旨在为研究和教育目的提供支持，但明确禁止用于冒充、欺诈或非法活动。

CSM 1B

CSM 1B 最新流量情况

月总访问量

27175375

跳出率

44.30%

平均页面访问数

5.8

平均访问时长

00:04:57

CSM 1B 访问量趋势

CSM 1B 访问地理位置分布

CSM 1B 流量来源

CSM 1B 替代品

CSM 1B — CSM 1B 是一个由 Sesame 开发的文本到语音生成模型，可生成高质量的音频。

•语音合成•文本到语音

MegaTTS 3 — 一个高效的语音合成模型，支持中英文及语音克隆。

•语音合成•深度学习

Llasa-3B — Llasa-3B 是一个基于 LLaMA 的文本到语音合成模型，支持中英文语音生成。

•文本到语音•语音合成

Kokoro-82M — 一个拥有8200万参数的前沿文本到语音（TTS）模型。

•文本到语音•语音合成

Synthesys — AI内容生成平台，提供视频、语音和图像生成服务

•AI视频•AI语音

OuteTTS-0.2-500M

OuteTTS-0.2-500M — 高性能的文本到语音合成模型

•文本到语音•语音合成

OuteTTS — 一个实验性的文本到语音模型

•文本到语音•语音合成

OuteTTS-0.1-350M — 一款通过纯语言模型实现的文本到语音合成模型

•文本到语音•语音合成

Fish Speech — 语音合成工具，提供高质量的语音生成服务

•语音合成•深度学习

MaskGCT TTS Demo — 基于MaskGCT模型的文本到语音演示

•文本到语音•深度学习

MaskGCT — 无需对齐信息的零样本文本到语音转换模型

•文本到语音•零样本学习

F5-TTS — 基于深度学习的高质量文本到语音合成模型

•文本到语音•深度学习

VALL-E 2 — 微软亚洲研究院开发的语音合成技术

•语音合成•文本到语音

OptiSpeech — 轻量级端到端文本到语音模型

•文本到语音•深度学习

Bailing-TTS — 生成高质量中文方言语音的大规模文本到语音模型。

•文本到语音•方言

ToucanTTS — 多语言可控文本到语音合成工具包

•文本到语音•语音合成

Seed-TTS — 高质量、多功能的语音合成模型系列

•语音合成•文本到语音

EaseVoice Trainer — 一个简单易用的语音克隆和语音模型训练工具。

•语音合成•机器学习

OpenAI.fm — 开发者可互动体验 OpenAI API 中的新语音模型gpt-4o-transcribe， gpt-4o-mini-transcribe and gpt-4o-mini-tts。

•语音合成•开发者工具

Orpheus TTS — 一个开源文本转语音系统，致力于实现人类语音的自然化。

•文本转语音•开源

Sesame CSM — 一个用于生成对话式语音的模型，支持从文本和音频输入生成高质量的语音。

•语音合成•开源

Sesame AI — Sesame AI 是一款先进的语音合成平台，能够生成自然对话式语音并具备情感智能。

•语音合成•自然语言处理

Spark-TTS — Spark-TTS 是一种基于大语言模型的高效单流解耦语音合成模型。

•语音合成•大语言模型

Llasa — 基于Llama框架的TTS基础模型，兼容16万小时标记化语音数据。

•语音合成•多语言

Octave TTS — Octave TTS 是首个能够理解文本含义的语音合成模型，能够生成富有情感和风格的语音。

•语音合成•情感化语音

IndexTTS — 工业级可控高效的零样本文本到语音系统

•语音合成•自然语言处理

星声AI — 星声AI是一个AI播客生成器，可以从任何内容生成AI博客。

•播客•内容创作

PDF to Podcast Blueprint by NVIDIA

PDF to Podcast Blueprint by NVIDIA — 将PDF转换为音频内容，打造个性化的AI有声读物。

•生成式AI•文本到语音

Zonos — Zonos-v0.1 是一个领先的开放权重文本到语音模型，能够生成高质量的多语言语音。

•文本到语音•语音克隆

Zonos-v0.1-hybrid — Zonos-v0.1-hybrid 是一款领先的开源文本转语音模型，能够提供高质量的语音合成服务。

•文本转语音•语音合成