EmoPP

使用情绪感知的韵律分析,提高语音合成的情绪表达能力

中文精选编程语音合成韵律分析

EmoPP是一个情绪感知的韵律分析模型,它可以更准确地挖掘语音的情感线索,预测更合适的停顿位置,从而提高端到端语音合成系统的情绪表达能力。该模型通过在ESD数据集上进行客观观察,证明了情绪和韵律分析之间存在强相关性。目标评估和主观评估结果表明,EmoPP模型优于所有基准,在情绪表达方面取得了显著的效果。

Best AI Websites & Tools

EmoPP

EmoPP 最新流量情况

EmoPP 访问量趋势

EmoPP 访问地理位置分布

EmoPP 流量来源

EmoPP 替代品

讯飞开放平台 — 基于语音交互的人工智能开放平台

依图语音开放平台 — 提供语音识别、语音合成等语音AI能力

OLAMI 人工智能开放平台 — OLAMI是一个人工智能开放平台

星声AI — 星声AI是一个AI播客生成器，可以从任何内容生成AI博客。

Zonos-v0.1-hybrid — Zonos-v0.1-hybrid 是一款领先的开源文本转语音模型，能够提供高质量的语音合成服务。

LLaSA_training — LLaSA： 扩展基于 LLaMA 的语音合成的训练时间和测试时间计算量

Llasa-1B — Llasa-1B 是一个基于 LLaMA 的文本转语音 (TTS) 模型，支持中英文语音合成。

Llasa-3B — Llasa-3B 是一个基于 LLaMA 的文本到语音合成模型，支持中英文语音生成。

AI ContentCraft — AI ContentCraft 是一个多功能内容创作工具，集成了文本生成、语音合成和图像生成能力。

Hailuo AI Audio — Hailuo AI Audio是一款创建逼真语音的音频合成工具。

kokoro-onnx — 基于Kokoro和ONNX运行时的文本到语音（TTS）项目。

audiblez — 将电子书转换为有声书的工具。

Kokoro-82M — 一个拥有8200万参数的前沿文本到语音（TTS）模型。

Synthesys — AI内容生成平台，提供视频、语音和图像生成服务

Voxdazz — AI名人声音生成器，让文字变声音。

ElevenLabs Flash — 快速生成类人语音的TTS模型

Gemini 2.0 Flash Experimental — Google DeepMind开发的高性能AI模型

CosyVoice 2 — 可扩展的流媒体语音合成技术，结合大型语言模型。

CosyVoice语音生成大模型2.0-0.5B — 高效、多语种的语音合成模型

GaussianSpeech — 音频驱动的高保真3D人头化身合成技术

OuteTTS-0.2-500M — 高性能的文本到语音合成模型

小视频宝 — AI驱动的视频生成工具，一键生成高质量营销视频

OuteTTS — 一个实验性的文本到语音模型

OuteTTS-0.1-350M — 一款通过纯语言模型实现的文本到语音合成模型

Fish Speech — 语音合成工具，提供高质量的语音生成服务

MiniMates — 轻量级图片数字人驱动算法，快速定制AI伙伴

SoundStorm — 高效并行音频生成技术

MaskGCT TTS Demo — 基于MaskGCT模型的文本到语音演示

GLM-4-Voice — 端到端中英语音对话模型

LLaSA_training — LLaSA：扩展基于 LLaMA 的语音合成的训练时间和测试时间计算量