Llasa

基于Llama框架的TTS基础模型，兼容16万小时标记化语音数据。

普通产品生产力语音合成多语言

Llasa是一个基于Llama框架的文本到语音（TTS）基础模型，专为大规模语音合成任务设计。该模型利用16万小时的标记化语音数据进行训练，具备高效的语言生成能力和多语言支持。其主要优点包括强大的语音合成能力、低推理成本和灵活的框架兼容性。该模型适用于教育、娱乐和商业场景，能够为用户提供高质量的语音合成解决方案。目前该模型在Hugging Face上免费提供，旨在推动语音合成技术的发展和应用。

打开网站

Llasa 最新流量情况

月总访问量

29742941

跳出率

44.20%

平均页面访问数

5.9

平均访问时长

00:04:44

Llasa 访问量趋势

Llasa 访问地理位置分布

Llasa 流量来源

Llasa 替代品

Sesame AI — Sesame AI 是一款先进的语音合成平台，能够生成自然对话式语音并具备情感智能。

其他

AI资讯

AI日报

AI时间线

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图

Llasa

Llasa 最新流量情况

Llasa 访问量趋势

Llasa 访问地理位置分布

Llasa 流量来源

Llasa 替代品

Sesame AI — Sesame AI 是一款先进的语音合成平台，能够生成自然对话式语音并具备情感智能。

Llasa — 基于Llama框架的TTS基础模型，兼容16万小时标记化语音数据。

Orpheus TTS — 一个开源文本转语音系统，致力于实现人类语音的自然化。

Sesame CSM — 一个用于生成对话式语音的模型，支持从文本和音频输入生成高质量的语音。

Beyond Presence — 提供超逼真的交互式虚拟形象，用于变革数字互动体验。

Phind.com — Phind是一款先进的人工智能搜索工具，支持多语言和多搜索功能。

Octave TTS — Octave TTS 是首个能够理解文本含义的语音合成模型，能够生成富有情感和风格的语音。

IndexTTS — 工业级可控高效的零样本文本到语音系统

Zonos-v0.1-hybrid — Zonos-v0.1-hybrid 是一款领先的开源文本转语音模型，能够提供高质量的语音合成服务。

Llasa-1B — Llasa-1B 是一个基于 LLaMA 的文本转语音 (TTS) 模型，支持中英文语音合成。

voyage-3-large — 最新推出的多语言通用嵌入模型，在多个领域表现卓越。

shoonya — 商业领域基础模型与代理

Grok.com — 智能助手，提供即时帮助

CosyVoice 2 — 可扩展的流媒体语音合成技术，结合大型语言模型。

CosyVoice语音生成大模型2.0-0.5B — 高效、多语种的语音合成模型

Univerbal — 口袋里的人工智能语言辅导员

Aya Expanse 32B — 多语言大型语言模型，支持23种语言

F5-TTS — 基于深度学习的高质量文本到语音合成模型

Llama 3.2 3b Voice — 使用Llama模型的语音合成工具

Llama-3.2-3B — 多语言大型语言模型

VALL-E 2 — 微软亚洲研究院开发的语音合成技术

Chub — 面向所有人的通用人工智能平台

EVI 2 — 新型基础语音对语音模型，提供人性化对话体验。

D-ID AI Video Translate — 使用AI技术将视频翻译成多种语言

Math AI — AI驱动的数学解题助手

CLASI — 高质量、类人同声传译系统

RapidOCR — 快速、多语言支持的OCR工具包

CosyVoice — 多语言大型语音生成模型，提供全栈推理、训练和部署能力。

CodeGeeX4-ALL-9B — 开源的多语言代码生成模型