OuteTTS-0.1-350M:一种新颖的文本转语音合成方法，具有零样本语音克隆功能

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年11月6号 11:24

274

近日，Oute AI 发布了一种新颖的文本转语音合成方法，称为 OuteTTS-0.1-350M。这种方法利用纯语言建模，无需外部适配器或复杂架构，提供了一种简化的 TTS 方法。OuteTTS-0.1-350M 基于 LLaMa 架构，使用 WavTokenizer 直接生成音频标记，使得流程更加高效。

该模型具有零样本语音克隆功能，仅需几秒钟的参考音频即可复制新的声音。OuteTTS-0.1-350M 专为设备性能而设计，并与 llama.cpp 兼容，使其成为实时应用的理想选择。尽管该模型的参数规模相对较小（3.5亿个），但其性能可与更大、更复杂的 TTS 系统相媲美。

OuteTTS-0.1-350M 的可访问性和效率使其适用于广泛的应用，包括个性化助理、有声读物和内容本地化。Oute AI 在 CC-BY 许可下发布，鼓励进一步实验和集成到不同的项目中，使先进的 TTS 技术民主化。

OuteTTS-0.1-350M 的发布标志着文本转语音技术向前迈出了关键一步，它利用简化的架构以最少的计算要求提供高质量的语音合成。它集成了 LLaMa 架构，使用了 WavTokenizer，并且能够执行零样本语音克隆而无需复杂的适配器，这使它有别于传统的 TTS 模型。

地址：https://www.outeai.com/blog/OuteTTS-0.1-350M

Meta 宣布举办首届生成式 AI 开发者大会 LlamaCon，聚焦 Llama 系列模型

Meta 公司近日宣布，将于4月29日举行首届 LlamaCon 开发者大会，专注于其 Llama 系列生成式 AI 模型的最新进展。这一大会旨在为开发者提供一个平台，分享开源 AI 的最新成果，帮助他们更好地构建应用和产品。随着生成式 AI 技术的迅猛发展，Meta 希望通过此次大会进一步推动其生态系统的建设。在这场即将到来的大会上，Meta 计划展示多项与 Llama 模型相关的新功能和技术进展。Llama 模型自推出以来下载量已达数亿次，已经吸引了至少25个合作伙伴进行托管，显示出其在行业中的广泛应用。Met

HYBE旗下AI 声音工具Supertone Play上线：10秒搞定声音克隆

近日，HYBE 旗下的人工智能语音公司 Supertone 宣布推出了一款名为 “Supertone Play” 的文本转语音工具，旨在生成高质量、富有表现力的音频内容。这款新工具目前支持英语、韩语和日语，预计在今年内将扩展至西班牙语和中文。Supertone Play 提供了150种声音角色，适用于多种内容创作需求，包括自然对话、专业播报新闻和有声读物，以及潮流驱动的搞笑声音。此外，它还具备语音克隆功能，用户可以在短短10秒钟内根据自己的声音创建个性化的声音角色，并能够调整不同的情感语调，以满足不

加速 AI 布局！Meta 寻求收购AI芯片公司 FuriosaAI

据《福布斯》报道，Meta（前称 Facebook）正在积极洽谈收购一家名为 FuriosaAI 的韩国芯片初创公司。此举旨在增强 Meta 的人工智能硬件基础设施，以应对日益增长的 AI 需求。FuriosaAI 由多位前三星和 AMD 员工创办，专注于开发能够加速人工智能模型运行的芯片，适用于 Meta 的文本生成模型，如 Llama2和 Llama3等。图源备注:图片由AI生成，图片授权服务商MidjourneyFuriosaAI 的技术不仅能够提升 AI 模型的效率，还能为 Meta 在该领域的竞争力提供支持。根据 Crunchbase 的数据，该公司至今已成功从韩国科技

Cerebras与Perplexity携手打造超高速AI搜索模型Sonar，瞄准千亿美元市场

近日，Cerebras Systems 与 Perplexity AI 宣布达成合作，共同推出一款新的超快速 AI 搜索模型 Sonar，旨在挑战传统搜索引擎的主导地位。合作的核心在于 Sonar 模型，该模型在 Cerebras 专用的 AI 芯片上运行，速度达到每秒1200个标记，成为目前市场上最快的 AI 搜索系统之一。Sonar 模型建立在 Meta 的 Llama3.370B 基础上，标志着一种新型 AI 优先的搜索体验，双方对其快速性能寄予厚望。Perplexity 的首席技术官 Denis Yarats 表示:“与 Cerebras 的合作对于 Sonar 的实现至关重要。Cerebras 的尖端 AI 推理基础设施使我