英伟达出品！AI音频模型Fugatto：输入文本、音频可生成音乐、音效

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年11月26号 9:29

226

在音乐和声音创作领域，技术与创意的结合总是面临诸多挑战。现有的 AI 模型往往只擅长特定的任务，缺乏广泛的适应性，这使得 AI 在音乐制作中的辅助作用受限。为了让 AI 更好地服务于音乐与音频生产，亟需一款能够灵活应对各种创作需求的通用模型。为此，NVIDIA 推出了 Fugatto，这是一款拥有25亿参数的音频生成与处理模型。

Fugatto 的设计旨在通过结合文本提示与先进的音频合成能力，提供高灵活度的声音输入和创作实验空间。例如，它可以将钢琴旋律转变为人声演唱，或者让小号发出意想不到的声音。

Fugatto 不仅支持文本输入，还支持可选的音频输入，打破了传统音频生成模型的局限，使得艺术家和开发者能够实时进行创作与修改，流畅地生成新类型的声音。

在技术方面，Fugatto 采用了一种创新的数据生成方法，超越了传统的监督学习。它的训练不仅依赖于常规数据集，还结合了专门生成的数据集，从而创建了丰富多样的音频与转换任务。此外，Fugatto 借助大语言模型（LLM）来增强指令生成能力，更好地理解音频与文本提示之间的关系。

一个重要的创新是 “可组合音频表示变换”（ComposableART），这是一种在推理时使用的技术，能够灵活地结合、插值或否定不同的音频生成指令。ComposableART 使得用户在音频合成过程中拥有更高的控制力，可以精确地导航 Fugatto 的声音调色板，创造出独特的声音现象。

Fugatto 的架构基于增强型的 Transformer 模型，采用了自适应层归一化等特定修改，能够在多种输入条件下保持一致性，支持复杂的组合指令。初步测试表明，Fugatto 在常见基准测试中表现不俗，特别是在声音合成和变换方面，与其他专业模型相比，显示出更强的能力。

Fugatto 的推出标志着音频生成 AI 的一次重要进步，突破了传统的局限，为创意音频制作提供了强大且灵活的工具。其在音乐、游戏、娱乐和教育等多个领域的潜在应用，意味着 AI 技术将继续在助力人类创造力方面发挥重要作用。

官方博客:https://blogs.nvidia.com/blog/fugatto-gen-ai-sound-model/

论文:https://d1qx31qr3h6wln.cloudfront.net/publications/FUGATTO.pdf

划重点:
🎵 Fugatto 是 NVIDIA 推出的音频 AI 模型，拥有25亿参数，支持文本与音频输入，助力音乐与声音创作。
💻 采用创新的数据生成方法和可组合音频表示变换技术，使得用户能够灵活生成和修改声音。
🌟 初步测试显示，Fugatto 在音频合成与变换方面的表现优于多种专业模型，展示了其强大的创意潜力。

小米公布AI通信相关专利

企查查APP显示，2月11日，北京小米移动软件有限公司申请的“一种人工智能通信方法、装置及存储介质”专利公布。专利摘要显示，本公开是关于一种人工智能通信方法、装置及存储介质。人工智能通信方法包括:确定第一时间，第一时间用于表示基于AI模型处理AI任务的处理时间;基于第一时间，进行基于AI模型的AI通信处理。本公开通过对第一时间的确定，实现了基于AI模型的通信处理所用的时间确定。

LG 的 Exaone AI 模型以成本效率匹敌DeepSeek

近期，美国知名研究机构 Epoch AI 发布了一份报告，正式将 LG 的 Exaone3.532B 模型评选为 “值得注意的 AI” 之一，并在成本效率方面表现尤为突出，与中国的 DeepSeek 不相上下。LG Exaone3.5模型于2023年12月正式推出，其开发投资约为70亿韩元（约合480万美元），这一成本低于 DeepSeek 开发其 V3模型所花费的600万美元。Epoch AI 的评估标准主要考虑了模型的性能、使用频率等因素，而这也是两年来首个获得此类认可的韩国 AI 模型，显示了 LG 在人工智能领域的突破性进展。LG AI 研究所的负责人裵庆勋在

AI营养助手Alma上线:用生成式模型重新定义健康追踪

由健身科技公司Whoop前产品副总裁Rami Alhamad创立的AI营养应用Alma，今日正式登陆北美iOS平台。这款应用通过整合生成式AI模型与哈佛营养学知识库，试图以“对话式交互+智能识别”颠覆传统卡路里追踪模式，将繁琐的手动输入转化为自然对话，为用户提供个性化饮食管理服务。图片来源: Alma从语音到照片:AI驱动的无感记录与MyFitnessPal等传统应用不同，Alma允许用户通过语音或文字直接描述饮食内容，AI助手将自动估算食物分量与热量，并支持拍照识别菜品。应用还提供实时调整功能——若AI估

人形机器人新秀 Figure 宣布独立研发，终止与OpenAI的合作关系

近日，硅谷人形机器人公司 Figure 通过社交媒体宣布，正式终止与人工智能巨头 OpenAI 的合作。这一决定令业内人士颇感意外，尤其是 Figure 曾在去年与 OpenAI 达成协议，共同开发新一代面向人形机器人的 AI 模型。Figure 创始人布雷特・阿德科克（Brett Adcock）表示，公司在端到端机器人 AI 技术上取得了 “重大突破”，因此决定将重心转向自主研发。他未透露具体技术细节，但表示将在未来30天内推出一项可能 “颠覆人形机器人行业” 的创新成果。图源备注：图片由AI生成，图片授权服务商Mi