Adobe推出新AI工具可让声音设计师通过哼唱和模仿声音来创作音频

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年12月23号 9:45

Adobe Research与西北大学联合开发出一项突破性的AI系统Sketch2Sound，该技术能将简单的人声模仿和文字描述转化为专业级音效，有望彻底改变声音设计行业的工作方式。

该系统会分析语音输入的三个关键元素:响度、音色（决定声音的明亮程度）和音调。然后，系统会将这些特征与文本描述相结合，生成所需的声音。

视频:García 等人，Adobe Research

Sketch2Sound 的有趣之处在于它能够理解上下文。例如，如果有人输入“森林氛围”并发出短促的声音，系统会自动识别出这些声音应该是鸟叫声 - 而无需特定指令。

同样的智能也适用于音乐。在创建鼓点模式时，用户可以输入“低音鼓、小军鼓”，然后使用低音和高音哼唱节奏。系统会自动将低音鼓放在低音上，将小军鼓放在高音上。

为专业人士提供精细控制

研究团队内置了特殊的过滤技术，让用户可以调整控制生成声音的精确度。声音设计师可以根据自己的需求选择精确、细致的控制或更轻松、近似的方法。

这种灵活性使得 Sketch2Sound 对于拟音师（为电影和电视节目制作音效的专业人士）来说特别有价值。他们无需操纵物理对象来发出声音，而是可以通过语音和文本描述更快地创建效果。

研究人员指出，输入录音的空间音频特性有时会以不想要的方式影响生成的声音，但他们正在努力解决这个问题。Adobe 尚未宣布 Sketch2Sound 何时或是否会成为商业产品。

Adobe推新AI音频具Sketch2Sound ，只需哼唱和模仿声音就能创建音效

近日，Adobe Research 与西北大学合作开发了一款名为 Sketch2Sound 的人工智能系统，这一工具有望彻底改变声音设计师的工作方式。Sketch2Sound 能够让用户通过哼唱、模仿声音以及用简单的文本描述来创建专业的音效和氛围音。这个系统分析了用户声带输入的三个关键要素:音量、音色（决定声音的明亮或阴暗）和音高。随后，它将这些特征与用户的文本描述相结合，从而生成所需的声音。例如，用户在输入 “森林氛围” 并发出短促的声响时，系统会自动将这些声响识别为鸟鸣，而无需具体的指

Anthropic发布开源MCP协议推动AI系统与数据源的双向连接

11月25日消息，人工智能公司Anthropic宣布推出一项新的开源标准——模型上下文协议（MCP），旨在通过将AI助手与业务工具和软件等数据源连接，提升模型对查询的响应质量和相关性。MCP的发布意味着AI助手在处理任务时，能够直接从不同的数据源中提取信息，避免了“信息孤岛”的问题。在一篇博客文章中，Anthropic表示，尽管AI助手在推理和质量方面已取得快速进展，但目前大多数模型仍受限于与数据的隔离，无法直接访问存储的数据。这使得每个数据源都需要单独的定制实现，从而导致互

英伟达 CEO 称自己也痴迷于谷歌NotebookLM AI 工具

英伟达公司在人工智能领域的领导地位毋庸置疑，近期，该公司发布的季度财报显示，英伟达在上一季度售出了价值310亿美元的 AI 系统。作为公司的联合创始人及首席执行官黄仁勋最近在一次与华尔街分析师的交流中，强调了人工智能在各行各业的重要应用。在这次交流中，黄仁勋提到了谷歌的 Notebook LM 工具，他表示自己 “非常频繁地使用” 这个 AI 工具。Notebook LM 是一款用户可以上传文档的 AI 工具，能够生成文档内容的摘要，建议用户提出问题，与用户进行关于文档的对话，并能将内

颠覆影视创作！Odyssey携1800万美元融资推出实景AI重建技术，好莱坞级视觉效果触手可及

一家令人瞩目的创业公司正在开发一项突破性的AI系统，承诺将为创作者带来前所未有的电影级世界生成能力。这家名为Odyssey的公司采用了一种独特的方式:让工作人员背着特制相机系统，实地采集全球各地的场景数据。由自动驾驶领域的资深专家Oliver Cameron和Jeff Hawke创立的Odyssey最近完成了1800万美元A轮融资，由EQT Ventures领投，GV和Air Street Capital参投。至此，公司总融资额达到2700万美元。这笔资金将主要用于扩大其在加利福尼亚州的数据采集业务。Odyssey开发的先进摄影系统重约25磅，配备了

AI新闻资讯

Adobe推出新AI工具 可让声音设计师通过哼唱和模仿声音来创作音频