近日,Adobe Research 与西北大学合作开发了一款名为 Sketch2Sound 的人工智能系统,这一工具有望彻底改变声音设计师的工作方式。Sketch2Sound 能够让用户通过哼唱、模仿声音以及用简单的文本描述来创建专业的音效和氛围音。这个系统分析了用户声带输入的三个关键要素:音量、音色(决定声音的明亮或阴暗)和音高。随后,它将这些特征与用户的文本描述相结合,从而生成所需的声音。例如,用户在输入 “森林氛围” 并发出短促的声响时,系统会自动将这些声响识别为鸟鸣,而无需具体的指
近日,美国前总统唐纳德・特朗普确认,Sriram Krishnan 将担任白宫科技政策办公室的人工智能(AI)高级政策顾问。Krishnan 曾是著名风险投资公司 Andreessen Horowitz 的合伙人,他将在政府内协调并制定 AI 相关政策。特朗普在声明中提到,Krishnan 的工作将与总统科学和技术顾问委员会紧密合作。Krishnan 在社交媒体平台 X 上表示,他将与前 PayPal 首席运营官 David Sacks 密切合作,后者最近被任命为特朗普的加密货币和 AI “沙皇”。Krishnan 表达了对这一机会的感激,表示希望为美国在人工智能领域的
据《华尔街日报》最新报道,OpenAI 备受关注的下一代人工智能模型 GPT-5(代号 Orion)研发进展不及预期,该项目正面临重大挑战。报道披露,在为期18个月的开发过程中,OpenAI 已完成至少两轮大规模训练。然而,初始训练速度低于预期,导致后续大规模训练既耗时又成本高昂。虽然 GPT-5的性能较前代有所提升,但目前的进展尚不足以证明其巨大的运营成本具有合理性。为推进项目发展,OpenAI 采取了多管齐下的数据获取策略。除利用公开数据和授权内容外,公司还专门雇用人员创建新数据
阿里云百炼大模型服务平台最近推出了“音视频实时互动”功能,使用户能够轻松搭建多模态AI应用,无需编程知识。这一新功能使得用户可以快速将AI模型集成到Web、iOS和Android应用中,并与他人分享。用户可以通过简单的步骤来搭建智能体应用:首先新建智能体应用,然后在阿里云百炼平台上选择并配置所需的文本、语音或视觉理解大模型。平台提供了200多种大模型,包括具备强大视觉智能体能力的阿里云Qwen2-VL大模型。接下来,用户需要编写提示词,设置音视频API-KEY,并发布自己的专属AI应用。