用一段简单的哼唱、一段节奏的敲击,就能让AI生成一段高品质的音乐或音效,这不再是幻想。一项名为Sketch2Sound的创新研究成果,展示了一种全新的AI模型,它可以通过声音模仿和文本提示来生成高质量的音频,为声音创作领域带来了革命性的突破。

用一段简单的哼唱、一段节奏的敲击,就能让AI生成一段高品质的音乐或音效,这不再是幻想。一项名为Sketch2Sound的创新研究成果,展示了一种全新的AI模型,它可以通过声音模仿和文本提示来生成高质量的音频,为声音创作领域带来了革命性的突破。

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
日本手绘平台TEGAKI上线,明确禁止AI生成内容,首日注册用户超5000人,远超预期,导致网站崩溃维护。平台由独立工程师兼艺术家Tochi开发,旨在为手绘爱好者提供纯粹创作空间。
苹果计划今年春季升级Siri,引入谷歌Gemini技术,使其更智能、个性化。新功能包括情感支持、行程预订和故事讲述,Siri将以更自然的对话方式回答各类问题。

公司计划于2026年9月发布代号“Sweetpea”的AI音频设备,目标首年出货4000万至5000万台。该设备采用椭圆形金属外壳与双胶囊后挂设计,内置2纳米AI芯片,并集成肌电信号等多模态交互组件。
韩国政府为发展自主AI,大力扶持本土大模型,但近期调查发现其核心代码与中美开源模型高度相似,引发对“国产”纯度的争议。

日本上线AI禁入插画平台TEGAKI,首日注册用户远超预期致网站崩溃。该平台由独立开发者创建,定位为人类艺术创作的“安全港湾”,完全禁止AI生成内容,引发创作者热捧。
韩国政府斥巨资推动的“本土大模型竞赛”陷入争议。五家决赛入围企业中,至少三家被指使用了中国和美国公司的开源代码,包括智谱AI、阿里巴巴、OpenAI等,引发对“国产AI是否真正自主”的激烈辩论。该项目旨在三年内打造纯韩国技术大模型,但代码依赖问题使其目标受到质疑。
OpenAI正联手前苹果设计官Jony Ive秘密研发代号“Sweetpea”的AI音频设备,旨在挑战苹果AirPods。该设备采用金属材质,外形酷似圆润鹅卵石,展现颠覆性设计理念。

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://app.aibase.com/zh1、爱诗科技发布全球首个通用实时世界模型PixVerseR1,最高1080P画质爱诗科技发布全球首个通用实时世界模型PixVerseR1,通过三大核心技术实现虚拟世界的实时交互体验,并在游戏、影视、直播等领域拓展出“人人可共创”的新可能。两个模型均基于去标识化的临床数据训练,并以开源形式发布,供全球研究者与开发者使用。

特斯拉将停止FSD买断销售,全面转向月度订阅模式。这一商业模式转变自2月14日起生效。FSD自2016年推出后持续升级,从Autopilot逐步发展为更高级的智能驾驶系统。2025年2月,特斯拉已在中国市场分批推送FSD功能。
公司发布新一代开源医疗大模型MedGemma 1.5及临床语音识别模型MedASR,强化医疗技术布局。MedGemma 1.5基于Gemma系列,重点提升医学影像理解能力,可处理文本病历、检验报告、医学文献及X光、CT等影像数据,辅助初步筛查与诊断。