谷歌在生成 AI 领域的最新尝试引起了广泛关注。经过几个月的平淡表现后,谷歌 Gemini 迅速走上了快车道,推出了新的实验性语言模型 ——Gemini-Exp-1206。根据最新的 ChatArena 排行榜显示,这款模型在众多竞争对手中脱颖而出,成为了生成 AI 的领跑者。Gemini-Exp-1206在 LMArena 上获得了最高的 Arena Score,达到了1379分,略高于 ChatGPT-4.0的1366分。这一得分表明,Gemini-Exp-1206在多项评估中表现出色,展现了其卓越的综合能力。此外,与之前的 Gemini-Exp-1114相比,新模型也显示出更强的性能。那么,什么
在周二的re:Invent大会上,亚马逊网络服务(AWS)宣布推出其新型多模式生成AI模型系列——Nova。此次发布的Nova系列包括四种文本生成模型:Micro、Lite、Pro和Premier,此外还推出了图像生成模型Nova Canvas和视频生成模型Nova Reel。亚马逊首席执行官Andy Jassy表示,Micro、Lite和Pro模型将在当天开始向AWS客户推出,而Premier模型预计将在2025年初发布。Nova系列专为处理多种输入形式(包括文本、图像、视频)而设计,其中文本生成模型特别优化了15种语言,主要支持英语。Nova文本生成模型Nova文本生成模型
格莱美奖项迎来历史性突破:披头士乐队借助AI技术完成的新歌《Now and Then》成功入围"年度制作"和"最佳摇滚表现"两项大奖,这标志着首个获得格莱美提名的AI辅助歌曲诞生。这首引发广泛关注的作品于去年末发布,其创作过程颇具传奇色彩。与外界普遍猜测的AI深度伪造技术不同,乐队实际运用了一项名为"音轨分离"(stem separation)的AI技术,成功从一段 60 年前的低质量录音中提取出已故成员约翰·列侬的人声。这项技术在音乐制作领域已有多次应用案例。比如,歌手SZA的专辑《SOS》中的
最近,Meta 与沙特阿拉伯的阿卜杜拉国王科技大学(KAUST)合作,推出了一款全新的视频扩散模型系列 ——MarDini。这个模型让高质量视频的创作变得更加简单和灵活,能够完成多种任务,比如填补视频中缺失的帧,将单张图片转换为动态场景,甚至还可以通过添加自然的连续帧来扩展短片段。在去年的基础上,Meta 在生成 AI 视频领域进一步发力。此前,它推出了 Emu Video 和 Emu Edit 等文本转视频和编辑模型。今年在发布 MarDini 之前,还推出了先进的视频编辑器 Movie Gen。由此可见,Meta 正在致