字节发布AnimateDiff-Lightning模型 4步推理就能生成高质量视频

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
近日,人工智能视频生成领域的领军企业Runway宣布推出其最新模型“Gen-4Turbo”,为AI驱动的视频创作带来了显著的技术升级。据悉,这一版本在生成速度上实现了重大突破,仅需30秒即可生成一段10秒的高质量视频。这一进展不仅提升了创作效率,也进一步巩固了Runway在生成式AI领域的领先地位,为影视制作、广告设计等行业注入了新的活力。Gen-4Turbo是Runway Gen-4系列的最新迭代版本,延续了其前代在图像到视频生成(Image-to-Video)及世界一致性(World Consistency)上的技术优势,同时将速度优化推
Mozilla 最近通过其 Mozilla Builders 计划推出了一款名为 LocalScore 的工具,旨在为本地大型语言模型(LLM)提供便捷的基准测试。该工具兼容 Windows 和 Linux 系统,具有极大的潜力,成为了易于分发的 LLM 框架的重要组成部分。尽管 LocalScore 仍处于早期开发阶段,但其表现已相当不错。LocalScore 是基于上周发布的 Llamafile0.9.2版本开发的,这一更新使得 LocalScore 成为一款实用的基准测试工具,能够在 CPU 和 GPU 上进行大型语言模型的性能评估。通过这一工具,用户可以轻松测量 LLM 系统的性能,获取快
亚马逊近日对其 AI 视频生成模型 Nova Reel 进行了升级,推出了 Nova Reel1.1版本。这个新版本不仅能够生成长达两分钟的视频片段,还可以制作多镜头视频,使得各个镜头之间的风格保持一致。Nova Reel 于2024年12月首次发布,是亚马逊在生成视频领域的重要尝试。据 AWS 开发倡导者 Elizabeth Fuentes 在一篇博文中透露,用户可以通过提供最长4,000个字符的提示,生成由六秒镜头组成的长视频。新版的 Nova Reel 还引入了一种名为 “Multishot Manual” 的新模式。在这种模式下,用户可以提供图像和文本提
近日,阿里巴巴旗下研发团队发布了一项名为“OmniTalker”的全新AI技术项目,该项目凭借其惊艳的视频生成能力迅速引发业界关注。据悉,OmniTalker仅需一段参考视频,便能精准捕捉视频中人物的语音风格与面部表情,并以此为基础生成唇形同步、表情自然的动态视频。这一技术的亮相,不仅展现了阿里在生成式AI领域的深厚实力,也为视频内容创作带来了革命性的可能性。OmniTalker的核心优势在于其“零样本学习”能力。传统AI视频生成技术往往需要大量训练数据、复杂的模型调参或专业配
在人工智能技术日益普及的今天,DeepSeek与清华大学的合作引起了业界的广泛关注。作为一家中国初创公司,深思科技以其在低成本推理模型方面的突破而闻名,而这一次,他们希望通过与清华大学的学术合作,进一步降低 AI 模型的训练成本,从而提升运营效率。DeepSeek近期推出了一种新的低成本推理模型,引发了市场的热烈反响。为了进一步优化这一模型,深思科技的研究团队与清华大学的学者们共同探讨了一个全新的强化学习方法。这种方法旨在使 AI 模型在进行学习时更加高效,能够
在量子计算领域,中国再次取得了显著进展。据《科创板日报》报道,来自安徽省量子计算工程研究中心与合肥综合性国家科学中心人工智能研究院等机构联合研发的量子计算机 “本源悟空”,近日成功地运行了全球首个十亿参数的人工智能(AI)模型微调任务。这一里程碑式的成就,标志着量子计算首次在实际应用中实现大规模的 AI 模型处理。本源悟空是中国自主研发的第三代超导量子计算机,配备有72位自制超导量子芯片 “悟空芯”。其设计理念受到中国传统神话人物孙悟空的启发,
近日,人工智能视频生成领域的先锋企业Luma宣布,其旗舰模型Ray2迎来了一项重大功能更新——“相机运动概念”(Camera Motion Concepts)。这一功能通过引入20多种经过精确调校的摄像机运动模式,为AI生成的视频赋予了专业电影级的镜头表现力。这一创新不仅提升了视频创作的艺术性与精确性,也为广告制作、影视预览等领域带来了全新的可能性,标志着AI视频技术向更高层次迈进。据介绍,Ray2的相机运动概念功能涵盖了多种经典与现代的镜头运动方式,包括推进/拉远(Zoom/Push)、左右环
近日,科技巨头谷歌悄然发布了其最新的旗舰人工智能模型——Gemini2.5Pro,并迅速在开发者社区引发了巨大的轰动。谷歌称其为“有史以来最智能的模型”,而现在,这款强大的模型已经通过 Gemini API 在 Google AI Studio 上开启公开预览,并将很快在 Vertex AI 上线。这一举措不仅让更多开发者能够体验到顶尖AI的能力,其极具竞争力的定价策略更是引发了业界的广泛关注。虽然谷歌并未在公告中详细列出 Gemini2.5Pro 的所有功能特点,但其被誉为“有史以来最智能的模型”本身就暗示了其在推理能
Meta周六发布了其新旗舰AI模型Maverick,该模型在LM Arena评测中排名第二。LM Arena是一项依靠人类评分者比较不同模型输出并选择偏好的测试平台。然而,多位AI研究人员很快发现,Meta部署到LM Arena的Maverick版本似乎与开发人员广泛使用的版本存在显著差异。Meta在公告中承认,LM Arena上的Maverick是一个"实验性聊天版本"。与此同时,Llama官方网站上的图表显示,Meta的LM Arena测试使用的是"针对对话性进行了优化的Llama4Maverick"。这种差异引发了研究社区的质疑。AI研究人员在社交平台X上指出,公开可
谷歌近期正式公布了 Gemini2.5Pro 的 API 定价情况。在输入 tokens 不超过20万时,每百万输入 tokens 的基础定价为1.25美元,约合人民币9.1元;而每百万输出 tokens 的价格则为10美元,约合人民币72.9元。要是输入的文本较长,超过了20万 tokens,输入价格就会调整为每百万2.50美元,也就是约18.2元人民币,输出 tokens 价格变为15美元,约合109元人民币。与谷歌现有的其他 AI 模型相比,Gemini2.5Pro 的定价明显更高。和部分前沿 AI 服务相比,它的价格也处于高位,比如 OpenAI 的 o3-mini 输入每百万 tokens 是1.10美