谷歌VideoPoet负责人蒋路跳槽TikTok!对标Sora,AI视频模型大战在即

新智元
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
字节跳动近日推出其全新AI项目DreamActor-M1,该项目旨在实现类似Runway Act-One的功能,通过先进的生成式AI技术,将视频中的角色表演转化为虚拟动画,展现出更高的精确度和表现力。这一消息迅速引发了业界和网友的广泛关注,被视为字节跳动在AI视频生成领域迈出的又一大步。技术突破:超越Runway Act-One的野心据公开信息显示,DreamActor-M1的核心目标是捕捉演员的面部表情、动作节奏以及情感细节,并将其无缝转移到任意虚拟角色上。与Runway的Act-One类似,该技术允许用户仅通过上传一段表演
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、Runway惊艳发布AI视频生成模型Gen-4,角色场景一致性强到离谱Runway最近推出的Gen-4人工智能模型在媒体生成领域引起了广泛关注。尽管X在过去经历了波动,但近期因与GrokAI的整合和利润率改善逐渐回暖,用户也在回流。
近日,Higgsfield AI 发布了其全新的生成式视频模型,引发了广泛关注。这一创新模型以其卓越的专业级相机控制、世界建模能力以及电影化的表现力脱颖而出,为AI视频生成领域注入了新的活力。Higgsfield AI 官方宣布,这一模型名为“DoP I2V-01-preview”,其设计灵感来源于对电影摄影艺术的深度理解,旨在为创作者提供前所未有的精准度和真实感。新模型最引人注目的特点之一是其预设相机模式,这些模式赋予了AI视频前所未有的“灵魂”。从单一图像出发,用户可以轻松实现“子弹时间”运
近日,OpenAI 刚推出的图像生成功能引发了广泛关注,随之而来的便是用户数量的激增和流量压力的骤升。为了解决这一问题,OpenAI 宣布暂时禁用新用户的 Sora 视频生成功能。该决策旨在确保平台的稳定性和现有用户的使用体验。OpenAI 在其支持页面上发布了通知,明确表示:“由于当前面临高流量压力,Sora 的新用户视频生成功能将暂时不可用。如果您是首次登录 Sora 的用户,您依然可以使用图像生成功能。” 这一举措显然是为了缓解服务器负担,确保所有用户能够顺畅地享受服务。图源备
备受瞩目的 AI 研究公司 Runway 近日隆重推出其下一代人工智能模型系列—— Runway Gen-4。本次发布的 Gen-4模型专注于媒体生成和世界一致性,旨在为用户带来前所未有的创作自由和控制力。其中,最引人瞩目的功能便是其能够精确地生成并保持角色、场景和物体在不同镜头中的高度一致性。告别“换脸”烦恼:角色一致性轻松实现以往的 AI 视频生成模型常常面临角色在不同场景中形象不统一的问题,这给叙事创作带来了诸多挑战。Runway Gen-4革命性地解决了这一痛点。用户只需提供单个角色参
近年来,生成式人工智能(AI)技术的迅猛发展改变了数字内容创作的面貌,但偏见问题始终伴随其中。最近,《连线》杂志对 OpenAI 旗下的视频生成工具 Sora 进行了深入调查,结果发现该工具在生成视频时常常会强化种族、性别和能力方面的刻板印象,甚至有时忽视了对某些群体的表现。图源备注:图片由AI生成,图片授权服务商Midjourney在调查中,研究人员给 Sora 提供了25个基本的提示,例如 “一个人走路” 或 “飞行员” 等职位名称,同时也包含一些身份特征的描述,比如 “残疾人”
教育部召开了国家教育数字化战略行动2025年的部署会,正式发布了国家智慧教育平台2.0智能版的上线。这一新平台的推出,标志着我国在教育数字化和智能化方面又迈出了重要一步。国家智慧教育平台2.0引入了多项智能化功能,旨在提升学习效率与质量。首先,平台推出了 “白泽智慧学伴” 功能,能够针对性地解决学习者在学习过程中遇到的问题,并根据个人的学习进度与兴趣,推荐适合的课程,从而帮助用户更好地掌握知识。其次,平台增加了 AI 智能搜索功能,用户可以在全平台范围
随着人工智能技术的迅猛发展,AI视频生成平台iPIKA近日推出了一项引人注目的新功能——“您可以遇见更年轻的自己”。这一功能自上线以来迅速引发热议,成为科技与情感结合的又一创新案例。iPIKA的新功能允许用户通过上传一张童年照片和一段自拍视频,生成一段与“更年轻的自己”互动的虚拟视频。具体操作流程为:用户拍摄一段自拍视频,确保画面留出半边空间(自己位于左侧或右侧),然后上传一张小时候的照片。通过简单的文字提示,用户可以自定义“年轻版自己”的动作和表
快手旗下人工智能创作平台“可灵AI”(Kling)再次迎来重要功能升级。根据最新消息,可灵AI在用户界面、多图参考生成以及视频创作能力上进行了全面优化,包括:更快的生成速度、更准确的提示响应(更好的语义理解)、改进的图像质量。可灵AI此次更新对原有的界面设计进行了大幅调整。此前被部分用户形容为“花哨”的UI现已得到优化,变得更加简洁直观。这一变化不仅提升了使用体验,也让创作者能够更专注于内容创作本身,而非繁琐的操作流程。多图参考更新:更快、更智能本次
在人工智能视频生成领域,扩散模型以其卓越的性能备受瞩目。然而,其固有的迭代去噪特性导致生成过程耗时且计算成本高昂,成为制约其广泛应用的关键瓶颈。近日,来自B北京航空大学、香港大学和上海人工智能实验室的研究团队联合发布了一项名为 AccVideo 的创新技术。该方法通过一种新颖高效的蒸馏方法,并结合合成数据集,成功将视频扩散模型的生成速度提升了惊人的8.5倍。现有的视频扩散模型在生成高质量视频方面表现出色,但其迭代式的去噪过程需要大量的推理步骤。这意