北大团队与兔展联合发起了复现 Sora 的 Open Sora 计划,由袁粒和田永鸿领衔,得到 AnimateDiff 的响应。团队已公布框架和实现细节,目前成员共有 13 人。计划已初步实现三项功能,训练仍在进行。
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
北大团队与兔展联合发起了复现 Sora 的 Open Sora 计划,由袁粒和田永鸿领衔,得到 AnimateDiff 的响应。团队已公布框架和实现细节,目前成员共有 13 人。计划已初步实现三项功能,训练仍在进行。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
近日,OpenAI 刚推出的图像生成功能引发了广泛关注,随之而来的便是用户数量的激增和流量压力的骤升。为了解决这一问题,OpenAI 宣布暂时禁用新用户的 Sora 视频生成功能。该决策旨在确保平台的稳定性和现有用户的使用体验。OpenAI 在其支持页面上发布了通知,明确表示:“由于当前面临高流量压力,Sora 的新用户视频生成功能将暂时不可用。如果您是首次登录 Sora 的用户,您依然可以使用图像生成功能。” 这一举措显然是为了缓解服务器负担,确保所有用户能够顺畅地享受服务。图源备
近年来,生成式人工智能(AI)技术的迅猛发展改变了数字内容创作的面貌,但偏见问题始终伴随其中。最近,《连线》杂志对 OpenAI 旗下的视频生成工具 Sora 进行了深入调查,结果发现该工具在生成视频时常常会强化种族、性别和能力方面的刻板印象,甚至有时忽视了对某些群体的表现。图源备注:图片由AI生成,图片授权服务商Midjourney在调查中,研究人员给 Sora 提供了25个基本的提示,例如 “一个人走路” 或 “飞行员” 等职位名称,同时也包含一些身份特征的描述,比如 “残疾人”
OpenAI近日发布事故报告,承认其对话补全(Chat Completions)API遭遇高错误率问题。该公司表示已经确认该问题,并正在积极采取措施进行缓解。与此同时,OpenAI也报告称,此前影响Sora图像生成的问题已得到解决,目前团队正在对系统进行持续监控,以确保其稳定运行。此次事故报告表明,即使是领先的AI公司在提供高可靠性的服务方面仍面临挑战。OpenAI正努力解决API错误问题,并确保其创新产品Sora能够稳定地为用户提供服务。
近日,HPC-AI Tech 宣布推出 Open-Sora2.0,这是一款突破性的视频 AI 系统,仅需约十分之一的典型训练成本即可实现商业级质量。这一进展标志着在资源密集型的视频 AI 领域可能出现范式转变,堪比语言模型中出现的效率提升。虽然像 Movie Gen 和 Step-Video-T2V 这样现有的高质量视频生成系统可能需要数百万美元的训练费用,但 Open-Sora2.0的训练支出仅约为20万美元。尽管成本大幅降低,但测试表明,其输出质量可与 Runway Gen-3Alpha 和 HunyuanVideo 等已建立的商业系统相媲美。该系统使用了224个 Nvidia H20
你是不是已经看惯了那些由AI生成的,虽然逼真但总感觉少了点“味道”的短视频?现在,一项名为长上下文调整 (Long Context Tuning, LCT) 的创新技术横空出世,它让AI视频生成模型拥有了执导多镜头叙事视频的能力,如同电影和电视剧那样,在不同镜头之间自由切换,构建出更连贯、更引人入胜的故事场景。过去,顶尖的AI视频生成模型,比如SoRA,Kling,Gen3,已经能够创造出长达一分钟的逼真单镜头视频。但这与真实世界中,由多个镜头组成的叙事视频(比如电影中的一个场景)的需求之
近日,埃隆·马斯克的人工智能公司xAI已收购了视频生成初创公司Hotshot,这标志着马斯克在AI视频生成领域的重要布局。Hotshot首席执行官兼联合创始人Aakash Sastry周一在社交平台X上正式宣布了这一消息。Sastry在公告中表示:"过去2年中,我们作为一个小团队建立了3个视频基础模型——Hotshot-XL、Hotshot Act One和Hotshot。培训这些模型让我们看到了未来几年全球教育、娱乐、通信和生产力将发生怎样的变化。作为xAI的一部分,我们很高兴能在世界上最大的集群Colossus上继续扩展这些工作!"图源备注:
北京大学张牧涵团队提出了一种全新的框架——Long Input Fine-Tuning (LIFT),通过将长输入文本训练进模型参数中,使任意短上下文窗口模型获得长文本处理能力。这一方法颠覆了传统的长文本处理思路,不再专注于无限扩充上下文窗口,而是将长文本知识内化到模型参数中,类似于人类将工作记忆转化为长期记忆的过程。目前大模型处理长文本面临两大主要挑战:传统注意力机制的平方复杂度导致处理长文本时计算和内存开销巨大 模型难以理解散落在长文本各处的长程依赖关系现有的解决
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、阿里巴巴推出AI旗舰应用“新夸克”全面升级为“AI超级框”阿里巴巴于3月13日推出了其全新升级的AI旗舰应用——新夸克。预计到2025年,智谱将推出多款开源大模型,助力AI行业的发展,同时推动珠海的AI产业生态建设。
听说过壕无人性的 OpenAI Sora 吧?动辄几百万美元的训练成本,简直就是视频生成界的“劳斯莱斯”。现在,潞晨科技宣布开源视频生成模型 Open-Sora2.0!仅仅花费了区区20万美元(相当于224张 GPU 的投入),就成功训练出了一个拥有 110亿参数的商业级视频生成大模型。性能直追“OpenAI Sora ”别看 Open-Sora2.0成本不高,实力可一点都不含糊。它可是敢于叫板行业标杆 HunyuanVideo 和拥有300亿参数的 Step-Video 的狠角色。在权威评测 VBench 和用户偏好测试中,Open-Sora2.0的表现都令人刮目相看,多项关键指
还在为动辄百万美金的视频生成模型望而却步?还在感叹AI视频创作只是巨头的游戏?今天,开源社区用实力告诉你: “No!” 一款名为 Open-Sora2.0的全新开源模型横空出世,彻底颠覆了视频生成的“氪金”规则。 难以置信的是,这款性能直逼商业级水准的110亿参数大模型,竟然只花费了区区20万美元(224张GPU)就训练成功! 要知道,那些动辄耗资数百万美元的闭源模型,在 Open-Sora2.0面前,性价比简直弱爆了!Open-Sora2.0的发布,无疑是视频生成领域的一场“平民革命”。它不仅拥有媲美甚至超越百