火山引擎发布大模型训练视频预处理方案 PixelDance已采用

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年10月15号 14:03

182

火山引擎在近期的视频云技术大会上发布了一项重要创新:大模型训练视频预处理方案。这一技术已成功应用于豆包视频生成模型，标志着AI视频生成技术的重大进展。

火山引擎总裁谭待强调，AIGC和多模态技术正在深刻改变用户体验。基于抖音的实践经验，火山引擎正积极探索AI大模型与视频技术的融合，为企业提供全方位解决方案。

抖音集团视频架构负责人王悦指出，大模型训练面临诸多挑战，包括海量数据处理成本高、样本质量不一、处理链路复杂，以及多种异构算力资源的调度问题。

为应对这些挑战，火山引擎开发的预处理方案基于自研的多媒体处理框架BMF，并借助Intel的多样化算力资源。该方案在算法和工程层面进行了优化，能高效处理海量视频数据，显著提高模型训练效率。

此外，火山引擎还开源了移动端后处理解决方案BMF lite版本，支持端侧大模型接入和算子加速，更加轻量化和通用。

值得注意的是，9月24日发布的豆包视频生成模型PixelDance已采用这一技术方案。该模型采用DiT架构，突破了多主体运动的复杂交互和多镜头切换的内容一致性难题。目前，豆包视频生成模型已通过火山引擎向企业开放邀测。

Deepseek崛起挑战霸主!a16z最新AI应用Top100榜单发布，17家新秀强势入围前50!

风险投资公司 Andreessen Horowitz （a16z）最新发布的消费者人工智能领域报告揭示了显著的市场动态。报告追踪了排名前100的消费级 AI 应用，通过 Similarweb 的网络访问数据和 Sensor Tower 的移动应用数据进行排名，每两年更新一次。最新排名显示，自2024年8月以来，有17家新公司跻身前50名，标志着市场格局的重大变化。本次排名聚焦于 AI 原生应用，排除了 Canva 和 Notion 等后期添加 AI 功能的平台，以及 Pixlr、Fotor 和 PicsArt 等传统照片编辑器。同时，新增的“边缘榜单”列出了10家有望进入前100名

全国第二例判决 AIGC 版权案:法院确认作者享有著作权

AI 生成内容的知识产权问题带来了不少争议，而江苏省苏州市常熟市人民法院于3月7日宣判了一起备受瞩目的著作权纠纷案。这起案件被认为是江苏省的首例、全国第二例涉及 AI 生成内容的著作权案。案件的起因是林某使用 Midjourney 软件生成的图片作品引发的版权争议。常熟市人民法院对此案进行了详细审理，首先审查了相关的 AI 软件用户协议，确认使用该软件生成的图片作品的权利归用户所有。法院还对林某在创作过程中对提示词的修改及图片细节的处理进行了审查，认定林某的创作过

一加13手机推新ColorOS 15.0.0.701，首发AIGC合成语音识别功能

一加13手机迎来了 ColorOS15.0.0.701版本的重大升级。这次更新的系统包大小约为1.33GB，除了诸多优化和修复，还引入了行业首发的 AIGC 合成语音识别功能，为用户的安全与便利提供了全新保障。此次更新中，桌面功能得到了显著改善，用户现在可以通过拖拽的方式轻松调整文件夹的大小至1×2或2×1的尺寸。同时，在桌面四列布局下，用户可以在 dock 栏中放置多达五个应用，使得手机的操作更加灵活方便。此外，通知和控制中心的动画流畅度也进行了优化，让用户的操作体验更加丝滑顺畅。在安

vivo重组调整，成立新AI部门并将大模型训练转向端侧

近日，vivo 公司在其组织架构上进行了重要调整，宣布在原有的 OS 产品领域内新设立 AI 领域。这一新部门下将包括人工智能一部和人工智能二部，标志着 vivo 在人工智能技术上的持续投入和战略布局。此次变动还伴随着高层人事调整，原互联网平台运营领域的总经理张飞被任命为新 AI 领域的总经理，并兼任人工智能一部的负责人，直接向公司副总裁、OS 产品领域负责人周围汇报。值得注意的是，vivo 的 AI 部门正在将其大模型的训练重心逐步向端侧转移。根据内部消息，虽然公司在 AI 大模