AI新闻资讯

AI资讯

不错过全球AI革新的每一个时刻

AI日报

每天三分钟关注AI行业趋势

AI时间线

AI行业大事记

AI变现指南

图片合集

AI图片制作变现案例分享

视频合集

AI视频制作变现案例分享

音频合集

AI音频制作变现案例分享

文案合集

AI内容写作变现案例分享

AI教程

AI产品榜

AI产品排行榜

展示AI网站的总访问量排名

AI产品流量增速榜

追踪AI网站访问量增长最快产品

AI产品流量下降榜

关注访问量下降明显的AI网站

AI产品周榜

展示AI网站的周访问量排名

AI开源项目库

全景图

github热门AI开源项目总览

产品库工具导航

质量更高、视觉效果更好！智谱开源CogVideoX-5B视频生成模型

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Aug 28, 2024

331

魔搭ModelScope社区近日宣布，其国产开源Sora视频生成模型CogVideoX的更大尺寸版本——CogVideoX-5B已正式开源。

与之前的CogVideoX-2B相比，新模型在视频生成的质量和视觉效果上都有显著提升。

微信截图_20240828081448.png

CogVideoX-5B是一个基于大规模DiT（diffusion transformer）模型，专为文本到视频生成任务设计。模型采用了3D因果变分自编码器(3D causal VAE)和专家Transformer技术，通过结合文本和视频嵌入，使用3D-RoPE作为位置编码，并利用3D全注意力机制进行时空联合建模。

此外，模型还采用了渐进式训练技术，能够生成具有显著运动特征、连贯且长时间的高质量视频。

模型链接:

https://modelscope.cn/models/ZhipuAI/CogVideoX-5b

CogVideoX 大规模DiT 3D因果变分自编码器 3D全注意力机制

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

智谱清影与AI角色创作平台“捏Ta”开展多模态合作推动IP一致性落地

2月19日，北京智谱华章科技有限公司宣布，其旗下的多模态创作平台“清影”与AI角色创作平台“捏Ta”达成战略合作，共同探索AI角色设计到动画创作的完整路径，并推动IP一致性的技术落地。此次合作旨在深入挖掘二次元用户需求与AI应用场景，为用户提供更高质量的生成效果和更快的推理速度。

2025年2月20号 8:55

1.8k

字节联合高校出品！STAR 模型：提升视频清晰度和分辨率

近日，南京大学的研究团队与字节跳动、西南大学联合推出了一项创新技术 ——STAR（Spatial-Temporal Augmentation with Text-to-Video Models），旨在利用文本到视频模型，实现真实世界视频的超分辨率处理。该技术结合了时空增强方法，能够有效提高低分辨率视频的质量，尤其适用于在视频分享平台上下载的低清晰度视频。为了方便研究者和开发者使用，研究团队已经在 GitHub 上发布了 STAR 模型的预训练版本，包括 I2VGen-XL 和 CogVideoX-5B 两种型号，以及相关的推理代码。这些工具的推出标志着在视频处

2025年1月9号 10:11

6.4k

AI日报：快手推“可灵AI”独立APP；百度将推AI智能眼镜；智谱AI开源CogVideoX v1.5并上线"新清影"；Krea AI上线Lora训练功能

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、快手推出“可灵AI”独立APP加码移动端AI创作布局快手最近推出了“可灵AI”独立APP，致力于在移动端扩展AI创作领域。用户可以享受到更愉悦和个性化的电子邮件管理体验。

2024年11月8号 15:36

1.2k

智谱AI开源最新版视频模型CogVideoX v1.5，上线10秒4K"新清影"

今日，智谱技术团队发布了其最新的视频生成模型 CogVideoX v1.5，并将其开源。这一版本是自8月以来，智谱技术团队推出的 CogVideoX 系列中的又一重要进展。据了解，此次更新大幅提升了视频生成能力，包括支持5秒和10秒的视频长度、768P 的分辨率以及16帧的生成能力。同时，I2V（图像到视频）模型也支持任意尺寸比例，进一步增强了复杂语义的理解能力。CogVideoX v1.5包含两个主要模型:CogVideoX v1.5-5B 和 CogVideoX v1.5-5B-I2V，旨在为开发者提供更强大的视频生成工具。更值得关注的是，CogVideoX v1.5将

2024年11月8号 15:00

8.0k

智谱AI视频生成模型CogVideoX v1.5开源支持5/10秒视频生成

北京智谱华章科技有限公司宣布，其旗下的CogVideoX系列模型推出了最新版本——CogVideoX v1.5，并已对外开源。自8月初发布以来，该系列模型凭借其行业领先的技术和深受开发者喜爱的特性，已经成为视频生成领域的佼佼者。新版本CogVideoX v1.5在原有基础上进行了显著升级，包括增强了视频生成能力，现在支持5/10秒、768P、16帧的视频生成，并且I2V模型能够支持任意尺寸比例，大幅提升了图生视频的质量和复杂语义理解。

2024年11月8号 14:57

3.2k

智谱发布新一代基座模型GLM-4-Plus 清言APP升级视频通话功能

北京智谱华章科技有限公司在2024年8月29日宣布了一系列重要的技术更新，包括新一代基座模型的发布和新的应用服务。在KDD2024大会上，智谱发布了包括语言模型GLM-4-Plus、文生图模型CogView-3-Plus、图像/视频理解模型GLM-4V-Plus和视频生成模型CogVideoX在内的新一代基座模型。这些模型在各自领域均达到了国际领先水平。

2024年8月30号 7:59

5.0k

AI日报：全球最快AI推理架构发布；夸克PC端AI全面升级；智谱开源CogVideoX-5B视频生成模型；OpenAI的“草莓”终于熟了

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、全球最快AI推理架构CerebrasInference速度提升20倍！报告强调企业需清晰展示生成式AI的价值以促进持续投资。

2024年8月28号 15:06

510

智谱AI开源新模型，老显卡也能开启视频生成新时代

智谱AI公司开源了视频生成模型CogVideoX-5B，显著提升了视频生成的质量、视觉效果和推理性能。新模型兼容较低配置的GPU，如早期的GTX1080Ti和桌面端的RTX3060。这款基于大规模DiT模型的工具，采用3D因果变分自编码器和专家变换器技术，通过3D-RoPE位置编码与3D全注意力机制，实现高效文本到视频的生成。详细信息和代码可访问指定链接。

2024年8月28号 10:20

2.6k

AI日报：智谱开源清影同源“兄弟”CogVideoX；阿里通义App推出角色扮演功能；即梦视频生成推动效画板功能；OpenAI领导层大动荡！

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、钉钉推出“AI迎新百事通”：10分钟即可定制校园智能迎新助手钉钉推出了名为“AI迎新百事通”的智能化迎新解决方案，专为高校开学季设计，以提升新生入学的安全性和便捷性，并减轻教职员工的工作负担。用户可以自由描绘运动轨迹，设置结束状态框位置，输出视频时长为4秒或6秒，创意无限。

2024年8月6号 16:20

700

智谱AI宣布开源「清影」同源视频生成模型——CogVideoX

智谱AI宣布将其视频生成模型CogVideoX开源，旨在推动视频生成技术的快速发展和应用。CogVideoX模型基于先进的大型模型技术，能够满足商业级应用的需求。目前开源的CogVideoX-2B版本在FP-16精度下的推理仅需18GB显存，微调则需要40GB显存，使得单张4090显卡即可进行推理，而单张A6000显卡即可完成微调。

2024年8月6号 9:55

4.2k

AI资讯

AI日报

AI时间线

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图