秒杀SD?谷歌 DeepMind 新型图像生成模型Fluid性能更出色

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年10月23号 10:27

211

谷歌 DeepMind 联合麻省理工学院（MIT）近日发布了一项重大研究成果。研究团队开发的新型自回归模型"Fluid"在文本到图像生成领域取得了突破性进展，该模型在扩展到105亿参数规模后，性能表现出色。

这项研究颠覆了业界普遍认知。此前，自回归模型虽然在语言处理领域占据主导地位，但在图像生成方面一直被认为不如 Stable Diffusion 和 Google Imagen3等扩散模型。研究人员通过创新性地引入两个关键设计因素，显著提升了自回归模型的性能和可扩展性:采用连续型词元替代离散型词元，以及引入随机生成顺序取代固定顺序。

在图像信息处理方面，连续型词元的优势明显。传统的离散型词元会将图像区域编码为有限词汇表中的代码，这种方式inevitably导致信息损失，即使是大型模型也难以准确生成对称眼睛等细节特征。而连续型词元能够保存更精确的信息，显著提升图像重建质量。

研究团队还对图像生成顺序进行了创新。传统自回归模型通常采用从左到右、从上到下的固定顺序生成图像。研究者尝试了随机顺序方法，允许模型在每个步骤中预测任意位置的多个像素。这种方法在需要良好把握整体图像结构的任务中表现突出，在衡量文本与生成图像匹配度的 GenEval 基准测试中取得显著优势。

Fluid 模型的实际表现印证了研究的价值。在扩展到105亿参数规模后，Fluid 在多个重要基准测试中均超越现有模型。值得注意的是，仅有3.69亿参数的小型 Fluid 模型就达到了200亿参数量级的 Parti 模型在 MS-COCO 数据集上的 FID 评分（7.23）。

这一研究成果表明，像 Fluid 这样的自回归模型很可能成为扩散模型的有力替代者。与需要多次正向和反向传递的扩散模型相比，Fluid 仅需单次传递即可生成图像，这种效率优势在模型进一步扩展后将更加明显。

Freepik 率先推出 Veo 2，开启 AI 视频生成新篇章

北京时间，2025 年 2 月 21 日：知名创意平台 Freepik 宣布，其已正式在其平台上推出 Google DeepMind 研发的最新 AI 视频生成模型 Veo 2。这一举措不仅标志着 Freepik 成为全球首家整合 Veo 2 的平台，更打破了地域限制，让非美国居民也能使用这一尖端技术。据 Freepik 官方消息，Veo 2 拥有无与伦比的真实感、精准度和流畅的动画效果，被认为是目前最先进的 AI 视频生成模型。此次与 Google 的合作，使 Freepik 在 AI 创意工具领域再次走在前沿。此前，Veo 2 的使用主要局限于特定地区，而 Freepik 的这一步

谷歌DeepMind高管：AI 应助力人类能力，而非取代

在近期于班加罗尔举办的 “投资卡纳塔克2025” 会议上，众多科技行业的领导者聚集一堂，探讨人工智能在印度的变革潜力及其影响。谷歌DeepMind的高级董事马尼什・古普塔（Manish Gupta）在会上发表了重要讲话，强调在推动技术创新的同时，应建立相应的规章制度，以确保负责任的发展。图源备注：图片由AI生成，图片授权服务商Midjourney古普塔指出，随着印度在构建基础性人工智能模型方面取得显著进展，大家都在关注人工智能对就业市场的影响。他表示，科技行业的责任在于开发可以增

谷歌 DeepMind 推出千亿级视觉语言数据集 WebLI-100B

谷歌 DeepMind 团队正式推出了 WebLI-100B 数据集，这是一个包含1000亿个图像 - 文本对的庞大数据集，旨在增强人工智能视觉语言模型的文化多样性和多语言性。通过这一数据集，研究人员希望改善视觉语言模型在不同文化和语言环境下的表现，同时减少各个子组之间的性能差异，从而提升人工智能的包容性。视觉语言模型（VLMs）依赖于大量数据集来学习如何连接图像与文本，从而执行如图像字幕生成和视觉问答等任务。过去，这些模型主要依赖于 Conceptual Captions 和 LAION 等大型数据集，虽然这

最强视频模型Veo 2可以在YouTube上玩了

近日，备受瞩目的最强视频模型Veo2终于与广大用户见面了，不过目前它内嵌在YouTube的Dream Screen功能里。目前，仅美国、加拿大、澳大利亚和新西兰用户可用。Veo2是由Google DeepMind推出的最新一代AI视频生成模型，它能够根据用户的文本提示生成高质量的视频片段，支持分辨率高达4K。此次Veo2的加入，使得YouTube Shorts的创作功能得到了极大的丰富和提升。用户现在可以利用Veo2为YouTube Shorts生成各种素材和背景视频，从而让自己的短视频作品更加生动、有趣和富有创意。Veo2具备强大的功能和优

AI新闻资讯