AI产品榜

AI产品榜

搜索全球AI产品动态

搜索全球AI信息，发现AI新机遇

新闻资讯
产品应用
变现案例
AI教程

类型 :

新闻资讯
产品应用
变现案例
AI教程

2024-10-23 10:27:58.AIbase

秒杀SD?谷歌 DeepMind 新型图像生成模型Fluid性能更出色

谷歌 DeepMind 联合麻省理工学院（MIT）近日发布了一项重大研究成果。研究团队开发的新型自回归模型"Fluid"在文本到图像生成领域取得了突破性进展，该模型在扩展到105亿参数规模后，性能表现出色。这项研究颠覆了业界普遍认知。此前，自回归模型虽然在语言处理领域占据主导地位，但在图像生成方面一直被认为不如 Stable Diffusion 和 Google Imagen3等扩散模型。研究人员通过创新性地引入两个关键设计因素，显著提升了自回归模型的性能和可扩展性:采用连续型词元替代离散型词元，以及引入

秒杀SD?谷歌 DeepMind 新型图像生成模型Fluid性能更出色

2024-08-15 16:59:04.AIbase

颠覆传统！Lumina-mGPT 可以从文本中创建逼真且高分辨率的图像

多模态生成模型正引领人工智能新潮流，专注于融合视觉与文本数据，以创造多功能AI系统，执行从图像生成到跨数据类型理解与推理的多种任务。其中，关键挑战是提升自回归（AR）模型能力，使其能根据文本描述生成高细节图像。尽管扩散模型在生成高质量图像方面表现出色，AR模型在图像质量、分辨率灵活性及多任务处理能力上相对滞后。上海AI实验室和香港中文大学的研究人员推出Lumina-mGPT，一种基于解码器-only的变换器架构，采用多模态生成预训练方法，旨在克服AR模型限制，实现与扩散模型同等水平的逼真图像生成，同时保持简便性和可扩展性。Lumina-mGPT采用详尽的灵活渐进的监督微调策略，增强图像生成能力，支持高分辨率图像生成（1024×1024像素），细节丰富且与文本提示高度一致。该模型在图像质量、视觉一致性及多种任务支持方面超越前代模型，仅需较小数据集即可实现卓越性能，预示未来AI系统将更加复杂与多才多艺。

颠覆传统！Lumina-mGPT 可以从文本中创建逼真且高分辨率的图像