智源推出全能视觉生成模型 OmniGen 集多项能力于一体

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Oct 29, 2024

781

北京智源人工智能研究院（BAAI）近日宣布推出了一款全新的全能视觉生成模型OmniGen，标志着图像生成领域的一项重大突破。OmniGen模型以其统一性、简单性和跨任务知识迁移能力而著称，能够在单一框架内处理多种图像生成任务，包括文生图、图像编辑、主题驱动生成和视觉条件生成等。此外，OmniGen还能够处理一些经典的计算机视觉任务，如图像去噪和边缘检测，通过将这些任务转换为图像生成任务来实现。

微信截图_20241029103628.png

OmniGen的核心优势在于其简化的架构和用户友好的操作，用户可以通过简单的指令完成复杂的图像生成任务，无需额外的插件或复杂的处理步骤。这种统一格式的学习使得OmniGen能够有效地跨不同任务迁移知识，应对未见过的任务和领域，并展示新颖的功能。

OmniGen模型的能力不仅限于上述内容，还包括基本的图像处理能力如去噪和边缘提取。模型的权重和代码已经开源，以便用户可以自行探索更多OmniGen的能力，并根据需要进行微调。智源研究院构建了一个大规模且多样化的统一图像生成数据集X2I，包含约1亿图像，未来将开源，以推动通用图像生成领域的发展。

相关链接:

Paper: https://arxiv.org/pdf/2409.11340

Code: https://github.com/VectorSpaceLab/OmniGen

Demo: https://huggingface.co/spaces/Shitao/OmniGen

OmniGen 全能视觉生成模型图像生成计算机视觉

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

Adobe 重磅升级 Firefly AI 平台，打造图像、视频、音频全能创作引擎

Adobe 最近宣布对其 Firefly AI 平台进行重大升级，这一变化使其从一个独立的图像生成器转变为一个综合性数字内容创作系统。自两年前推出以来，Firefly 已被全球用户用来创建超过220亿个资产，这一最新版本旨在在这一成功基础上，提供更为多样化的创作工具。新版本的 Firefly 现在支持生成图像、视频、音频和矢量图形。针对图像生成，Adobe 推出了 Firefly Image Model4，分为标准版和超版。Adobe 表示，标准版可以满足90% 的创作需求，而超版则更适合处理复杂的写实场景。相比之前的版本，这两

2025年4月28号 9:46

2.1k

GPT-4o图像生成能力集成GPTs，开启个性化图像机器人新篇章

OpenAI宣布GPT-4o的图像生成能力正式集成到GPTs（自定义GPT）平台，为开发者与创作者提供了构建个性化图像生成机器人的强大工具。据AIbase了解，这一更新允许用户通过GPTs打造专属图像生成应用，如海报设计机器人或特定艺术风格生成器，极大地提升了创作灵活性与共享性。社交平台上的热烈讨论凸显了其广泛影响力，相关功能已向ChatGPT Plus、Pro及Team用户开放。AIbase为您带来详细报道。核心功能:GPTs赋能个性化图像生成GPT-4o的图像生成能力融入GPTs，标志着AI创作从通用工具向个性化应用的

2025年4月27号 16:51

5.1k

GPT-4o图像生成功能现已集成至自定义GPTs

2025年4月26日 AIbase报道：OpenAI近日宣布，其旗舰多模态模型GPT-4o的图像生成功能现已正式集成至ChatGPT的自定义GPTs功能中。这一更新标志着用户创建的定制化AI助手能够直接生成和编辑图像，为内容创作、设计和教育等领域带来更多可能性。无缝集成的图像生成体验GPT-4o的图像生成功能此前已于2025年3月25日起在ChatGPT和Sora平台向免费、Plus、Pro和Team用户逐步开放。与过去依赖DALL-E3等外部模型不同，GPT-4o的图像生成能力内嵌于模型本身，支持直接根据文本提示生成高质量图像。如今，这一功能

2025年4月27号 8:36

1.1k

ImageSlider 2.0即将加入核心产品线，图像生成功能全面升级

Gradio团队宣布ImageSlider2.0即将作为核心产品线的一部分正式推出，为图像生成爱好者和开发者带来一系列全新功能与性能增强。据AIbase了解，这一更新通过优化用户体验、扩展创作选项和提升生成效率，旨在重新定义AI驱动的图像滑动与展示体验。相关细节已在社交平台与Gradio官网公布，引发社区热烈反响。核心功能:多场景优化与创作自由度提升ImageSlider2.0通过技术革新与功能扩展，为用户提供了更灵活的图像生成与展示解决方案。AIbase梳理了其主要亮点: 增强型图像滑动体验:新增动态过

2025年4月25号 14:43

3.0k

Adobe的AI图像生成工具Firefly将发布iOS和安卓版

在最新的动态中，Adobe 公司宣布将推出其 AI 图像生成工具 Firefly 的移动版本，旨在与 OpenAI 进行更为激烈的竞争。这一消息在伦敦的 MAX 创意大会上得到正式发布，Adobe 表示 Firefly 的移动应用程序将很快上线，支持 iOS 和安卓平台，但具体的发布日期尚未确定。Adobe Firefly 的副总裁 Alexandru Costin 在接受 CNBC 采访时指出，创意工作者在移动中常常会激发灵感，而 Firefly 的移动版本正是为了成为用户随时随地的 “创意伙伴”。通过这个应用，用户可以轻松捕捉到灵感，进而提升工作效率。例如，

2025年4月25号 9:12

3.8k

即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度

字节跳动旗下即梦AI（Jimeng AI）正式推出即梦3.0海外版本，标志着其文本到图像与视频生成技术向全球市场的进一步扩展。据AIbase了解，新版本以电影级画面品质、2K分辨率输出、超逼真材质与精准英文排版为核心亮点，尤其在英文文本生成与字体控制上表现卓越，超越此前中文版本的效果。发布消息已在社交平台引发热烈讨论，相关功能可通过即梦官网与移动应用体验。核心功能:电影级视觉与精准文本生成即梦3.0海外版通过技术升级，为用户提供了前所未有的视觉创作体验。AIbase梳理了

2025年4月24号 10:57

6.5k

AI日报： OpenAI推出gpt-image-1图像生成API;纳米AI发布MCP万能工具箱;中国占全球AI专利60%

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、OpenAI推ChatGPT新图像生成功能API:开发者可轻松集成 AI 绘图功能OpenAI最近推出了gpt-image-1图像生成API，开发者可以将这一先进技术轻松集成到各种应用中。这一功能自上线以来，吸引了大量用户，生成了超过7亿张图像。gpt-image-1不仅支持多种图像风格，还内置安全护栏，确保生成内容符合公司政

2025年4月24号 16:01

14.7k

JSON Visuals for ChatGPT发布，解锁无限图像风格创作

JSON Visuals for ChatGPT正式发布，为ChatGPT的图像生成能力注入全新创意维度。据AIbase了解，这一工具提供超过50种独特的美学代码，结合属性随机化器，可生成无限风格组合，用户只需输入图像与JSON风格代码即可创作个性化视觉内容。发布消息在社交平台引发热烈反响，社区尤其推崇其荒诞科技风格。核心功能:灵活风格生成与随机化组合JSON Visuals for ChatGPT通过JSON格式的美学代码，显著扩展了ChatGPT的图像生成灵活性。AIbase梳理了其主要功能: 50+美学代码:提供超过50种预定义风格，如赛博朋克、

2025年4月24号 11:28

13.8k

OpenAI发布gpt-image-1 API，4o图像生成能力正式开放

OpenAI正式推出gpt-image-1API，标志着其备受瞩目的4o图像生成能力向开发者开放。据AIbase了解，这一API以其高保真图像生成、多样化视觉风格与强大的世界知识整合能力，被社区誉为“世界最强生图”工具。发布消息迅速在AI开发者与创意社区中引发热烈反响，相关文档已通过OpenAI官网与Playground平台公开。核心功能:高保真与多样化风格生成gpt-image-1API基于OpenAI4o模型的多模态能力，为用户提供了前所未有的图像生成体验。AIbase梳理了其主要功能: 高保真图像生成:支持生成1024x1024分辨率的高质量

2025年4月24号 9:33

4.6k

OpenAI推ChatGPT新图像生成功能API:开发者可轻松集成 AI 绘图功能

OpenAI 在近日宣布，已将其最新的图像生成功能通过 API 开放给开发者，使其能够将这一先进的技术集成到各种应用和服务中。这一消息无疑为开发者们提供了一个新的机遇，特别是在图像处理和创作领域。新推出的图像生成模型名为 “gpt-image-1”，其背后支持了 ChatGPT 的图像生成技术。自今年3月底该功能上线以来，用户可以创建出逼真的吉卜力风格图片和各种 “AI 人偶”。这一功能在上线后迅速吸引了数百万新用户注册 ChatGPT，给 OpenAI 的服务器带来了巨大的压力。仅在工具推出的第一周

2025年4月24号 8:50

1.6k

AI资讯

AI日报

AI时间线

Al硬件

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图