新型AI图像生成框架OminiControl：可将素材主体融入生成图片中

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年11月26号 14:28

534

在当今数字时代，图像生成技术正以惊人的速度发展。最近，来自新加坡国立大学的研究团队提出了一种全新的框架 ——OminiControl，旨在提升图像生成的灵活性和效率。该框架通过结合图像条件，充分利用已经训练好的扩散变换器（Diffusion Transformer，简称 DiT）模型，带来了前所未有的控制能力。

简单的说，只要提供素材图，利用OminiControl就能将素材图中的主题融入到生成的图片中。比如小编上传了左边的素材图，输入提示词“芯片人放置在一个医生办公室的桌子旁边，桌子上放着听诊器”，生成效果比较一般，如下:

OminiControl 的核心在于其 “参数重用机制”。这种机制使得 DiT 模型能够以更少的额外参数有效地处理图像条件。这意味着，相较于现有的方法，OminiControl 仅需增加0.1% 到0.1% 的参数就能实现强大的功能。此外，它能够统一处理多种图像条件任务，比如基于主题的生成和空间对齐条件的应用，比如边缘、深度图等。这种灵活性特别适用于主题驱动的生成任务。

研究团队还特别强调，OminiControl 是通过训练生成的图像来实现这些能力的，这对于主题驱动的生成尤为重要。经过广泛的评估，OminiControl 在主题驱动生成和空间对齐条件生成的任务中，都显著超过了现有的 UNet 模型和 DiT 适应模型。这一研究成果为创作领域带来了新的可能性。

为了支持更广泛的研究，团队还发布了一个名为 Subjects200K 的训练数据集，包含了超过20万张身份一致的图像，并提供了高效的数据合成管道。这个数据集将为研究人员提供宝的资源，帮助他们进一步探索主题一致生成任务。

Omini 的推出不仅提升了图像生成的效率与效果，也为艺术创作提供了更多可能性。随着技术的不断进步，未来的图像生成将更加智能化和个性化。

在线体验:https://huggingface.co/spaces/Yuanshi/OminiControl

github:https://github.com/Yuanshi9815/OminiControl

论文:https://arxiv.org/html/2411.15098v2

划重点:
🌟 OminiControl 通过参数重用机制，让图像生成的控制能力更强大，效率更高。
🎨 该框架能同时处理多种图像条件任务，如边缘、深度图等，适应不同创作需求。
📸 团队发布了超过20万张图像的数据集 Subjects200K，助力进一步的研究与探索。

谷歌Gemini 2.0 Flash引发争议：AI轻松去除图片水印引发版权担忧

一场关于AI边界的新争议正在科技圈掀起波澜。谷歌最新推出的人工智能模型Gemini2.0Flash被发现具有令人担忧的能力——它可以轻松去除图片水印，包括来自盖蒂图片社等知名图库的专业水印，这一功能引发了创作者和版权持有者的广泛关注。上周，谷歌扩大了Gemini2.0Flash模型图像生成功能的访问范围，使更多用户能够体验其强大的图像生成和编辑能力。然而，这一决定似乎缺乏必要的限制措施。网友们很快发现，Gemini2.0Flash不仅能生成包含名人和受版权保护角色的图像，更令人震惊的是，

谷歌Gemini 2.0 Flash放出原生多模态图像生成功能：支持多轮对话式实时编辑编辑

继Gemma3之后，谷歌又给我们带来了一位“闪电侠”——Gemini2.0Flash，而且人家这次是带着独门绝技来的:原生图像生成! 要知道，以前的AI图像生成，很多时候都是大型语言模型（LLM）先理解你的文字，然后再把意思“翻译”给专门生成图像的扩散模型。这中间难免会有些“失真”，就像隔着好几个人传话，最后意思都变味儿了。但Gemini2.0Flash可不一样，人家是把图像生成功能直接集成在了模型内部! 这就好比你直接跟画家沟通需求，效率和准确度自然是噌噌往上涨! 难怪有先行体验者表示，

Luma AI 开源的图像预训练技术IMM实现图像生成十倍提速

你们有没有觉得，辛辛苦苦用海量数据喂养出来的图像模型，在生成高质量图片时，总像蜗牛爬树般慢吞吞?别急，Luma AI 最近开源了一项名为 Inductive Moment Matching （IMM）的图像模型预训练技术，据说能让模型以前所未有的“闪电”速度生成高质量图像，简直是炼丹炉里的涡轮增压!算法停滞?Luma AI 怒砸“天花板”近年来，AI 社区普遍感受到，生成式预训练似乎遇到了瓶颈。尽管数据量持续攀升，但算法创新却相对停滞。Luma AI 认为，这并非数据不够，而是算法没能充分挖掘数据的潜力，这如

Adobe Stock推出AI自定义工具，轻松编辑库存图像

近日，Adobe 宣布对其 Adobe Stock 服务进行升级，推出了一项名为 “Customize” 的 AI 功能。这项新功能旨在让用户无需离开 Adobe Stock 平台，就可以快速调整和优化库存图片。用户可以通过该工具进行简单的图像编辑，生成 AI 变体，而不必花费大量时间在 Photoshop 等其他应用上进行复杂的编辑。Adobe Stock 是一项付费服务，为设计师、市场营销人员和商业用户提供数百万种可用于项目的资产，包括照片、视频、插图、矢量图形、3D 资产和模板等。用户可以直接在 Adobe Stock 网站上或通过 Adobe Creativ

AI新闻资讯