AI新闻资讯

AI资讯

不错过全球AI革新的每一个时刻

AI日报

每天三分钟关注AI行业趋势

AI时间线

AI行业大事记

AI变现指南

图片合集

AI图片制作变现案例分享

视频合集

AI视频制作变现案例分享

音频合集

AI音频制作变现案例分享

文案合集

AI内容写作变现案例分享

AI教程

AI产品榜

AI产品排行榜

展示AI网站的总访问量排名

AI产品流量增速榜

追踪AI网站访问量增长最快产品

AI产品流量下降榜

关注访问量下降明显的AI网站

AI产品周榜

展示AI网站的周访问量排名

AI开源项目库

全景图

github热门AI开源项目总览

产品库工具导航

Stable Diffusion 3模型发布，架构细节大揭秘，对复现Sora有帮助？

机器之心

发布于AI新闻资讯 · 1 分钟阅读 · Mar 6, 2024

Stable Diffusion 3 模型发布，采用了与 Sora 相同的 DiT 架构，质量有显著改进。作者表示，Stable Diffusion 3 优于其他文本到图像生成系统，参数量从 800M 到 8B 不等。SD3 架构基于 Sora 核心研发成员和纽约大学助理教授合作，使用 MMDiT 架构优于 UViT 和 DiT。Stable Diffusion 3 采用 Rectified Flow（RF）公式，作者提出的重新加权 RF 变体性能持续提高。模型进行了扩展研究，利用灵活的文本编码器进行改进，与其他模型进行了性能比较。

Stable Diffusion 3 DiT架构文本到图像生成

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

重磅！MiniMax推全新图像生成模型 Image-01，使用成本仅为 1/10

日前，AI科技公司MiniMax 宣布推出其首款文本到图像生成模型 ——Image-01，用户现在可以通过 MiniMax 的 API 平台访问这一服务。Image-01的几个主要特点令人瞩目。该模型具有精确的提示控制能力，基于 MiniMax 在开发 Hailuo AI Video-01系列中的行业领先经验，Image-01能够提供优越的提示与图像之间的保真度。无论是探索不同的艺术风格还是构建复杂的场景，Image-01都能确保产生逻辑一致、艺术质量卓越的视觉作品。另外，Image-01在视觉构图方面表现出色。用户可以将其概念想法转化为引人注目的图像

2025年3月4号 9:39

3.5k

Stable Diffusion 3.5 Large正式上线亚马逊 Bedrock平台

在近日的 AWS re:Invent 大会上，Stable Diffusion3.5 Large（SD3.5Large）宣布正式在亚马逊 Bedrock 平台上可用。作为 AWS 的完全托管平台，Bedrock 旨在为开发者提供构建和扩展生成式人工智能应用的基础模型。通过将 SD3.5Large 引入亚马逊 Bedrock，Stability AI 希望满足开发者在可信的 AWS 环境中进行工作和部署的需求，从而使初创企业和大型企业能够安全、便捷地使用这一先进模型，而无需担心额外的基础设施问题。Stable Diffusion3.5 Large在文本到图像生成方面表现卓越，具有多种关键能力。首先，它支持多样

2024年12月20号 11:00

2.8k

重磅突破！新型文本驱动风格转换技术大幅提升图像生成质量

文本驱动的风格转换是图像合成领域的一项重要任务，旨在将参考图像的风格与文本提示所描述的内容相融合。近期，文本到图像生成模型取得了显著进展，能够实现更精细的风格转换，同时保持内容的高保真度。这项技术在数字绘画、广告和游戏设计等领域具有巨大的实用价值。然而，现有的风格转换技术仍存在一些不足之处，主要挑战包括:风格过拟合:现有模型倾向于复制参考图像的所有元素，导致生成图像过于贴近参考风格图像的特征，限制了生成图像的审美灵活性和适应性。文本

2024年12月19号 15:47

2.0k

震撼来袭！Stability AI的SD3.5L新增三大 ControlNet功能生图能力再升级

Stability AI 正式发布了新版 Stable Diffusion3.5 Large，并新增了三种 ControlNet 功能，分别是Blur、Canny和Depth。这一更新为用户提供了更强大的图像生成能力，使得生成的图像更加丰富和多样化。根据 Stability AI 的介绍，这一模型的发布是基于其社区许可协议，允许用户在不商业化的前提下免费使用。无论是个人还是机构，都可以在科学研究等领域使用该模型，而无需支付费用。此外，对于年收入低于100万美元的小型企业和创作者，Stability AI 也允许其在商业用途上免费使用该模型。这种宽松的使用

2024年11月29号 10:05

3.4k

Stability AI发布全新 Stable Diffusion 3.5生成模型，三个版本、速度大提升

Stability AI近日推出了其最新的深度学习文本到图像生成模型 ——Stable Diffusion3.5。这一版本包括三种改进的开源模型，旨在满足不同用户的需求，包括研究人员、企业客户和爱好者。其中，Stable Diffusion3.5Large 是整个系列中最强大的模型，参数高达81亿。该模型以其卓越的图像质量和对提示的高度响应能力，成为专业用户的理想选择，能够生成分辨率达到1兆像素的高质量图像。此外，Stable Diffusion3.5Large Turbo 是 Stable Diffusion3.5Large 的简化版。它在生成高质量图像的同时，极大地提升了速度，仅

2024年11月7号 11:25

8.9k

免费开放商用！Stability AI推轻量级AI绘画利器 Stable Diffusion 3.5 Medium模型

Stability AI再次突破技术壁垒，推出全新Stable Diffusion3.5Medium模型。这款面向大众的AI绘画工具不仅完全免费开放商用，更重要的是实现了高性能与普及性的完美平衡。这款采用多模态扩散变换器（MMDiT-X）架构的模型，以25亿参数的精简设计，巧妙解决了普通用户的硬件门槛问题。仅需9.9GB显存，便能在大多数消费级显卡上流畅运行，真正实现了"人人可用"的愿景。在技术创新方面，该模型整合了三种预训练文本编码器，并引入QK标准化技术提升训练稳定性。特别值得一提的是，其前12个变换层

2024年10月30号 9:56

3.6k

比FLUX快100倍！英伟达联手MIT、清华推出超快AI图像生成模型Sana，笔记本也能秒速出图！

英伟达与麻省理工学院、清华大学的研究人员合作开发了一款名为Sana的全新文本到图像生成框架，该框架能够高效生成高达4096×4096分辨率的图像。Sana可以在极快的速度下合成高分辨率、高质量且与文本高度一致的图像，甚至可以在笔记本电脑的GPU上运行。Sana 的核心设计包括:深度压缩自动编码器: 与传统的自动编码器仅压缩图像8倍不同，Sana 训练的自动编码器可以将图像压缩32倍，有效减少了潜在标记的数量。线性 DiT: Sana 将 DiT 中所有普通的注意力机制替换为线性注意力机制，这在高分

2024年10月17号 14:01

9.1k

阿里发布 FLUX.1-Turbo-Alpha：基于FLUX.1-dev、8步提炼Lora

近日，阿里妈妈创意团队发布了 FLUX.1-Turbo-Alpha，这是基于 FLUX.1-dev 模型训练的一款8步蒸馏 Lora 模型。该模型采用了多头判别器，显著提高了蒸馏的质量，支持文本到图像生成、修复控制网等多种 FLUX 相关的应用。团队建议在使用时将引导尺度设置为3.5，Lora 尺度为1，未来还会推出更低步数的版本。FLUX.1-Turbo-Alpha 可以直接与 Diffusers 框架结合使用。用户只需通过几行代码便能加载模型并生成所需的图像。例如，你可以创建一个有趣的场景:一只微笑的树懒穿着皮夹克、牛仔帽、格子裙和蝴蝶

2024年10月14号 9:24

9.5k

AI 颠覆创作！Stability AI三款最新文生图模型强势登陆Amazon Bedrock！

Stability AI 与亚马逊网络服务 (AWS) 合作，引入三款全新文本到图像生成模型至 Amazon Bedrock 服务，以提升商业定位和市场竞争力。这三款模型——Stable Image Ultra、Stable Diffusion3Large 和 Stable Image Core——分别针对不同需求，提供从高质量图像生成到快速大批量图像生产，以及更经济的选择，满足市场营销、广告和设计行业等不同场景。其中，Stable Image Ultra 作为旗舰产品，专为需要极高视觉效果的行业设计，如市场营销和建筑设计。Stable Image Core 则提供经济实惠的选择，适合一般需求。Stability AI 通过这些合作和新模型的引入，旨在扩展市场渠道，通过会员模式和 Stable Assistant 聊天机器人提供服务，并考虑通过云服务提供商、系统集成商和其他模型服务提供商扩大模型的可及性。在经历领导层变动后，Stability AI 正寻求新的增长机会。

2024年9月5号 10:48

2.5k

AI日报：免费25张！Midjourney网页版向所有用户开放；爱诗科技上线PixVerse V2.5；Claude移动应用收入破100万美元

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、Midjourney全面开放网站，向所有用户免费提供每天25张额度Midjourney作为AI文本到图像生成和图像编辑的领军者，面临着来自竞争对手的挑战。AstribotS1展示了超强的多功能性和智能化，预示着未来人们生活中将有更多AI助手的出现。

2024年8月22号 14:50

650

AI资讯

AI日报

AI时间线

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图