Stable Diffusion 3技术报告揭露Sora同款架构细节

量子位

发布于AI新闻资讯 · 1 分钟阅读 · 2024年3月6号 13:03

Stable Diffusion 3（SD3）技术报告详细介绍了SD3采用的多模态扩散Transformer架构MMDiT，通过对图像和文本表示使用单独两组权重的方式，提升了性能。报告还揭露了SD3引入了重新加权流技术，并进行了规模化研究展望未来的性能提升。此外，报告还提到了文本编码器的问题和建议。总体来说，SD3在技术方面的创新和性能表现给人留下了深刻印象。

阶跃星辰发布图像生成模型Step-1X-Medium 支持图生图等新功能

上海阶跃星辰智能科技有限公司近日宣布，其图像生成模型Step-1X系列迎来了重大升级，推出了性能更优的Step-1X-Medium版本。这一升级版本在多个方面实现了显著提升:基于MMDit架构，生成速度提高了30%以上;经过针对性训练，新版本在理解能力和图文一致性方面更强，生成的画面细节质感更加自然。

Stable Diffusion 3.5 Large正式上线亚马逊 Bedrock平台

在近日的 AWS re:Invent 大会上，Stable Diffusion3.5 Large（SD3.5Large）宣布正式在亚马逊 Bedrock 平台上可用。作为 AWS 的完全托管平台，Bedrock 旨在为开发者提供构建和扩展生成式人工智能应用的基础模型。通过将 SD3.5Large 引入亚马逊 Bedrock，Stability AI 希望满足开发者在可信的 AWS 环境中进行工作和部署的需求，从而使初创企业和大型企业能够安全、便捷地使用这一先进模型，而无需担心额外的基础设施问题。Stable Diffusion3.5 Large在文本到图像生成方面表现卓越，具有多种关键能力。首先，它支持多样

Stability AI发布全新 Stable Diffusion 3.5生成模型，三个版本、速度大提升

Stability AI近日推出了其最新的深度学习文本到图像生成模型 ——Stable Diffusion3.5。这一版本包括三种改进的开源模型，旨在满足不同用户的需求，包括研究人员、企业客户和爱好者。其中，Stable Diffusion3.5Large 是整个系列中最强大的模型，参数高达81亿。该模型以其卓越的图像质量和对提示的高度响应能力，成为专业用户的理想选择，能够生成分辨率达到1兆像素的高质量图像。此外，Stable Diffusion3.5Large Turbo 是 Stable Diffusion3.5Large 的简化版。它在生成高质量图像的同时，极大地提升了速度，仅

免费开放商用！Stability AI推轻量级AI绘画利器 Stable Diffusion 3.5 Medium模型

Stability AI再次突破技术壁垒，推出全新Stable Diffusion3.5Medium模型。这款面向大众的AI绘画工具不仅完全免费开放商用，更重要的是实现了高性能与普及性的完美平衡。这款采用多模态扩散变换器（MMDiT-X）架构的模型，以25亿参数的精简设计，巧妙解决了普通用户的硬件门槛问题。仅需9.9GB显存，便能在大多数消费级显卡上流畅运行，真正实现了"人人可用"的愿景。在技术创新方面，该模型整合了三种预训练文本编码器，并引入QK标准化技术提升训练稳定性。特别值得一提的是，其前12个变换层

AI新闻资讯

Stable Diffusion 3技术报告揭露Sora同款架构细节

量子位

相关AI新闻推荐

阶跃星辰发布图像生成模型Step-1X-Medium 支持图生图等新功能

Stable Diffusion 3.5 Large正式上线亚马逊 Bedrock平台

Stability AI发布全新 Stable Diffusion 3.5生成模型，三个版本、速度大提升

免费开放商用！Stability AI推轻量级AI绘画利器 Stable Diffusion 3.5 Medium模型