免费开放商用！Stability AI推轻量级AI绘画利器 Stable Diffusion 3.5 Medium模型

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年10月30号 9:56

352

Stability AI再次突破技术壁垒，推出全新Stable Diffusion3.5Medium模型。这款面向大众的AI绘画工具不仅完全免费开放商用，更重要的是实现了高性能与普及性的完美平衡。

这款采用多模态扩散变换器（MMDiT-X）架构的模型，以25亿参数的精简设计，巧妙解决了普通用户的硬件门槛问题。仅需9.9GB显存，便能在大多数消费级显卡上流畅运行，真正实现了"人人可用"的愿景。

在技术创新方面，该模型整合了三种预训练文本编码器，并引入QK标准化技术提升训练稳定性。特别值得一提的是，其前12个变换层中的双重注意力模块设计，让模型在图像质量、排版效果和复杂提示理解等方面都有显著提升。

模型的训练过程融合了合成数据与精选公共数据，采用渐进式分辨率提升的混合训练策略，确保了生成图像的多样性和质量。与同类中型模型相比，它在图像生成效果和处理速度上都展现出明显优势。

不过，用户在使用过程中需要注意一些细节:过长的提示词可能导致图像边缘出现瑕疵;建议使用跳层指导采样方式来优化图像的结构完整性;同时要注意，由于训练数据分布的差异，相同提示词可能会产生不同的创作效果。

这款模型的发布，不仅为个人创作者和初创企业提供了便捷的AI创作工具，更体现了Stability AI推动AI技术普及化的决心。无论是用于艺术创作还是教育开发，它都将为更广泛的用户群体带来AI创作的可能性。

模型下载地址：https://huggingface.co/stabilityai/stable-diffusion-3.5-medium

ComfyUI 重磅更新：桌面版正式发布，小白也能轻松玩转 AI 绘画！

开源 AI 绘画工具 ComfyUI 终于迎来了官方桌面版本!这款支持 Windows 和 Mac 系统的桌面版不仅完全开源，还针对新手用户推出了详尽的操作指南，让 AI 绘画不再是技术大佬的专属游戏。告别繁琐的设置，ComfyUI 桌面版为用户带来了更加便捷流畅的使用体验。它集成了推荐的 Python 环境，自动更新最新版本，并能直接导入您现有的 ComfyUI 文件，包括模型、输入和输出文件。这意味着您可以轻松地将之前的项目迁移到桌面版，继续您的创作之旅。更令人惊喜的是，桌面版内置了 ComfyUI 管理器，您可

无需顶级显卡，Meissonic 让你轻松生成媲美 SDXL 的高清大图！

Stable Diffusion 等模型的出现标志着图像生成领域取得了重大进展，但其与自回归语言模型的根本区别，阻碍了统一的语言视觉模型的开发。为解决这一问题，研究人员推出了 Meissonic，它将非自回归掩码图像建模（MIM）文本到图像技术提升到了与 SDXL 等最先进的扩散模型相媲美的水平。Meissonic 的核心在于一系列架构创新、先进的位置编码策略以及优化的采样条件，这些改进显著提高了 MIM 的性能和效率。此外，Meissonic 还利用了高质量的训练数据，集成了基于人类偏好分数的微条件，并采用

Stability AI发布全新 Stable Diffusion 3.5生成模型，三个版本、速度大提升

Stability AI近日推出了其最新的深度学习文本到图像生成模型 ——Stable Diffusion3.5。这一版本包括三种改进的开源模型，旨在满足不同用户的需求，包括研究人员、企业客户和爱好者。其中，Stable Diffusion3.5Large 是整个系列中最强大的模型，参数高达81亿。该模型以其卓越的图像质量和对提示的高度响应能力，成为专业用户的理想选择，能够生成分辨率达到1兆像素的高质量图像。此外，Stable Diffusion3.5Large Turbo 是 Stable Diffusion3.5Large 的简化版。它在生成高质量图像的同时，极大地提升了速度，仅

迪士尼推全新AI图像压缩方法：能保留图片细节，却有 “幻觉” 风险

迪士尼的研究团队最近推出了一种全新的图像压缩方法，利用开源的 Stable Diffusion V1.2模型，这种方法可以在比竞争对手更低的比特率下生成更真实的图像。这种新方法被称为 “编解码器”，尽管它比传统的 JPEG 和 AV1编解码器复杂得多，但其性能却令人惊叹。该研究表明，新方法在图像细节的恢复上表现得更为出色，同时所需的训练成本也大大降低。研究人员发现，量化误差（图像压缩中的核心过程）与噪声(扩散模型中的核心过程)非常相似，因此可以将传统量化图像视为原始图像的噪声