个人可免费商用！Stability AI发布Stable Diffusion3.5系列文生图模型

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年10月23号 8:26

337

昨日晚间，Stability AI发布了其最强大的模型——Stable Diffusion3.5，这不仅是一个单一的模型，而是一个包含三个版本的全家桶，旨在满足从科研人员到业务爱好者、初创公司和企业的多样化需求。

这三个版本分别是Stable Diffusion3.5Large、Stable Diffusion3.5Large Turbo和即将于10月29日发布的Stable Diffusion3.5Medium。

微信截图_20241023082320.png

Stable Diffusion3.5Large是一个拥有80亿参数的基础模型，以其卓越的图像质量和提示词精确度而著称，非常适合专业用途，能够生成高达1百万像素分辨率的图像。

Stable Diffusion3.5Large Turbo是前者的蒸馏版本，它能够在仅4步内生成高质量图像，生成速度远快于Stable Diffusion3.5Large。

而Stable Diffusion3.5Medium则拥有25亿参数，采用改进的MMDiT-X架构和训练方法，设计为即插即用，能够在消费级硬件上直接运行，平衡了图像质量与可定制性，能够生成分辨率在0.25到2百万像素之间的图像。

微信截图_20241023082357.png

这些模型的开发优先考虑了可定制性，通过将Query-Key Normalization集成到transformer块中，稳定了模型训练过程并简化了进一步的微调和开发。为了支持下游任务的灵活性，Stability AI在模型中保留了更广泛的知识基础和多样化的风格，尽管这可能导致输出结果的不确定性增加。

Stable Diffusion3.5模型在多个方面表现出色，包括可定制性、高效性能和多样化输出。这些模型能够轻松微调以满足特定创作需求，或根据定制的工作流程构建应用程序。它们还经过优化，可在标准消费级硬件上运行，无需过高的硬件要求。此外，这些模型能够创建代表全世界的图像，无需大量的提示词，同时能够生成各种风格和美感的图片，如3D、摄影、绘画、线条艺术以及几乎任何可以想象到的视觉风格。

微信截图_20241023082912.png

微信截图_20241023082919.png

Stability AI还强调了其对安全的承诺，采取了合理的措施防止Stable Diffusion3.5被滥用，并从开发早期阶段就注重完整性。此外，Stability AI社区许可非常宽松，允许个人和组织免费使用该模型进行非商业用途，包括科学研究。对于年收入不超过100万美元的初创公司、中小型企业和创作者，也可以免费将该模型用于商业用途。保留生成媒体的所有权，无需受到限制性许可的影响。

Stable Diffusion3.5模型已经在Hugging Face上可供自托管使用，并且推理代码也已经开源。此外，还可以通过Stability AI API、Replicate、ComfyUI和DeepInfra等平台访问该模型。

体验地址:https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large

全球首个亿级参数地震波大模型 “谛听” 发布，2025 年将全面开放

在地震监测和分析领域，一项重大的技术突破于1月17日在国家超级计算机成都中心正式发布。全球首个亿级参数量的地震波大模型 ——“谛听” 大模型的第三阶段测试版本已经上线。这一模型由国家超级计算机成都中心、中国地震局地球物理研究所以及清华大学联合开发，标志着我国在地震研究技术上的一次飞跃。“谛听” 大模型的研发目的在于提升地震信号的识别精度和监测能力，尤其是在处理复杂的地震波形数据方面，能够提供更为高效和准确的分析。据悉，该模型已经在西藏定日

Stability AI 推出 SPAR3D：单图像生成 3D 对象一秒钟搞定

在刚刚结束的 CES 展会上，Stability AI 宣布推出一种名为 SPAR3D（Stable Point Aware3D）的创新方法，这种两阶段的3D 生成技术能够在不到一秒的时间内，从单个图像中生成精确的3D 对象。该技术的推出为游戏开发者、产品设计师和环境构建者提供了全新的3D 原型设计方式。SPAR3D 的独特之处在于，它能够分别建模可见部分和不可见部分。在生成3D 对象时，该方法提供了准确的几何形状及完整的360度视图，包括物体背面的细节。用户还可以通过实时编辑功能，对生成的3D 对象进行直接修改，如删除、

Meta 发布新型记忆层技术：突破参数限制，大幅提升 AI 事实准确性

Meta 公司近日发布了一项突破性的研究成果，他们开发出一种新型的记忆层技术，可以显著提升大型语言模型（LLM）的事实准确性，并在参数规模上实现了前所未有的扩展。这项技术不仅挑战了传统神经网络的扩展方式，还为未来的 AI 架构设计提供了新的方向。这项研究的核心在于利用可训练的键值查找机制，为模型增加额外的参数，而无需增加计算量（FLOPs）。这种方法的核心思想是，通过稀疏激活的记忆层来补充计算密集的前馈层，从而提供专门的存储和检索信息的能力。与传统的稠

微软论文再曝OpenAI模型参数？医疗AI评测意外暴露4o-mini只有8B

在一篇聚焦医疗AI评测的研究论文中，微软似乎再次"不经意"地披露了业界多个顶级大语言模型的参数规模。这份发布于12月26日的论文不仅揭示了包括OpenAI、Anthropic在内的多家公司的模型参数数据，还引发了业内对模型架构和技术实力的热议。根据论文披露，OpenAI的o1-preview模型约有300B参数，GPT-4o约200B，而GPT-4o-mini仅有8B参数。这与英伟达今年初公布的GPT-4采用1.76T MoE架构的说法形成鲜明对比。同时，论文还透露了Claude3.5Sonnet的参数规模约为175B。这已经不是微软第一次在论文中"泄露"模型参

AI新闻资讯