AI新闻资讯

AI资讯

不错过全球AI革新的每一个时刻

AI日报

每天三分钟关注AI行业趋势

AI时间线

AI行业大事记

AI变现指南

图片合集

AI图片制作变现案例分享

视频合集

AI视频制作变现案例分享

音频合集

AI音频制作变现案例分享

文案合集

AI内容写作变现案例分享

AI教程

AI产品榜

AI产品排行榜

展示AI网站的总访问量排名

AI产品流量增速榜

追踪AI网站访问量增长最快产品

AI产品流量下降榜

关注访问量下降明显的AI网站

AI产品周榜

展示AI网站的周访问量排名

AI开源项目库

全景图

github热门AI开源项目总览

产品库工具导航

Stable Diffusion 3：超越现有文本到图像生成系统的最强文生图模型

虎嗅网

发布于AI新闻资讯 · 1 分钟阅读 · Mar 6, 2024

Stable Diffusion 3是一款通过MMDiT架构展现出超越现有文本到图像生成系统性能的最强文生图模型。其在视觉美感、文本遵循和排版方面均超越其他先进模型。通过MMDiT架构结合DiT和矩形流形式，独立处理图像和语言表示，实现了更准确、更高质量的图像生成。此外，Stable Diffusion 3具有灵活性，能在不同硬件设备上快速生成图像，并提供多种模型规模选择。通过MMDiT架构、Prompt Following功能、Rectified Flow方法等技术改进，Stable Diffusion 3在文本到图像生成任务中取得更好的效果，为未来的创意产业和虚拟现实应用带来新的可能性。

Stable Diffusion 3 文生图模型 MMDiT

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

AI日报：可生成汉字！智谱开源文生图模型CogView4；大模型工具Ollama存在严重漏洞；腾讯元宝下载量超DeepSeek

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、智谱发布首个能生成汉字的开源文生图模型CogView42025年3月4日，北京智谱华章科技有限公司推出了CogView4，这是首个支持生成汉字的开源文生图模型，具备强大的双语输入和图像生成能力。他强调了完善人工智能终端标准体系的重要性，呼吁制定以用户体验为导向的智能化分级标准，并强化国际国内标准的有效衔接。

2025年3月4号 15:20

智谱开源文生图模型CogView4，支持中英双语提示词输入

智谱AI最新开源文生图模型CogView4正式亮相，CogView4不仅在参数数量上达到了6亿，还全面支持中文输入和中文文本到图像的生成，被称其为“首个能在画面中生成汉字的开源模型”。CogView4以支持中英双语提示词输入为核心亮点，尤其擅长理解和遵循复杂的中文指令，成为中文内容创作者的福音。作为首个能在图像中生成汉字的开源文生图模型，它填补了开源领域的一大空白。此外，该模型支持生成任意宽高图片，并能处理任意长度的提示词输入，展现出极高的灵活性。CogView4的双语能力得

2025年3月4号 13:44

2.7k

中文开源图片模型终于来了！智谱霸气发布 CogView4：中文 prompt 随便喂，汉字都能给你画出来！

还在苦苦寻觅能听懂中文的开源图片模型?现在，你可以彻底告别英文 prompt 的“束缚”了!国内 AI 巨头智谱 AI 霸气开源了全新文生图模型 CogView4，直接把中文图片生成技术推向了新高度! 这下，设计师们、内容创作者们，甚至是对 AI 绘画感兴趣的 “小白” 们，都能扬眉吐气，用咱自己的母语，玩转 AI 图像生成了!CogView4最大的亮点，就是它对中文的“超强理解力”!你再也不用对着翻译软件吭哧吭哧地把中文 prompt 翻译成英文，直接用最自然的中文 “指令”，就能让 CogView4秒懂你的 “画意

2025年3月4号 13:44

3.3k

智谱发布首个能生成汉字的开源文生图模型CogView4

北京智谱华章科技有限公司宣布推出首个支持生成汉字的开源文生图模型——CogView4。该模型在DPG-Bench基准测试中综合评分排名第一，成为开源文生图模型中的SOTA（State of the Art），并遵循Apache2.0协议，是首个支持该协议的图像生成模型。

2025年3月4号 13:39

3.8k

文生图模型Ideogram 2a 震撼发布：速度翻倍、成本减半，英文排版媲美人类设计

2025年2月27日，人工智能图像生成服务 Ideogram 迎来了备受瞩目的更新，其最新模型“Ideogram2a”正式上线。根据 Twitter 上用户 @sundyme 的爆料，这一新模型不仅在生成速度上实现了显著提升，同时成本降低了一半，再次巩固了 Ideogram 在文生图（Text-to-Image）领域的领先地位。@sundyme 在推文中盛赞 Ideogram 是一个“被低估”的服务，尤其在生成可用性极高的图像素材方面独树一帜。他特别提到，Ideogram 在英文排版设计上的表现尤为出色，生成的图片几乎看不出 AI 的瑕疵，效果堪比专业人类设计师

2025年2月28号 9:58

4.0k

AI日报：1秒出图！英伟达开源文生图模型Sana；OpenAI发布经济蓝图；Adobe新AI工具一键批量编辑1万张图

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、震撼登场！Hitems计划加大技术投入，推动GenAI和3D模型的应用，进一步拓展市场空间。

2025年1月14号 15:22

1.7k

英伟达开源文生图模型Sana 笔记本电脑也能秒速生成4K超高清图像

AI 图像生成技术正在飞速发展，但模型体积越来越大，对普通用户来说，训练和使用成本都非常高。现在，一种名为 “Sana” 的新型文本到图像框架横空出世，它能够高效生成高达4096×4096分辨率的超高清图像，而且速度惊人，甚至可以在笔记本电脑的 GPU 上运行。Sana 的核心设计包括:深度压缩自编码器:与传统自编码器仅压缩图像8倍不同，Sana 使用的自编码器可以将图像压缩32倍，从而有效地减少了潜在的 tokens 数量。这对于高效训练和生成超高分辨率图像至关重要。线性 DiT:Sana 用线性注意

2025年1月14号 9:58

1.9k

阶跃星辰发布图像生成模型Step-1X-Medium 支持图生图等新功能

上海阶跃星辰智能科技有限公司近日宣布，其图像生成模型Step-1X系列迎来了重大升级，推出了性能更优的Step-1X-Medium版本。这一升级版本在多个方面实现了显著提升:基于MMDit架构，生成速度提高了30%以上;经过针对性训练，新版本在理解能力和图文一致性方面更强，生成的画面细节质感更加自然。

2024年12月26号 8:14

2.1k

Stable Diffusion 3.5 Large正式上线亚马逊 Bedrock平台

在近日的 AWS re:Invent 大会上，Stable Diffusion3.5 Large（SD3.5Large）宣布正式在亚马逊 Bedrock 平台上可用。作为 AWS 的完全托管平台，Bedrock 旨在为开发者提供构建和扩展生成式人工智能应用的基础模型。通过将 SD3.5Large 引入亚马逊 Bedrock，Stability AI 希望满足开发者在可信的 AWS 环境中进行工作和部署的需求，从而使初创企业和大型企业能够安全、便捷地使用这一先进模型，而无需担心额外的基础设施问题。Stable Diffusion3.5 Large在文本到图像生成方面表现卓越，具有多种关键能力。首先，它支持多样

2024年12月20号 11:00

2.8k

震撼来袭！Stability AI的SD3.5L新增三大 ControlNet功能生图能力再升级

Stability AI 正式发布了新版 Stable Diffusion3.5 Large，并新增了三种 ControlNet 功能，分别是Blur、Canny和Depth。这一更新为用户提供了更强大的图像生成能力，使得生成的图像更加丰富和多样化。根据 Stability AI 的介绍，这一模型的发布是基于其社区许可协议，允许用户在不商业化的前提下免费使用。无论是个人还是机构，都可以在科学研究等领域使用该模型，而无需支付费用。此外，对于年收入低于100万美元的小型企业和创作者，Stability AI 也允许其在商业用途上免费使用该模型。这种宽松的使用

2024年11月29号 10:05

3.4k

AI资讯

AI日报

AI时间线

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图