Getty 与 Nvidia 合作推出文本到图像 AI 平台 Generative AI by iStock

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
加拿大 AI 图像生成公司 Ideogram 今日宣布,其全新图像模型 Ideogram2a 正式上线,并已在 Ideogram 官网、API 以及合作伙伴平台全面开放使用。这一发布迅速在 X 平台引发热议,被视为 AI 文生图领域的一次重要升级。Ideogram2a 以更快的生成速度、更低的成本以及优化的图形设计和摄影能力,吸引了全球创作者和开发者的目光。Ideogram2a 的核心亮点根据 X 上的最新反馈,Ideogram2a 是对现有 Ideogram2.0模型的优化版本,主打高效和实用性。X 用户 @WesRothMoney 发帖称:“Ideogram2a 现已上线 Ideogram 网站、API 和
在 AI 图像生成领域,传统的文本提示方式已较为常见。然而,Google 推出的 Whisk 带来了一种全新的视觉优先的方法。它允许用户使用图像作为输入来生成和重新混合创意,为创作者提供了一种更直观、更具创意的图像生成体验。Whisk 简介Whisk 是 Google Labs 推出的一款创新的生成式 AI 工具。它借助 Gemini 和 Imagen 3 模型,通过用户输入的代表主体、场景和风格的图像来生成新的图像。该工具主要定位于创意探索,旨在帮助用户快速生成和迭代各种创意想法,而非用于精确的图像编辑。目前,Whi
研究人员最近开发了一种名为 REPA 的新技术,旨在加速 AI 图像生成模型的训练速度。REPA 代表 REPresentation Alignment,通过整合来自 DINOv2等模型的高质量视觉表示来提高训练速度和输出质量。传统的扩散模型通常会创建嘈杂的图像,然后逐渐将其细化为干净的图像。REPA 增加了一个步骤,将在此去噪过程中生成的表示与来自 DINOv2的表示进行比较。然后,它将扩散模型的隐藏状态投影到 DINOv2的表示上。研究人员表示,REPA 不仅提高了训练效率,还提高了生成的图像质量。使用各种扩散模型架构
["微软工程师发出警报,称公司的 AI 图像生成器存在冒犯和有害图像风险。","工程师向美国监管机构和董事会发信,督促揭示产品安全隐患。","问题源于 Designer 工具,可能生成含有害内容的图像引发争议。","OpenAI 的 DALL-E 模型存在风险,工程师呼吁解决安全隐患问题。"]
["阿里通义实验室开源 AI 图像生成微调框架 SCEdit","SCEdit 框架支持图像生成任务的微调","SCEdit 框架在生成任务中具有高效性能","SCEdit 框架在可控生成任务中实现精准控制","SCEdit 框架节省训练显存开销"]
["根据 FortuneBusinessInsights 的报告,全球 AI 图像生成器市场规模预计将在 2030 年超过 9 亿美元,年复合增长率为 17.4%。","AI 图像生成器在数字艺术和插图制作以及市场营销资料的视觉元素制作等方面有着广泛的应用。","企业领域占据市场主导地位,原因是任务自动化和流程优化。"]
["微软回应海报趋势,调整 AI 图像生成工具以符合迪士尼版权要求","微软阻止 Bing 图像生成器输入「迪士尼」一词","知识产权公司表示复制迪士尼标志侵犯商标权","生成式 AI 是否使用了迪士尼内容存在疑问","大型媒体公司起诉 AI 开发商使用其照片训练AI"]
["Midjourney 发布了风格微调功能 Style Tuner,可以训练自己的生成风格","访问 Tuner 网页选择喜欢的图片组合成自己风格,并生成风格代码","可以重复选择图片不断微调和组合风格,不消耗额外 GPU 时间","可以拿到他人风格代码直接使用,组合多个代码控制生成效果","风格针对提示词优化,不一定能完美迁移到其他主题"]
["微软宣布 Bing Chat 将引入 OpenAI 图像生成工具 DALL-E3","DALL-E3 通过在图像中准确生成文字、标签和符号改进了 DALL-E2 的功能","DALL-E3 将于 10 月对付费用户开放","免费用户可使用 Bing Chat 的 DALL-E3 图像生成器","DALL-E3 在处理图像内的文本方面表现更出色"]
["Deep Dream Generator(深梦生成器):将普通照片转化为梦幻般的艺术作品。","Runway ML(跑道 ML):提供一系列 AI 驱动的图像生成和操作工具。","DALL-E:利用文本描述生成图像,展示 AI 在产生精致视觉方面的无限潜力。"]