近日,图像 AI 初创公司 Recraft 发布了其最新的文本生成图像模型 Recraft v3,该模型在独立测试中表现出色,重新定义了图像生成的性能标准。
根据 Recraft 的介绍,v3模型在生成图像中的文本、保持解剖学准确性、理解提示和制作高质量视觉内容方面都表现优异。其最大的突破在于能够在一次生成中准确呈现长段文本,而许多其他模型在处理超过几个字时常常力不从心。
Recraft v3在 Hugging Face 的文本生成图像基准测试中名列第一,获得1172的 ELO 分数,超越了近期的竞争对手 Flux 和 Ideogram。用户在这个平台上可以通过盲测的方式比较不同模型生成的图像对,并使用类似国际象棋的 ELO 评分系统进行评估。
精确控制功能
Recraft v3还引入了精准控制功能,特别适合专业设计师使用。用户可以在图像中指定文本的确切位置和大小,并可以使用多张参考图像以保持品牌风格的一致性。这些调整并不需要对模型进行重新训练,极大地提高了使用的灵活性。
除了文本生成,Recraft v3还能够生成简单图标到复杂插图的矢量图形,并且配备了一系列基于 AI 的图像编辑工具,如 AI 橡皮擦、修改区域、图像修复、图像扩展、AI 样式调整、清晰度提升等功能。此外,用户还可以使用背景去除工具,增强图像处理体验。
目前,Recraft 在其网页界面上提供每日50个免费使用的积分,基本套餐每月仅需10欧元就可以获得1000个积分。此外,Recraft 还为开发者和企业客户提供 API,便于将其技术整合到各类应用中。
与此同时,AI 图像领域的领先者 Midjourney 也在准备推出其 v7版本。虽然 Midjourney 现有的 v6.1版本在美学效果上备受好评,但在提示理解和文本生成能力上则相对较弱。OpenAI 的 CEO 山姆・奥特曼在近期的活动中也透露了即将更新 DALL-E3或推出新图像工具的消息,表明该领域的竞争正日益激烈。
产品入口:https://top.aibase.com/tool/recraft-v3
划重点:
🌟 Recraft v3在 Hugging Face 的基准测试中以1172的 ELO 分数领先,表现出色。
🎨 新模型支持用户精准控制图像文本的大小和位置,适合专业设计需求。
🖌️ Recraft v3不仅支持图像生成,还具备多种 AI 图像编辑功能,提升用户体验。