Best AI Websites & Tools
zh
红薯智语
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
红薯智语
SPRIGHT
提高文本到图像模型中空间一致性的解决方案
普通产品
图像
文本到图像
空间一致性
打开网站
SPRIGHT是一个专注于空间关系的大规模视觉语言数据集和模型。它通过重新描述600万张图像构建了SPRIGHT数据集,显著增加了描述中的空间短语。该模型在444张包含大量物体的图像上进行微调训练,从而优化生成具有空间关系的图像。SPRIGHT在多个基准测试中实现了空间一致性的最新水平,同时提高了图像质量评分。
网站截图
产品特色
需求人群
使用示例
使用教程
打开网站
大规模空间关系数据集SPRIGHT
在具有大量物体的图像上微调训练以优化空间一致性
在多个基准测试中实现了空间一致性的最新水平
提高了图像质量评分FID和CMMD
SPRIGHT可应用于任何需要生成具有合理空间布局的图像的场景,如室内设计、平面布局、机器人环境模拟等。
一间带有壁炉的客厅
沙发在壁炉的右侧
茶几在沙发前方。
一个装满水果的篮子
苹果在左侧
打开网站
SPRIGHT 替代品
Concept Sliders
— 用于精确控制扩散模型中概念的低秩适配器
图像
•
图像生成
•
文本到图像
90
Pony Diffusion
— 多功能文本到图像扩散模型,生成高质量非真实感图像。
图像
•
AI艺术
•
图像生成
306
FluxImageGenerator.co
— 使用AI技术将文本描述转换为高质量图像。
图像
•
AI图像生成
•
文本到图像
114
RECE
— 一种用于文本到图像扩散模型的概念擦除技术
图像
•
文本到图像
•
概念擦除
108
Follow-Your-Canvas
— 高分辨率视频外延与内容生成技术
视频
•
视频外延
•
内容生成
96
CSGO
— 内容风格合成在文本到图像生成中的应用
图像
•
图像生成
•
风格迁移
360
Qwen2-VL
— 新一代视觉语言模型,更清晰地看世界。
图像
•
视觉语言模型
•
多语言支持
120
AuraFlow v0.3
— 开源文本到图像生成模型
图像
•
文本到图像
•
图像生成
528
half_illustration
— 创造独特的半插图半照片图像。
图像
•
文本到图像
•
艺术创作
396
FLUX.1-dev-Controlnet-Union-alpha
— 一种先进的文本到图像的生成模型。
图像
•
文本到图像
•
图像生成
408
flux-RealismLora
— 基于FLUX.1-dev模型的LoRA文本到图像生成技术。
图像
•
图像生成
•
文本到图像
288
flux-controlnet-canny
— 基于ControlNet的文本到图像生成模型
图像
•
文本到图像
•
图像生成
366
TexGen
— 3D纹理生成技术,根据文本描述合成3D纹理
图像
•
3D纹理
•
多视角采样
234
Flux AI
— AI图像生成,一键创造艺术。
国外精选
•
AI图像生成
•
文本到图像
504
Phantasma Anime
— 创建活泼的动漫风格插画
图像
•
动漫
•
插画
150
FLUX.1-schnell
— 12亿参数的图像生成模型
图像
•
图像生成
•
文本到图像
588
FLUX.1-dev
— 12亿参数的文本到图像生成模型
图像
•
图像生成
•
AI艺术
354
Adobe Firefly Vector AI
— 创意生成AI工具
全球热门
•
生成AI
•
创意工具
816
AuraFlow
— 开源的基于流的文本到图像生成模型
图像
•
文本到图像
•
生成模型
966
Kolors
— 基于潜在扩散模型的大规模文本到图像生成模型
图像
•
图像生成
•
文本到图像
804
InternLM-XComposer-2.5
— 一款多功能大型视觉语言模型
生产力
•
视觉语言模型
•
长上下文处理
558
watercolor-illustration
— 水彩插画风格的文字到图像生成模型
图像
•
AI图像生成
•
LoRA适应性
198
Midsommar Cartoon
— 复古风格卡通模型,融合动漫与北欧卡通元素。
图像
•
图像生成
•
动漫风格
852
DriveVLM
— 自动驾驶与视觉语言模型的融合
其他
•
自动驾驶
•
视觉语言模型
96
AsyncDiff
— 异步去噪并行化扩散模型
编程
•
分布式计算
•
文本到图像
138
Stable Diffusion 3 免费在线
— 先进文本生成图像模型
图像
•
AI图像生成
•
文本到图像
528
InstantX
— AI内容生成研究组织
图像
•
图像生成
•
文本到图像
294
Stable Diffusion 3 Medium
— 先进的文本到图像AI模型,实现高质量图像生成。
国外精选
•
AI图像生成
•
文本到图像
3990