Best AI Websites & Tools
zh
AI产品榜
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
AI产品榜
PromptFix
根据人类指令修复和编辑照片的框架
普通产品
图像
图像处理
扩散模型
打开网站
PromptFix是一个综合框架,能够使扩散模型遵循人类指令执行各种图像处理任务。该框架通过构建大规模的指令遵循数据集,提出了高频引导采样方法来控制去噪过程,并设计了辅助提示适配器,利用视觉语言模型增强文本提示,提高模型的任务泛化能力。PromptFix在多种图像处理任务中表现优于先前的方法,并在盲恢复和组合任务中展现出优越的零样本能力。
网站截图
产品特色
需求人群
使用示例
使用教程
打开网站
构建大规模指令遵循数据集,覆盖低级任务、图像编辑和对象创建。
提出高频引导采样方法,控制去噪过程,保留未处理区域的高频细节。
设计辅助提示适配器,利用视觉语言模型增强文本提示,提升任务泛化能力。
在多种图像处理任务中表现优异,包括图像去模糊、色彩增强、物体移除等。
实现与基线模型相当的推理效率,并在盲恢复和组合任务中展现优越的零样本能力。
目标受众为图像处理专业人士、研究人员以及对图像编辑有需求的普通用户。PromptFix因其强大的图像处理能力和易用性,特别适合需要对图像进行高质量编辑和修复的用户,无论是在学术研究还是商业应用中都能发挥重要作用。
用户可以通过PromptFix去除照片中的模糊,提升图片质量。
在风景照片中注入更多色彩,使场景更加生动。
从照片中移除不需要的物体或人物,如去除照片中的印章或排除左侧的人物。
1. 访问PromptFix网站并了解产品概述。
2. 根据需要的图像处理任务,选择相应的指令。
3. 上传需要处理的图片到PromptFix平台。
4. 输入具体的处理指令,如‘去除模糊’或‘增强色彩’。
5. PromptFix将根据指令对图片进行处理。
打开网站
PromptFix 替代品
TryOffDiff
— 基于扩散模型的高保真服装重建虚拟试穿技术
图像
•
虚拟试穿
•
服装重建
132
Diffusion Self-Distillatio
— 一种用于零样本定制图像生成的扩散自蒸馏技术
图像
•
图像生成
•
零样本学习
348
Fashion-VDM
— 视频扩散模型,用于虚拟试穿。
图像
•
虚拟试穿
•
视频生成
630
Slicedit
— 基于文本的视频编辑技术,使用时空切片。
视频
•
视频编辑
•
文本到图像
228
CAT3D
— 从多视角图像创建3D场景
图像
•
3D建模
•
图像处理
858
ObjectDrop
— 一种通过计数事实数据集和自举监督实现真实物体删除和插入的方法
图像
•
计算机视觉
•
图像处理
714
MouSi
— 多模态视觉语言模型
生产力
•
多模态
•
视觉语言模型
258
ImageToPromptAI
— 图像转换为文本提示的AI工具
图像
•
AI工具
•
图像转换
756
ColorFlow
— 图像序列着色模型,保留细粒度身份信息
图像
•
图像着色
•
身份保留
12
Procyon Professional Benchmark Suite
— 专业用户的性能测试基准套件
其他
•
性能测试
•
基准测试
18
Leffa
— 可控人物图像生成模型
图像
•
图像生成
•
虚拟试穿
222
Whisk
— 革新图像创作,探索无限可能。
国外精选
•
图像处理
•
创意工具
2028
DeepSeek-VL2-Tiny
— 先进的大型混合专家视觉语言模型
图像
•
视觉语言模型
•
混合专家
42
POINTS-Yi-1.5-9B-Chat
— 视觉语言模型的最新进展,集成微信AI的新技术
生产力
•
视觉语言模型
•
微信AI
18
POINTS-Qwen-2-5-7B-Chat
— 视觉语言模型的最新进展
生产力
•
视觉语言模型
•
多模态
36
POINTS-1-5-Qwen-2-5-7B-Chat
— 领先视觉语言模型,支持双语及高质量控制,免费。
生产力
•
视觉语言模型
•
双语支持
12
DeepSeek-VL2
— 先进的多模态理解模型,融合视觉与语言能力。
图像
•
视觉语言模型
•
多模态理解
66
Meta Motivo
— 首款基于行为基础模型的虚拟物理人形代理控制工具
编程
•
强化学习
•
人形控制
60
ComfyUI_HelloMeme
— 基于扩散模型的图像和视频生成工具
图像
•
图像生成
•
视频生成
396
Speed AI
— AI技术驱动的照片编辑器,快速将照片转换成艺术图像或卡通头像。
图像
•
照片编辑
•
艺术创作
120
Poify
— 利用AI创造无限可能,点亮创意之光。
国外精选
•
创意
•
图像处理
174
OpenGVLab InternVL
— 一款AI视觉语言模型,提供图像分析和描述服务。
聊天
•
图像识别
•
深度学习
6
Florence-VL
— 视觉语言模型增强工具,结合生成式视觉编码器和深度广度融合技术。
编程
•
视觉语言模型
•
多模态学习
72
Qwen2-VL-7B
— Qwen2-VL-7B是最新的视觉语言模型,支持多模态理解和文本生成。
图像
•
视觉语言模型
•
多模态
30
Qwen2-VL-2B
— 最先进的视觉语言模型,支持多模态理解和文本生成。
图像
•
视觉语言模型
•
多模态
24
Color-diffusion
— 利用扩散模型为黑白图片上色
图像
•
图像着色
•
扩散模型
102
PaliGemma 2
— PaliGemma 2是功能强大的视觉语言模型,简单易调优。
生产力
•
视觉语言模型
•
机器学习
54