Best AI Websites & Tools
zh
红薯智语
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
红薯智语
PromptFix
根据人类指令修复和编辑照片的框架
普通产品
图像
图像处理
扩散模型
打开网站
PromptFix是一个综合框架,能够使扩散模型遵循人类指令执行各种图像处理任务。该框架通过构建大规模的指令遵循数据集,提出了高频引导采样方法来控制去噪过程,并设计了辅助提示适配器,利用视觉语言模型增强文本提示,提高模型的任务泛化能力。PromptFix在多种图像处理任务中表现优于先前的方法,并在盲恢复和组合任务中展现出优越的零样本能力。
网站截图
产品特色
需求人群
使用示例
使用教程
打开网站
构建大规模指令遵循数据集,覆盖低级任务、图像编辑和对象创建。
提出高频引导采样方法,控制去噪过程,保留未处理区域的高频细节。
设计辅助提示适配器,利用视觉语言模型增强文本提示,提升任务泛化能力。
在多种图像处理任务中表现优异,包括图像去模糊、色彩增强、物体移除等。
实现与基线模型相当的推理效率,并在盲恢复和组合任务中展现优越的零样本能力。
目标受众为图像处理专业人士、研究人员以及对图像编辑有需求的普通用户。PromptFix因其强大的图像处理能力和易用性,特别适合需要对图像进行高质量编辑和修复的用户,无论是在学术研究还是商业应用中都能发挥重要作用。
用户可以通过PromptFix去除照片中的模糊,提升图片质量。
在风景照片中注入更多色彩,使场景更加生动。
从照片中移除不需要的物体或人物,如去除照片中的印章或排除左侧的人物。
1. 访问PromptFix网站并了解产品概述。
2. 根据需要的图像处理任务,选择相应的指令。
3. 上传需要处理的图片到PromptFix平台。
4. 输入具体的处理指令,如‘去除模糊’或‘增强色彩’。
5. PromptFix将根据指令对图片进行处理。
打开网站
PromptFix 替代品
Fashion-VDM
— 视频扩散模型,用于虚拟试穿。
图像
•
虚拟试穿
•
视频生成
294
Slicedit
— 基于文本的视频编辑技术,使用时空切片。
视频
•
视频编辑
•
文本到图像
222
CAT3D
— 从多视角图像创建3D场景
图像
•
3D建模
•
图像处理
852
ObjectDrop
— 一种通过计数事实数据集和自举监督实现真实物体删除和插入的方法
图像
•
计算机视觉
•
图像处理
708
MouSi
— 多模态视觉语言模型
生产力
•
多模态
•
视觉语言模型
234
ImageToPromptAI
— 图像转换为文本提示的AI工具
图像
•
AI工具
•
图像转换
666
LLaVA-o1
— 视觉语言模型,能够进行逐步推理
生产力
•
视觉语言模型
•
逐步推理
18
sd-ppp
— Photoshop与SD/SDForge/ComfyUI之间的通信插件
设计
•
Photoshop
•
Stable Diffusion
12
AI Tattoo Removal
— AI技术预览纹身去除效果,辅助决策
图像
•
纹身去除
•
机器学习
114
MikuDance
— 基于扩散的混合运动动态角色艺术动画生成工具
图像
•
动画
•
角色艺术
24
face_anon_simple
— 人脸匿名化技术,保留关键细节同时有效保护隐私。
图像
•
人脸匿名化
•
隐私保护
72
Watermark Anything
— 图像水印技术,可在图片中嵌入局部化水印信息
图像
•
图像水印
•
版权保护
60
SeedEdit
— 基于文本提示修订图像的大型扩散模型
图像
•
图像编辑
•
扩散模型
774
ComfyUI-GIMM-VFI
— 基于GIMM-VFI的ComfyUI帧插值工具
图像
•
帧插值
•
视频处理
144
Aquila-VL-2B-llava-qwen
— 视觉语言模型,结合图像和文本信息进行智能处理。
图像
•
视觉语言模型
•
多模态
30
Face Sticker AI
— 使用AI将您的面部照片变成面部贴纸
图像
•
面部识别
•
图像处理
132
Claude Vision Object Detection
— 利用Claude 3.5 Sonnet Vision API进行图像中物体检测和可视化的强大Python工具
图像
•
物体检测
•
图像处理
78
InstantIR
— 盲图像恢复技术,利用即时生成参考图像恢复破损图像
图像
•
图像恢复
•
盲图像恢复
198
Excerptor
— 从实体书籍中提取划线或手写标记的文本
生产力
•
文本识别
•
OCR
66
Mochi 1 AI
— AI视频生成器,从文本提示生成高质量视频
视频
•
AI视频生成
•
文本提示
162
MarDini
— 大规模视频生成的自回归扩散模型
视频
•
视频生成
•
自回归
84
ROCKET-1
— 掌握开放世界交互的视觉-时间上下文提示模型
编程
•
视觉-语言模型
•
具身决策
78
Flux.1 Lite
— 8B参数变分自编码器模型,用于高效的文本到图像生成。
图像
•
文本到图像
•
AI生成
120
FasterCache
— 视频扩散模型加速工具,无需训练即可生成高质量视频内容。
视频
•
视频生成
•
扩散模型
48
MaskGCT
— 无需对齐信息的零样本文本到语音转换模型
其他
•
文本到语音
•
零样本学习
174
OmniParser
— 基于纯视觉的图形用户界面代理解析器
生产力
•
视觉语言模型
•
用户界面解析
408
genmoai
— 开源视频生成模型
视频
•
视频生成
•
机器学习
120