Best AI Websites & Tools
zh
AI产品榜
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
AI产品榜
PromptFix
根据人类指令修复和编辑照片的框架
普通产品
图像
图像处理
扩散模型
打开网站
PromptFix是一个综合框架,能够使扩散模型遵循人类指令执行各种图像处理任务。该框架通过构建大规模的指令遵循数据集,提出了高频引导采样方法来控制去噪过程,并设计了辅助提示适配器,利用视觉语言模型增强文本提示,提高模型的任务泛化能力。PromptFix在多种图像处理任务中表现优于先前的方法,并在盲恢复和组合任务中展现出优越的零样本能力。
网站截图
产品特色
需求人群
使用示例
使用教程
打开网站
构建大规模指令遵循数据集,覆盖低级任务、图像编辑和对象创建。
提出高频引导采样方法,控制去噪过程,保留未处理区域的高频细节。
设计辅助提示适配器,利用视觉语言模型增强文本提示,提升任务泛化能力。
在多种图像处理任务中表现优异,包括图像去模糊、色彩增强、物体移除等。
实现与基线模型相当的推理效率,并在盲恢复和组合任务中展现优越的零样本能力。
目标受众为图像处理专业人士、研究人员以及对图像编辑有需求的普通用户。PromptFix因其强大的图像处理能力和易用性,特别适合需要对图像进行高质量编辑和修复的用户,无论是在学术研究还是商业应用中都能发挥重要作用。
用户可以通过PromptFix去除照片中的模糊,提升图片质量。
在风景照片中注入更多色彩,使场景更加生动。
从照片中移除不需要的物体或人物,如去除照片中的印章或排除左侧的人物。
1. 访问PromptFix网站并了解产品概述。
2. 根据需要的图像处理任务,选择相应的指令。
3. 上传需要处理的图片到PromptFix平台。
4. 输入具体的处理指令,如‘去除模糊’或‘增强色彩’。
5. PromptFix将根据指令对图片进行处理。
打开网站
PromptFix 替代品
X-Dyna
— X-Dyna是一种基于扩散模型的零样本人类图像动画生成技术。
图像
•
图像动画
•
零样本学习
24
TryOffDiff
— 基于扩散模型的高保真服装重建虚拟试穿技术
图像
•
虚拟试穿
•
服装重建
270
Diffusion Self-Distillatio
— 一种用于零样本定制图像生成的扩散自蒸馏技术
图像
•
图像生成
•
零样本学习
372
Fashion-VDM
— 视频扩散模型,用于虚拟试穿。
图像
•
虚拟试穿
•
视频生成
822
Slicedit
— 基于文本的视频编辑技术,使用时空切片。
视频
•
视频编辑
•
文本到图像
240
CAT3D
— 从多视角图像创建3D场景
图像
•
3D建模
•
图像处理
882
ObjectDrop
— 一种通过计数事实数据集和自举监督实现真实物体删除和插入的方法
图像
•
计算机视觉
•
图像处理
720
MouSi
— 多模态视觉语言模型
生产力
•
多模态
•
视觉语言模型
264
ImageToPromptAI
— 图像转换为文本提示的AI工具
图像
•
AI工具
•
图像转换
900
Hunyuan3D 2.0
— Hunyuan3D 2.0 是腾讯推出的高分辨率 3D 资产生成系统,基于大规模扩散模型。
中文精选
•
3D
•
纹理生成
168
美间AI无损放大
— 美间AI无损放大,一键提升图片清晰度,让图像放大不失真
图像
•
图像处理
•
无损放大
126
MangaNinja
— MangaNinja 是一种基于参考的线稿上色方法,可实现精确匹配和细粒度交互控制。
图像
•
图像处理
•
线稿上色
132
googleocr-app
— 一个基于Google Gemini 2.0的高精度OCR文字识别应用。
图像
•
文字识别
•
图像处理
42
Ollama OCR for web
— 一个强大的OCR包,使用最先进的视觉语言模型提取图像中的文本。
图像
•
OCR
•
图像识别
126
Shapen
— 将图像转换为3D模型,可用于渲染、动画或3D打印。
设计
•
3D建模
•
图像处理
120
美图云修
— 专业级AI人像精修,极速出片,极致效果。
图像
•
AI修图
•
人像精修
126
StructLDM
— 一种从2D图像学习3D人体生成的结构化潜在扩散模型。
图像
•
3D人体生成
•
潜在扩散模型
96
Moondream AI
— 开源的视觉语言模型,可在多种设备上运行。
其他
•
开源
•
多模态
90
FitDiT
— FitDiT 是一种用于高保真虚拟试衣的新型服装感知增强技术。
图像
•
虚拟试衣
•
图像处理
156
Hallo3
— 一种基于扩散变换器网络的高动态、逼真肖像图像动画技术。
图像
•
肖像动画
•
视频生成
186
SVFR
— SVFR是一个用于视频人脸修复的统一框架。
图像
•
视频人脸修复
•
图像处理
108
InternVL2_5-38B-MPO
— InternVL2.5-MPO系列模型,基于InternVL2.5和混合偏好优化,展现卓越性能。
聊天
•
多模态
•
大型语言模型
132
Diffusion as Shader
— 一种支持多种视频生成控制任务的统一架构模型。
视频
•
视频生成
•
3D感知
120
STAR
— STAR是一种用于真实世界视频超分辨率的时空增强框架,首次将强大的文本到视频扩散先验集成到真实世界视频超分辨率中。
视频
•
视频超分辨率
•
文本到视频
186
InternVL2_5-26B-MPO-AWQ
— 先进的多模态大型语言模型,具备卓越的多模态推理能力。
编程
•
多模态
•
大型语言模型
66
CreatiLayout
— 基于孪生多模态扩散变换器的创意布局到图像生成技术
图像
•
图像生成
•
多模态
288
SHMT
— 一种基于潜在扩散模型的自监督层次化化妆迁移技术
图像
•
图像处理
•
自监督学习
60