Best AI Websites & Tools
zh
AI产品榜
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
AI产品榜
InstructVideo
文本到视频的指导生成模型
中文精选
视频
文本到视频
扩散模型
打开网站
InstructVideo 是一种通过人类反馈用奖励微调来指导文本到视频的扩散模型的方法。它通过编辑的方式进行奖励微调,减少了微调成本,同时提高了微调效率。它使用已建立的图像奖励模型,通过分段稀疏采样和时间衰减奖励的方式提供奖励信号,显著提高了生成视频的视觉质量。InstructVideo 不仅能够提高生成视频的视觉质量,还能保持较强的泛化能力。欲了解更多信息,请访问官方网站。
网站截图
产品特色
需求人群
使用示例
使用教程
打开网站
通过人类反馈进行奖励微调
编辑方式进行奖励微调
使用图像奖励模型提供奖励信号
分段稀疏采样和时间衰减奖励
适用于指导文本到视频生成模型的训练和优化
打开网站
InstructVideo 替代品
AsyncDiff
— 异步去噪并行化扩散模型
编程
•
分布式计算
•
文本到图像
168
Lumina-T2X
— 一个统一的文本到任意模态生成框架
图像
•
文本到图像
•
文本到视频
378
Show-1
— Show-1 将像素和潜在扩散模型结合起来,以实现高效的高质量文本到视频的生成
视频
•
文本到视频
•
视频生成
1152
X-Dyna
— X-Dyna是一种基于扩散模型的零样本人类图像动画生成技术。
图像
•
图像动画
•
零样本学习
24
Hunyuan3D 2.0
— Hunyuan3D 2.0 是腾讯推出的高分辨率 3D 资产生成系统,基于大规模扩散模型。
中文精选
•
3D
•
纹理生成
180
Diffusion as Shader
— 一种支持多种视频生成控制任务的统一架构模型。
视频
•
视频生成
•
3D感知
120
STAR
— STAR是一种用于真实世界视频超分辨率的时空增强框架,首次将强大的文本到视频扩散先验集成到真实世界视频超分辨率中。
视频
•
视频超分辨率
•
文本到视频
186
CreatiLayout
— 基于孪生多模态扩散变换器的创意布局到图像生成技术
图像
•
图像生成
•
多模态
288
VMix
— 文本到图像扩散模型的美学质量提升工具
图像
•
文本到图像
•
扩散模型
54
DiffSensei
— 定制化漫画生成模型,连接多模态LLMs和扩散模型。
图像
•
漫画生成
•
多模态
750
DynamicControl
— 自适应条件选择,提升文本到图像生成控制力
图像
•
文本到图像
•
扩散模型
90
ClipVideo AI
— 快速AI视频生成平台
视频
•
AI视频生成
•
文本到视频
366
VideoVAEPlus
— 高保真视频编码,适用于大运动场景的视频自编码器。
视频
•
视频编码
•
变分自编码器
42
InvSR
— 基于扩散反转的多步图像超分辨率模型
图像
•
图像超分辨率
•
扩散模型
66
ColorFlow
— 图像序列着色模型,保留细粒度身份信息
图像
•
图像着色
•
身份保留
60
Leffa
— 可控人物图像生成模型
图像
•
图像生成
•
虚拟试穿
444
ComfyUI_HelloMeme
— 基于扩散模型的图像和视频生成工具
图像
•
图像生成
•
视频生成
480
Zebracat
— AI视频创作平台,快速制作专业视频
视频
•
AI视频生成
•
文本到视频
210
Color-diffusion
— 利用扩散模型为黑白图片上色
图像
•
图像着色
•
扩散模型
108
Pollo AI
— AI视频生成器,将想象变为现实
国外精选
•
AI视频生成
•
文本到视频
564
AnchorCrafter
— 基于扩散模型的2D视频生成系统,实现人-物交互动画。
视频
•
视频生成
•
人-物交互
300
text-to-pose
— 基于文本生成姿态并进一步生成图像的模型
图像
•
文本到图像
•
姿态估计
78
DiffusionDrive
— 实时端到端自动驾驶的截断扩散模型
生产力
•
自动驾驶
•
端到端
60
TryOffDiff
— 基于扩散模型的高保真服装重建虚拟试穿技术
图像
•
虚拟试穿
•
服装重建
270
Diffusion Self-Distillatio
— 一种用于零样本定制图像生成的扩散自蒸馏技术
图像
•
图像生成
•
零样本学习
372
ConsisID
— 基于频率分解的身份保持文本到视频生成模型
视频
•
文本到视频
•
身份保持
114
CAT4D
— 4D场景创建工具,使用多视图视频扩散模型
图像
•
4D场景
•
多视图视频
162
OneDiffusion
— 多功能大规模扩散模型,支持双向图像合成与理解。
图像
•
扩散模型
•
图像合成
162
Allegro-TI2V
— 文本图像到视频生成模型
视频
•
视频生成
•
文本到视频
210