Best AI Websites & Tools
zh
红薯智语
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
红薯智语
MOTIA
通过内在适应掌握视频外延画技术的高质量灵活方法
普通产品
视频
视频处理
内容外延画
打开网站
MOTIA是一个基于测试时适应的扩散方法,利用源视频内的内在内容和运动模式来有效进行视频外延画。该方法包括内在适应和外在渲染两个主要阶段,旨在提升视频外延画的质量和灵活性。
网站截图
产品特色
需求人群
使用示例
使用教程
打开网站
视频内容外延
基于源视频的模式学习
利用扩散模型的生成先验
适用于研究人员和开发者,探索提升视频内容外延画质量的新技术。
提升视频画面的空间外延质量
在复杂动态场景中保持一致性
无需额外训练即可实现外延效果
打开网站
MOTIA 替代品
InstantIR
— 盲图像恢复技术,利用即时生成参考图像恢复破损图像
图像
•
图像恢复
•
盲图像恢复
48
PromptFix
— 根据人类指令修复和编辑照片的框架
图像
•
图像处理
•
扩散模型
12
MarDini
— 大规模视频生成的自回归扩散模型
视频
•
视频生成
•
自回归
84
FasterCache
— 视频扩散模型加速工具,无需训练即可生成高质量视频内容。
视频
•
视频生成
•
扩散模型
42
genmoai
— 开源视频生成模型
视频
•
视频生成
•
机器学习
90
stable-diffusion-3.5-large-turbo
— 高效能的文本到图像生成模型
图像
•
文本到图像
•
生成模型
396
stable-diffusion-3.5-large
— 高性能的文本到图像生成模型
图像
•
图像生成
•
文本到图像
210
VidPanos
— 从手机拍摄的平移视频中生成全景视频
视频
•
全景视频
•
视频生成
126
Wav2Lip
— 高精度视频唇形同步技术
视频
•
唇形同步
•
视频处理
114
Sieve Eye Contact Correction
— 视频眼神校正API,让视频中的眼神看起来始终注视着摄像头。
视频
•
眼神校正
•
视频处理
138
Video Background Removal
— 视频背景移除工具,一键去除视频背景。
生产力
•
视频处理
•
背景移除
600
ACE: All-round Creator and Editor Following Instructions via Diffusion Transformer
— 全能的创造者和编辑器,通过扩散变换遵循指令
图像
•
视觉生成
•
扩散模型
96
Inverse Painting
— 逆向绘画技术,重现绘画过程
图像
•
图像生成
•
艺术创作
1218
HelloMeme
— 集成空间编织注意力,提升扩散模型的高保真条件
图像
•
图像生成
•
视频生成
228
Diffusers Image Outpaint
— 使用扩散模型进行图像外延
图像
•
图像生成
•
扩散模型
504
InstantDrag
— 提升基于拖拽的图像编辑的交互性和速度
图像
•
图像编辑
•
拖拽操作
156
OmniGen
— 统一的图像生成框架,简化多任务图像生成。
图像
•
图像生成
•
扩散模型
180
Draw an Audio
— 利用多指令视频到音频合成技术
音乐
•
音频合成
•
视频处理
84
Concept Sliders
— 用于精确控制扩散模型中概念的低秩适配器
图像
•
图像生成
•
文本到图像
102
Generative Keyframe Interpolation with Forward-Backward Consistency
— 利用预训练的图像到视频扩散模型生成连贯中间帧
图像
•
图像到视频
•
扩散模型
156
Follow-Your-Canvas
— 高分辨率视频外延与内容生成技术
视频
•
视频外延
•
内容生成
102
DiPIR
— 利用扩散引导逆渲染技术实现逼真物体插入
图像
•
图像合成
•
虚拟物体
186
GameNGen
— 神经模型驱动的实时游戏引擎
图像
•
神经模型
•
实时互动
330
KEEP
— 视频人脸超分辨率的创新框架
图像
•
视频处理
•
人脸超分辨率
750
YouDub-webui
— 优质视频中文化工具
视频
•
翻译
•
视频处理
306
ml-mdm
— 高效训练高质量文本到图像扩散模型
图像
•
机器学习
•
深度学习
180
ComfyUI-CogVideoXWrapper
— 视频处理工具,实现从图像到视频的转换。
视频
•
视频处理
•
图像到视频
246
MiniCPM-V 2.6
— 高性能多模态语言模型,适用于图像和视频理解。
图像
•
多模态
•
图像理解
192
TexGen
— 3D纹理生成技术,根据文本描述合成3D纹理
图像
•
3D纹理
•
多视角采样
270