Best AI Websites & Tools
zh
AI产品榜
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
AI产品榜
Boximator
生成丰富可控运动的视频合成工具
普通产品
视频
视频合成
深度学习
打开网站
Boximator是一款由Jiawei Wang、Yuchen Zhang等人开发的智能视频合成工具。它利用先进的深度学习技术,通过添加文本提示和额外的盒子约束,生成丰富且可控制的视频运动。用户可以通过示例或自定义文本来创造独特的视频场景。Boximator与其他方法相比,使用了来自文本提示的附加盒子约束,提供更灵活的运动控制。
网站截图
产品特色
需求人群
使用示例
使用教程
社交网络
打开网站
生成丰富可控制的视频运动
通过添加文本提示和盒子约束实现运动控制
支持用户自定义文本和示例生成
Boximator适用于创造独特视频场景,用户可以通过提供图像和详细的文本提示来生成定制的视频运动。
用户提供一张图像和描述“可爱的3D男孩站着然后走路”生成相应视频
用户提供一张图像和描述“风吹走女人的雨伞,雨天”生成相应视频
用户提供一张图像和描述“一个帅气男人用右手从口袋里拿出一朵玫瑰花并看着它”生成相应视频
打开网站
Boximator 替代品
StableAnimator
— 高质量身份保留的人像动画合成工具。
视频
•
视频合成
•
人像动画
432
BioEmu
— BioEmu 是一个用于可扩展模拟蛋白质平衡系综的生成式深度学习模型。
生产力
•
生物分子模拟
•
深度学习
36
FlashVideo
— FlashVideo 是一个高效的高分辨率视频生成模型,专注于细节和保真度的流动。
视频
•
视频生成
•
高效计算
138
DeepSeek 模型兼容性检测
— 检测设备是否能运行不同规模的 DeepSeek 模型,提供兼容性预测。
其他
•
深度学习
•
模型部署
1236
Huginn-0125
— Huginn-0125是一个35亿参数的潜变量循环深度模型,擅长推理和代码生成。
编程
•
深度学习
•
推理
60
recurrent-pretraining
— 大规模深度循环语言模型的预训练代码,支持在4096个AMD GPU上运行。
编程
•
深度学习
•
自然语言处理
54
InspireMusic
— 基于 PyTorch 的音乐、歌曲和音频生成工具包,支持高质量音频生成
音乐
•
音乐生成
•
音频处理
156
Lumina-Video
— Lumina-Video 是一个用于视频生成的初步尝试项目,支持文本到视频的生成。
视频
•
视频生成
•
深度学习
270
Brain2Qwerty
— 一种非侵入式脑机接口技术,通过脑电图或脑磁图解码大脑活动以实现文本输入。
生产力
•
脑机接口
•
文本解码
60
VisoMaster
— 强大的视频替换与编辑软件,利用AI技术实现自然效果。
视频
•
视频编辑
•
替换
342
MNN
— MNN 是阿里巴巴开源的轻量级高性能推理引擎,支持多种主流模型格式。
中文精选
•
深度学习
•
推理引擎
498
LLaSA_training
— LLaSA: 扩展基于 LLaMA 的语音合成的训练时间和测试时间计算量
编程
•
语音合成
•
深度学习
132
VideoJAM
— VideoJAM 是一种用于增强视频生成模型运动连贯性的框架。
视频
•
视频生成
•
运动连贯性
306
BEN2
— BEN2是一个基于深度学习的图像分割模型,专注于背景擦除和前景提取。
图像
•
图像分割
•
背景擦除
108
DeepResearch123
— AI研究资源导航网站,提供AI研究资源、文档和实践案例
教育
•
研究
•
资源
174
node-DeepResearch
— 持续搜索和阅读网页,直到找到答案(或超出token预算)。
编程
•
深度学习
•
信息检索
156
MatAnyone
— MatAnyone 是一个支持目标指定的稳定视频抠像框架,适用于复杂背景。
视频
•
视频抠像
•
图像处理
294
Open R1
— 这是一个完全开放的 DeepSeek-R1 模型的复现项目,旨在帮助开发者复现和构建基于 R1 的模型。
生产力
•
深度学习
•
自然语言处理
1008
Video Depth Anything
— Video Depth Anything: Consistent Depth Estimation for Super-Long Videos
视频
•
深度学习
•
视频处理
150
Janus-Pro-7B
— Janus-Pro-7B 是一个新型的自回归框架,统一多模态理解和生成。
图像
•
多模态
•
图像生成
1080
Janus-Pro-1B
— Janus-Pro-1B 是一个统一多模态理解和生成的自回归框架。
图像
•
多模态
•
图像生成
504
YuE-s1-7B-anneal-en-cot
— YuE是一个开源的音乐生成模型,能够将歌词转化为完整的歌曲。
音乐
•
音乐生成
•
深度学习
180
Tarsier
— Tarsier 是由字节跳动推出的用于生成高质量视频描述的大型视频语言模型。
视频
•
视频描述
•
视频理解
516
Flux-Midjourney-Mix2-LoRA
— 一款基于Midjourney风格的文本到图像生成模型,专注于高分辨率和写实风格的图像创作。
图像
•
文本到图像
•
深度学习
324
leapfusion-hunyuan-image2video
— 一种新颖的图像到视频采样技术,基于Hunyuan模型实现高质量视频生成。
视频
•
视频生成
•
深度学习
282
VideoLLaMA3
— VideoLLaMA3是前沿的多模态基础模型,专注于图像和视频理解。
视频
•
多模态
•
视频理解
108
Momodel.cn
— 在线学习Python、AI、大模型、AI写作绘画课程,零基础轻松入门。
中文精选
•
学习
•
编程
828
Flex.1-alpha
— 一个基于文本生成图像的预训练模型,具有80亿参数和Apache 2.0开源许可。
图像
•
文本生成图像
•
深度学习
396
Worlds of Frames
— Frames 是 Runway 推出的高级图像生成基础模型,提供前所未有的风格控制和视觉保真度。
国外精选
•
图像生成
•
创意工具
288