Best AI Websites & Tools
zh
AI产品榜
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
AI产品榜
DL3DV-10K
大规模实景数据集,用于深度学习三维视觉研究
普通产品
其他
数据集
三维视觉
打开网站
DL3DV-10K是一个包含超过10000个高质量视频的大规模实景数据集,每个视频都经过人工标注场景关键点和复杂程度,并提供相机姿态、NeRF估计深度、点云和3D网格等。该数据集可用于通用NeRF研究、场景一致性跟踪、视觉语言模型等计算机视觉研究。
网站截图
产品特色
需求人群
使用示例
使用教程
社交网络
打开网站
提供超过1万个高质量视频
人工标注场景关键点和环境复杂度
配套相机姿态、NeRF深度等数据
支持NeRF、视觉语言模型等前沿算法研究
通用NeRF模型研究
场景级一致性跟踪
视觉语言模型研究
三维重建
虚拟现实
使用DL3DV-10K数据集优化NeRF模型表现
基于DL3DV-10K训练视觉语言模型
使用DL3DV-10K中的视角和场景信息进行SLAM系统开发
打开网站
DL3DV-10K 替代品
ZeroNVS
— 360度全场景生成
图像
•
360 度全景
•
零样本合成
1044
CAT4D
— 4D场景创建工具,使用多视图视频扩散模型
图像
•
4D场景
•
多视图视频
174
TANGO Model
— 共语手势视频重现技术
视频
•
手势识别
•
动作生成
450
Instancy
— 一体化学习管理系统
生产力
•
学习管理系统
•
电子学习
132
In3D
— 用手机相机快速生成逼真的全身3D头像
生产力
•
头像
•
虚拟现实
258
Scale
— 加速AI应用开发
生产力
•
训练数据
•
自动驾驶汽车
102
Phantom
— Phantom 是一款基于跨模态对齐的主体一致性视频生成模型。
视频
•
视频生成
•
内容创作
132
Pippo
— Pippo 是一个从单张照片生成高分辨率多人视角视频的生成模型。
图像
•
图像生成
•
多视角视频
414
Dolphin R1
— Dolphin R1是一个用于训练推理模型的数据集,包含80万条样本。
编程
•
自然语言处理
•
推理模型
102
SyncAnimation
— SyncAnimation 是一种基于 NeRF 的音频驱动实时生成说话头像和上半身动作的技术框架。
视频
•
NeRF
•
音频驱动
90
GameFactory
— GameFactory 是一个基于预训练视频扩散模型的通用世界模型,可创建开放领域的游戏。
视频
•
视频生成
•
游戏开发
168
Nemotron-CC
— 将Common Crawl转化为精细的长期预训练数据集
编程
•
数据集
•
预训练
48
llm-datasets
— 高质量的数据集、工具和概念,用于大型语言模型的微调。
编程
•
LLM
•
数据集
96
AGIBOT WORLD
— 大规模机器人学习数据集,推动多用途机器人策略发展。
其他
•
机器人学习
•
数据集
30
SCENIC model
— 场景感知的语义导航与指令引导控制模型
编程
•
自然语言处理
•
3D场景
24
GenEx
— 从单张图片生成可探索的360°3D世界
图像
•
3D世界
•
图像生成
426
RapBank
— 首个说唱音乐生成数据集
音乐
•
说唱音乐
•
数据集
36
RLVR-GSM-MATH-IF-Mixed-Constraints
— 用于强化学习验证的数学问题数据集
其他
•
数学
•
教育
84
MAmmoTH-VL
— 大规模多模态推理与指令调优平台
其他
•
多模态
•
推理
66
SOLAMI
— 3D自主角色的沉浸式交互框架
其他
•
3D角色
•
社交智能
90
FineWeb2
— 多语言预训练数据集
编程
•
多语言
•
预训练
54
OLMo 2 1124 13B Preference Mixture
— 大规模多语言偏好混合数据集
其他
•
数据集
•
多语言
24
ScholarQABench
— 科学文献综合评估平台
其他
•
科学文献
•
评估平台
36
dolmino-mix-1124
— 高质量数据集,用于OLMo2训练的第二阶段。
编程
•
数据集
•
自然语言处理
42
Tülu 3
— 开源的先进语言模型后训练框架
国外精选
•
语言模型
•
后训练
264
The Matrix
— 开创性的实时、帧级控制的逼真世界模拟技术
视频
•
虚拟现实
•
数字宇宙
102
WorkflowLLM
— 数据驱动的框架,增强大型语言模型的工作流编排能力
编程
•
大型语言模型
•
工作流编排
108
GenXD
— 生成任何3D和4D场景的先进框架
图像
•
3D生成
•
4D生成
144
Sparsh
— 自监督触觉表示,用于基于视觉的触觉传感。
图像
•
自监督学习
•
触觉传感
36