Best AI Websites & Tools
zh
AI产品榜
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
AI产品榜
LiveFood
LiveFood是一个美食视频高光检测数据集和全局原型编码模型
普通产品
视频
视频
数据集
打开网站
LiveFood是一个包含超过5100个美食视频的数据集,视频包括食材、烹饪、呈现和食用四个领域,所有视频均由专业工人精细注释,并采用严格的双重检查机制进一步保证注释质量。我们还提出了全局原型编码(GPE)模型来处理这个增量学习问题,与传统技术相比获得了竞争性的性能。
网站截图
产品特色
需求人群
使用示例
使用教程
打开网站
包含超过5100个精细注释的美食视频
涵盖食材、烹饪、呈现和食用四个领域
高质量的视频注释
全局原型编码(GPE)模型
视频高光检测
增量学习
使用LiveFood数据集训练视频高光检测模型
基于LiveFood的四个领域数据进行域增量学习实验
利用LiveFood的丰富注释数据进行视频理解研究
打开网站
LiveFood 替代品
GenXD
— 生成任何3D和4D场景的先进框架
图像
•
3D生成
•
4D生成
42
SA-V Dataset
— 用于训练通用目标分割模型的视频数据集
图像
•
计算机视觉
•
目标分割
402
Aria Everyday Activities
— Aria每日活动数据集,加速机器感知和人工智能发展
其他
•
数据集
•
视频
246
ANIM-400K
— 大规模视频自动配音数据集
视频
•
视频
•
数据集
666
CelebV-Text
— 大规模人脸文本-视频数据集
视频
•
人脸
•
文本
828
DINO-X
— 面向开放世界的检测与理解统一视觉模型
中文精选
•
计算机视觉
•
目标检测
96
Data Annotation Platform
— 数据标注平台,助力AI项目高效管理数据标注项目。
生产力
•
数据标注
•
计算机视觉
54
AutoSeg-SAM2
— 基于Segment-Anything-2和Segment-Anything-1的自动全视频分割工具
图像
•
视频分割
•
对象追踪
54
TurboLens
— 一站式OCR代理,快速从图像中生成洞见。
生产力
•
OCR
•
计算机视觉
54
WorkflowLLM
— 数据驱动的框架,增强大型语言模型的工作流编排能力
编程
•
大型语言模型
•
工作流编排
48
LLaMA-Mesh
— 3D网格生成与语言模型的统一
生产力
•
3D建模
•
自然语言处理
48
CountAnything
— 使用先进计算机视觉算法进行自动、准确计数的应用。
图像
•
计算机视觉
•
物体计数
66
NVIDIA AI Blueprint
— 利用NVIDIA AI构建视频搜索和摘要代理
视频
•
计算机视觉
•
视频分析
54
Tencent-Hunyuan-Large
— 业界领先的开源大型混合专家模型
生产力
•
自然语言处理
•
计算机视觉
240
Sparsh
— 自监督触觉表示,用于基于视觉的触觉传感。
图像
•
自监督学习
•
触觉传感
24
JustLearn app
— 教育滚动应用,用学习取代浪费时间
教育
•
教育
•
学习
114
Transmonkey
— AI驱动的多语言翻译平台,支持文档、图片和视频翻译。
生产力
•
翻译
•
文档
300
Flex3D
— 从单张图片或文本提示生成高质量3D资产
图像
•
3D重建
•
计算机视觉
282
interview.co
— 视频面试软件,简化招聘流程
商业
•
招聘
•
面试
138
Outspeed
— 实时语音和视频AI平台
其他
•
实时
•
语音
336
360AI导航
— 精选优质AI内容,遇见未来
其他
•
搜索
•
设计
258
StableDelight
— 去除镜面反射,揭示隐藏纹理
图像
•
图像处理
•
计算机视觉
66
Colorful Diffuse Intrinsic Image Decomposition
— 一种在野外环境中分解图像为反射率和照明效果的技术。
图像
•
图像处理
•
计算机视觉
114
diffusion-e2e-ft
— 图像条件扩散模型的微调工具
编程
•
图像处理
•
深度学习
102
opencv_contrib
— OpenCV的额外模块库,用于开发和测试新的图像处理功能。
图像
•
计算机视觉
•
图像处理
60
Open Source Computer Vision Library
— 开源计算机视觉库
生产力
•
计算机视觉
•
机器学习
84
GVHMR
— 基于重力视角坐标恢复世界定位的人体运动
图像
•
人体运动恢复
•
计算机视觉
126
1X World Model
— 为机器人提供虚拟模拟和评估的先进世界模型。
生产力
•
机器学习
•
虚拟模拟
48
Shangchen Zhou
— 专注于计算机视觉和机器学习领域的研究与创新的博客网站
开源
•
计算机视觉
•
机器学习
78