AI新闻资讯

AI资讯

不错过全球AI革新的每一个时刻

AI日报

每天三分钟关注AI行业趋势

AI时间线

AI行业大事记

AI变现指南

最新案例

AI变现案例分享

图片合集

AI图片制作变现案例分享

视频合集

AI视频制作变现案例分享

音频合集

AI音频制作变现案例分享

文案合集

AI内容写作变现案例分享

AI教程

最新教程

免费分享最新AI教程内容

AI产品榜

AI产品排行榜

展示AI网站的总访问量排名

AI产品流量增速榜

追踪AI网站访问量增长最快产品

AI产品流量下降榜

关注访问量下降明显的AI网站

AI产品周榜

展示AI网站的周访问量排名

热门国家排行榜

美国

美国用户最喜欢的AI网站

中国

中国用户最喜欢的AI网站

印度

印度用户最喜欢的AI网站

巴西

巴西用户最喜欢的AI网站

热门分类榜

图片生成

AI图片生成网站总访问量榜单

个人助理

AI个人助理网站总访问量榜单

角色生成网站

AI角色生成网站总访问量榜单

视频生成

AI视频生成网站总访问量榜单

热门开源数据榜单

AI项目榜单

热门AI项目总Start榜单

AI项目增速榜

热门AI项目增速榜

AI开发者排名

热门AI开发者排名

AI组织排名

热门AI组织排名榜单

热门开源分类

deepseek

热门deepseek开源项目

TTS

热门TTS开源项目

LLM

热门LLM开源项目

ChatGPT

热门ChatGPT开源项目

AI开源项目库

全景图

github热门AI开源项目总览

产品库工具导航

MASA

一种用于跨领域视频帧中对象匹配的通用模型。

优质新品图像计算机视觉目标跟踪

MASA是一个用于视频帧中对象匹配的先进模型，它能够处理复杂场景中的多目标跟踪（MOT）。MASA不依赖于特定领域的标注视频数据集，而是通过Segment Anything Model（SAM）丰富的对象分割，学习实例级别的对应关系。MASA设计了一个通用适配器，可以与基础的分割或检测模型配合使用，实现零样本跟踪能力，即使在复杂领域中也能表现出色。

MASA

MASA 最新流量情况

月总访问量

164

跳出率

45.24%

平均页面访问数

1.0

平均访问时长

00:00:00

MASA 访问量趋势

MASA 访问地理位置分布

MASA 流量来源

MASA 替代品

MASA — 一种用于跨领域视频帧中对象匹配的通用模型。

•计算机视觉•目标跟踪

video-analyzer — 视频分析工具，结合Llama视觉模型和OpenAI Whisper进行本地视频描述生成。

•视频分析•计算机视觉

NVIDIA AI Blueprint — 利用NVIDIA AI构建视频搜索和摘要代理

•计算机视觉•视频分析

Open Source Computer Vision Library — 开源计算机视觉库

•计算机视觉•机器学习

SAM — 智能视频对象分割技术

•视频分析•对象分割

Chooch AI Vision — AI Vision for instant visual analysis

•计算机视觉•图像识别

LHM — 高保真可动画 3D 人类重建模型，快速生成动画角色。

•3D 重建•人类模型

Thera — 一种无混叠的任意尺度超分辨率方法。

•超分辨率•图像处理

MIDI — 通过多实例扩散模型将单张图像生成高保真度的3D场景。

•3D建模•图像处理

SmolVLM2 — SmolVLM2 是一个专注于视频内容分析和生成的轻量化语言模型。

•视频分析•文本生成

GaussianCity — 一个高效的无边界3D城市生成框架，使用3D高斯绘制技术实现快速生成。

•3D生成•高斯绘制

MLGym — MLGym是一个用于推进AI研究代理的新框架和基准。

•AI研究•强化学习

Pippo — Pippo 是一个从单张照片生成高分辨率多人视角视频的生成模型。

•图像生成•多视角视频

VideoWorld — VideoWorld是一个探索从无标签视频中学习知识的深度生成模型。

•计算机视觉•知识学习

Video Depth Anything — Video Depth Anything: Consistent Depth Estimation for Super-Long Videos

•深度学习•视频处理

ViTPose — 基于Transformer实现的ViTPose模型集合

•计算机视觉•人体姿态估计

InternVL2_5-38B-MPO — InternVL2.5-MPO系列模型，基于InternVL2.5和混合偏好优化，展现卓越性能。

•多模态•大型语言模型

TryOffAnyone — 从穿着人身上生成平铺布料的模型

•深度学习•图像生成

Valley-Eagle-7B — 多模态大型模型，处理文本、图像和视频数据

•多模态•大型模型

Valley — 多模态大型模型，处理文本、图像和视频数据

•多模态•大型模型

FlagAI

FlagAI — 一站式大模型算法、模型及优化工具开源项目

•大模型•开源项目

MegaSaM — 从日常动态视频中快速、准确地估计相机和密集结构

•结构从运动•单目SLAM

NVIDIA Jetson Orin Nano Super Developer Kit

NVIDIA Jetson Orin Nano Super Developer Kit — NVIDIA推出的最经济的生成型AI超级计算机

•NVIDIA Jetson•生成型AI

Diffusion-Vas — 视频非可见物体分割与内容补全的先进研究

•视频分割•非可见物体

StableAnimator

StableAnimator — 高质量身份保留的人像动画合成工具。

•视频合成•人像动画

InternVL2_5-38B — 先进的多模态大型语言模型系列

•多模态•大型语言模型

CHOIS

CHOIS — 基于条件扩散模型的人类-物体交互合成技术

•计算机视觉•交互合成

PSHuman — 从单张图片重建逼真的3D人体模型

•3D重建•人体模型

text-to-pose — 基于文本生成姿态并进一步生成图像的模型

•文本到图像•姿态估计

Phantomy AI — 未来演示控制的手势识别技术

•手势识别•计算机视觉