AI新闻资讯

AI资讯

不错过全球AI革新的每一个时刻

AI日报

每天三分钟关注AI行业趋势

AI时间线

AI行业大事记

AI变现指南

最新案例

AI变现案例分享

图片合集

AI图片制作变现案例分享

视频合集

AI视频制作变现案例分享

音频合集

AI音频制作变现案例分享

文案合集

AI内容写作变现案例分享

AI教程

最新教程

免费分享最新AI教程内容

AI产品榜

AI产品排行榜

展示AI网站的总访问量排名

AI产品流量增速榜

追踪AI网站访问量增长最快产品

AI产品流量下降榜

关注访问量下降明显的AI网站

AI产品周榜

展示AI网站的周访问量排名

热门国家排行榜

美国

美国用户最喜欢的AI网站

中国

中国用户最喜欢的AI网站

印度

印度用户最喜欢的AI网站

巴西

巴西用户最喜欢的AI网站

热门分类榜

图片生成

AI图片生成网站总访问量榜单

个人助理

AI个人助理网站总访问量榜单

角色生成网站

AI角色生成网站总访问量榜单

视频生成

AI视频生成网站总访问量榜单

热门开源数据榜单

AI项目榜单

热门AI项目总Start榜单

AI项目增速榜

热门AI项目增速榜

AI开发者排名

热门AI开发者排名

AI组织排名

热门AI组织排名榜单

热门开源分类

deepseek

热门deepseek开源项目

TTS

热门TTS开源项目

LLM

热门LLM开源项目

ChatGPT

热门ChatGPT开源项目

AI开源项目库

全景图

github热门AI开源项目总览

产品库工具导航

llava-llama-3-8b-v1_1

一款由XTuner优化的LLaVA模型，结合了图像和文本处理能力。

优质新品编程多模态学习深度学习

llava-llama-3-8b-v1_1是一个由XTuner优化的LLaVA模型，它基于meta-llama/Meta-Llama-3-8B-Instruct和CLIP-ViT-Large-patch14-336，并通过ShareGPT4V-PT和InternVL-SFT进行了微调。该模型专为图像和文本的结合处理而设计，具有强大的多模态学习能力，适用于各种下游部署和评估工具包。

llava-llama-3-8b-v1_1

llava-llama-3-8b-v1_1 最新流量情况

月总访问量

29742941

跳出率

44.20%

平均页面访问数

5.9

平均访问时长

00:04:44

llava-llama-3-8b-v1_1 访问量趋势

llava-llama-3-8b-v1_1 访问地理位置分布

llava-llama-3-8b-v1_1 流量来源

llava-llama-3-8b-v1_1 替代品

Bunny — 轻量级但功能强大的多模态模型家族。

•多模态学习•机器学习

llava-llama-3-8b-v1_1 — 一款由XTuner优化的LLaVA模型，结合了图像和文本处理能力。

•多模态学习•深度学习

Video-T1 — 通过测试时间缩放显著提升视频生成质量。

•视频生成•测试时间缩放

混元T1

混元T1 — 业界首个超大规模混合 Mamba 推理模型，强推理能力。

•推理模型•深度学习

IMM — Inductive Moment Matching 是一种新型的生成模型，用于高质量图像生成。

•生成模型•图像生成

HunyuanVideo-I2V — HunyuanVideo-I2V 是腾讯推出的基于 HunyuanVideo 的图像到视频生成框架。

•视频生成•深度学习

UniTok — UniTok是一个用于视觉生成和理解的统一视觉分词器。

•视觉生成•视觉理解

QwQ-Max-Preview — QwQ-Max-Preview 是 Qwen 系列的最新成果，基于 Qwen2.5-Max 构建，具备强大的推理和多领域应用能力。

•深度学习•推理

Claude 3.7 Sonnet — Claude 3.7 Sonnet 是 Anthropic 推出的最新智能模型，支持快速响应和深度推理。

•深度学习•编程

Huginn-0125 — Huginn-0125是一个35亿参数的潜变量循环深度模型，擅长推理和代码生成。

•深度学习•推理

Lumina-Video — Lumina-Video 是一个用于视频生成的初步尝试项目，支持文本到视频的生成。

•视频生成•深度学习

VideoJAM — VideoJAM 是一种用于增强视频生成模型运动连贯性的框架。

•视频生成•运动连贯性

MatAnyone — MatAnyone 是一个支持目标指定的稳定视频抠像框架，适用于复杂背景。

•视频抠像•图像处理

Janus-Pro-7B — Janus-Pro-7B 是一个新型的自回归框架，统一多模态理解和生成。

•多模态•图像生成

Tarsier — Tarsier 是由字节跳动推出的用于生成高质量视频描述的大型视频语言模型。

•视频描述•视频理解

leapfusion-hunyuan-image2video — 一种新颖的图像到视频采样技术，基于Hunyuan模型实现高质量视频生成。

•视频生成•深度学习

OmniThink

OmniThink — OmniThink 是一种通过模拟人类思考过程来提升机器写作知识密度的框架。

•机器写作•知识密度

Seaweed-APT — Seaweed-APT是一种支持实时单步生成1280x720 24fps视频的模型。

•视频生成•深度学习

MangaNinja — MangaNinja 是一种基于参考的线稿上色方法，可实现精确匹配和细粒度交互控制。

•图像处理•线稿上色

MiniMax-01 — 强大的语言模型，拥有4560亿总参数，可处理长达400万token的上下文。

•语言模型•深度学习

rStar-Math

rStar-Math — 展示小型语言模型通过自我演化深度思考掌握数学推理能力的研究成果。

•语言模型•数学推理

SVFR — SVFR是一个用于视频人脸修复的统一框架。

•视频人脸修复•图像处理

Infini-Megrez — 端侧全模态理解模型，软硬协同释放无穹端侧智能

•深度学习•多模态

CausVid

CausVid — 快速因果视频生成器，实现即时视频生成。

•视频生成•机器学习

MMAudio — MMAudio根据视频和/或文本输入生成同步音频。

•音频合成•视频处理

Florence-VL — 视觉语言模型增强工具，结合生成式视觉编码器和深度广度融合技术。

•视觉语言模型•多模态学习

Genie 2

Genie 2 — 大规模基础世界模型，生成多样的3D可操作环境

•深度学习•3D模拟

LLaVA-o1 — 视觉语言模型，能够进行逐步推理

•视觉语言模型•逐步推理

LLaMA-Mesh

LLaMA-Mesh — 3D网格生成与语言模型的统一

•3D建模•自然语言处理

NVIDIA Video Search and Summarization

NVIDIA Video Search and Summarization — 构建视频搜索和摘要代理，提取视频洞察

•视频分析•深度学习