AI新闻资讯

AI资讯

不错过全球AI革新的每一个时刻

AI日报

每天三分钟关注AI行业趋势

AI时间线

AI行业大事记

AI变现指南

最新案例

AI变现案例分享

图片合集

AI图片制作变现案例分享

视频合集

AI视频制作变现案例分享

音频合集

AI音频制作变现案例分享

文案合集

AI内容写作变现案例分享

AI教程

最新教程

免费分享最新AI教程内容

AI产品榜

AI产品排行榜

展示AI网站的总访问量排名

AI产品流量增速榜

追踪AI网站访问量增长最快产品

AI产品流量下降榜

关注访问量下降明显的AI网站

AI产品周榜

展示AI网站的周访问量排名

热门国家排行榜

美国

美国用户最喜欢的AI网站

中国

中国用户最喜欢的AI网站

印度

印度用户最喜欢的AI网站

巴西

巴西用户最喜欢的AI网站

热门分类榜

图片生成

AI图片生成网站总访问量榜单

个人助理

AI个人助理网站总访问量榜单

角色生成网站

AI角色生成网站总访问量榜单

视频生成

AI视频生成网站总访问量榜单

热门开源数据榜单

AI项目榜单

热门AI项目总Start榜单

AI项目增速榜

热门AI项目增速榜

AI开发者排名

热门AI开发者排名

AI组织排名

热门AI组织排名榜单

热门开源分类

deepseek

热门deepseek开源项目

TTS

热门TTS开源项目

LLM

热门LLM开源项目

ChatGPT

热门ChatGPT开源项目

AI开源项目库

全景图

github热门AI开源项目总览

产品库工具导航

Star-Attention

高效长序列大型语言模型推理技术

普通产品编程NVIDIA大型语言模型

Star-Attention是NVIDIA提出的一种新型块稀疏注意力机制，旨在提高基于Transformer的大型语言模型（LLM）在长序列上的推理效率。该技术通过两个阶段的操作显著提高了推理速度，同时保持了95-100%的准确率。它与大多数基于Transformer的LLM兼容，无需额外训练或微调即可直接使用，并且可以与其他优化方法如Flash Attention和KV缓存压缩技术结合使用，进一步提升性能。

Star-Attention 最新流量情况

月总访问量

474564576

跳出率

36.20%

平均页面访问数

6.1

平均访问时长

00:06:34

Star-Attention 访问量趋势

Star-Attention 访问地理位置分布

Star-Attention 流量来源

Star-Attention 替代品

Star-Attention — 高效长序列大型语言模型推理技术

•NVIDIA•大型语言模型

Llama-3.3-70B-Instruct

Llama-3.3-70B-Instruct — 70亿参数的多语言大型语言模型

•大型语言模型•多语言

Llama-3.1-Nemotron-70B-Instruct

Llama-3.1-Nemotron-70B-Instruct — 由NVIDIA定制的大型语言模型，提升查询回答的帮助性。

•NVIDIA•大型语言模型

MindSearch

MindSearch — 开源AI搜索引擎框架，性能媲美Perplexity.ai Pro。

•搜索•transformer

Nemotron-4-340B-Base

Nemotron-4-340B-Base — 大型语言模型，支持多语言和编程语言文本生成。

•大型语言模型•多语言支持

SpaceByte

SpaceByte — SpaceByte是一种新的字节级解码架构,避免了Tokenization的缺陷。

•字节级模型•大型语言模型

QwQ-32B

QwQ-32B — QwQ-32B 是一款强大的推理模型，专为复杂问题解决和文本生成设计，性能卓越。

•推理•文本生成

ART

ART — 一种用于可变多层透明图像生成的匿名区域变换器技术。

•图像生成•多层透明图像

SWE-RL

SWE-RL — 通过强化学习提升大型语言模型在开源软件演变中的推理能力

•强化学习•大型语言模型

Coding-Tutor

Coding-Tutor — 探索大型语言模型作为编程辅导工具的潜力，提出Trace-and-Verify工作流。

•编程教育•大型语言模型

MoBA

MoBA — MoBA 是一种用于长文本上下文的混合块注意力机制，旨在提升大语言模型的效率。

•大语言模型•注意力机制

Goedel-Prover

Goedel-Prover — Goedel-Prover 是一款开源的自动化定理证明模型，专注于数学问题的形式化证明。

•自动化定理证明•数学

OmniParser-v2.0

OmniParser-v2.0 — OmniParser 是一款通用屏幕解析工具，可将 UI 截图转换为结构化格式，提升基于 LLM 的 UI 代理性能。

•屏幕解析•图像识别

Mistral-Small-24B-Instruct-2501

Mistral-Small-24B-Instruct-2501 — Mistral Small 24B 是一款多语言、高性能的指令微调型大型语言模型，适用于多种应用场景。

•大型语言模型•多语言

Janus-Pro-1B

Janus-Pro-1B — Janus-Pro-1B 是一个统一多模态理解和生成的自回归框架。

•多模态•图像生成

DeepSeek-R1-Distill-Llama-70B

DeepSeek-R1-Distill-Llama-70B — DeepSeek-R1-Distill-Llama-70B 是一款基于强化学习优化的大型语言模型，专注于推理和对话能力。

•大型语言模型•强化学习

InternVL2_5-78B-MPO

InternVL2_5-78B-MPO — 这是一个先进的多模态大型语言模型系列，展示了卓越的整体性能。

•多模态•大型语言模型

self-adaptive-llms

self-adaptive-llms — 一个实时适应未见任务的自适应大型语言模型框架。

•大型语言模型•自适应

InternLM3-8B-Instruct

InternLM3-8B-Instruct — InternLM3-8B-Instruct是一个开源的80亿参数指令模型，用于通用用途和高级推理。

•大型语言模型•开源

MinMo

MinMo — MinMo是一款多模态大型语言模型，用于无缝语音交互。

•语音交互•多模态

Dria-Agent-a-3B

Dria-Agent-a-3B — 基于Qwen2.5-Coder系列的大型语言模型，专注于代理应用。

•大型语言模型•代理应用

Dria-Agent-a-7B

Dria-Agent-a-7B — 一个基于Qwen2.5-Coder系列训练的大型语言模型，专注于代理应用。

•大型语言模型•编程辅助

Dria-Agent-α

Dria-Agent-α — Dria-Agent-α是基于Python的大型语言模型工具交互框架。

•大型语言模型•Python

ViTPose

ViTPose — 基于Transformer实现的ViTPose模型集合

•计算机视觉•人体姿态估计

Llama-3-Patronus-Lynx-8B-Instruct-Q4_K_M-GGUF

Llama-3-Patronus-Lynx-8B-Instruct-Q4_K_M-GGUF — 基于特定模型的量化大型语言模型，适用于自然语言处理等任务。

•大型语言模型•量化模型

InternVL2_5-38B-MPO

InternVL2_5-38B-MPO — InternVL2.5-MPO系列模型，基于InternVL2.5和混合偏好优化，展现卓越性能。

•多模态•大型语言模型

Agent Laboratory

Agent Laboratory — Agent Laboratory是一个端到端的自主研究工作流，旨在协助人类研究人员实施研究想法。

•研究辅助•文献综述

InternVL2_5-26B-MPO-AWQ

InternVL2_5-26B-MPO-AWQ — 先进的多模态大型语言模型，具备卓越的多模态推理能力。

•多模态•大型语言模型

AnyParser Pro

AnyParser Pro — AnyParser Pro 是一款能够快速准确地从 PDF、PPT 和图像中提取内容的大型语言模型。

•文档解析•大型语言模型

NVIDIA Project DIGITS

NVIDIA Project DIGITS — NVIDIA Project DIGITS 是一款桌面超级计算机，专为 AI 开发者设计，提供强大的 AI 性能。

•超级计算机•NVIDIA