AI新闻资讯

AI资讯

不错过全球AI革新的每一个时刻

AI日报

每天三分钟关注AI行业趋势

AI时间线

AI行业大事记

AI变现指南

最新案例

AI变现案例分享

图片合集

AI图片制作变现案例分享

视频合集

AI视频制作变现案例分享

音频合集

AI音频制作变现案例分享

文案合集

AI内容写作变现案例分享

AI教程

最新教程

免费分享最新AI教程内容

AI产品榜

AI产品排行榜

展示AI网站的总访问量排名

AI产品流量增速榜

追踪AI网站访问量增长最快产品

AI产品流量下降榜

关注访问量下降明显的AI网站

AI产品周榜

展示AI网站的周访问量排名

热门国家排行榜

美国

美国用户最喜欢的AI网站

中国

中国用户最喜欢的AI网站

印度

印度用户最喜欢的AI网站

巴西

巴西用户最喜欢的AI网站

热门分类榜

图片生成

AI图片生成网站总访问量榜单

个人助理

AI个人助理网站总访问量榜单

角色生成网站

AI角色生成网站总访问量榜单

视频生成

AI视频生成网站总访问量榜单

热门开源数据榜单

AI项目榜单

热门AI项目总Start榜单

AI项目增速榜

热门AI项目增速榜

AI开发者排名

热门AI开发者排名

AI组织排名

热门AI组织排名榜单

热门开源分类

deepseek

热门deepseek开源项目

TTS

热门TTS开源项目

LLM

热门LLM开源项目

ChatGPT

热门ChatGPT开源项目

AI开源项目库

全景图

github热门AI开源项目总览

产品库工具导航

OLMo 2

最先进的全开放语言模型

普通产品编程语言模型自然语言处理

OLMo 2是由Ai2推出的最新全开放语言模型，包括7B和13B两种规模的模型，训练数据高达5T tokens。这些模型在性能上与同等规模的全开放模型相当或更优，并且在英语学术基准测试中与开放权重模型如Llama 3.1竞争。OLMo 2的开发注重模型训练的稳定性、阶段性训练干预、最先进的后训练方法和可操作的评估框架。这些技术的应用使得OLMo 2在多个任务上表现出色，特别是在知识回忆、常识、一般和数学推理方面。

OLMo 2

OLMo 2 最新流量情况

月总访问量

496293

跳出率

55.33%

平均页面访问数

2.0

平均访问时长

00:01:13

OLMo 2 访问量趋势

OLMo 2 访问地理位置分布

OLMo 2 流量来源

OLMo 2 替代品

OLMo-2-1124-13B-DPO — 高性能英文语言模型，适用于多样化任务

•语言模型•自然语言处理

OpenScholar — 科学文献合成的检索增强型语言模型

•科学文献•检索增强

OLMo 2

OLMo 2 — 最先进的全开放语言模型

•语言模型•自然语言处理

Zamba2-7B — 高效能小型语言模型

•语言模型•自然语言处理

Entropy-based sampling — 基于熵的采样技术，优化模型输出的多样性和准确性

•机器学习•自然语言处理

rStar — 通过自博弈相互推理，提升小型语言模型的解决问题能力。

•机器学习•自然语言处理

multi-token prediction — 多令牌预测模型，提升语言模型的效率与性能

•语言模型•多令牌预测

Samba — 高效无限上下文语言模型的官方实现

•自然语言处理•机器学习

MAP-NEO — 一个完全开源的大型语言模型，提供先进的自然语言处理能力。

•自然语言处理•开源

LLaVA++ — 扩展LLaVA模型，集成Phi-3和LLaMA-3，提升视觉与语言模型的交互能力。

•自然语言处理•机器学习

OpenELM — OpenELM是一套高效的语言模型家族，具备开源训练和推理框架。

•语言模型•自然语言处理

DeepSeek-V3-0324 — 一个强大的文本生成模型，适用于多种对话应用。

•文本生成•对话系统

Instella — Instella 是由 AMD 开发的高性能开源语言模型，专为加速开源语言模型的发展而设计。

•开源•语言模型

olmOCR — olmOCR是一个用于将PDF线性化以用于LLM数据集训练的工具包。

•PDF处理•LLM训练

Moonlight-16B-A3B — Moonlight-16B-A3B 是一个基于 Muon 优化器训练的 16B 参数的混合专家模型，用于高效的语言生成。

•语言模型•优化器

Xwen-Chat — Xwen-Chat是专注中文对话的大语言模型集合，提供多版本模型及语言生成服务

•语言模型•中文对话

finbar — 提供全球基础金融数据，快速整合到模型中，助力现代金融分析师高效工作。

•金融数据•自动化

MiniMax-01 — 强大的语言模型，拥有4560亿总参数，可处理长达400万token的上下文。

•语言模型•深度学习

Imitate Before Detect — 一种用于检测机器修订文本的先进方法，通过模仿机器风格来提高检测准确性。

•文本检测•机器学习

CAG — 一种无需实时检索的语言模型增强方法，通过预加载知识缓存来提高生成效率。

•自然语言处理•语言模型

Sonus-1 — Sonus-1：开启大型语言模型（LLMs）的新时代

•大型语言模型•自然语言处理

Text-to-CAD UI — 从自然语言提示创建B-Rep CAD文件和网格

•CAD•3D建模

InternVL2_5-8B-MPO — 多模态大型语言模型，展示卓越的整体性能。

•多模态•大型语言模型

Llama-3.1-70B-Instruct-AWQ-INT4 — 70B参数的文本生成模型

•文本生成•自然语言处理

ModernBERT

ModernBERT — ModernBERT是新一代的编码器模型，性能卓越。

•BERT•Transformer

YuLan-Mini — 一款高效率的2.4亿参数轻量级语言模型

•语言模型•自然语言处理

Smolagents — 轻量级库，用于构建高效能的智能代理

•智能代理•机器学习

Llama-lynx-70b-4bitAWQ — 70亿参数的文本生成模型

•文本生成•自然语言处理

Gemini 2.0 Flash Experimental — Google DeepMind开发的高性能AI模型

•机器学习•自然语言处理

Q-RWKV-6 32B Instruct Preview — 最强大的RWKV模型变体，打破多项英语基准测试。

•机器学习•自然语言处理