AI新闻资讯

AI资讯

不错过全球AI革新的每一个时刻

AI日报

每天三分钟关注AI行业趋势

AI时间线

AI行业大事记

Al硬件

列出所有AI硬件产品。

AI变现指南

图片合集

AI图片制作变现案例分享

视频合集

AI视频制作变现案例分享

音频合集

AI音频制作变现案例分享

文案合集

AI内容写作变现案例分享

AI教程

AI产品榜

AI产品排行榜

展示AI网站的总访问量排名

AI产品流量增速榜

追踪AI网站访问量增长最快产品

AI产品流量下降榜

关注访问量下降明显的AI网站

AI产品周榜

展示AI网站的周访问量排名

AI开源项目库

全景图

github热门AI开源项目总览

产品库工具导航

AI2 发布大语言模型开源数据集 Dolma 包含 3 万亿个 token

站长之家

发布于AI新闻资讯 · 1 分钟阅读 · Aug 24, 2023

美国艾伦人工智能研究所最近发布了名为 Dolma 的开源数据集，包含了 3 万亿个 token。这个数据集将为 AI2 正在开发的开放语言模型 OLMo 提供基础，计划于 2024 年初发布。Dolma 的数据来自广泛的来源，包括网络内容、学术出版物、代码和书籍等。这个数据集是目前公开可用的同类数据集中最大的一个。

AI2 Dolma 大语言模型

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

智谱与生数科技达成战略合作专注大模型联合创新

4月27日，清华大学旗下的两家明星人工智能公司智谱（Z.ai）和生数科技(shengshu.com)宣布达成重大战略合作。此次合作旨在通过双方在大语言模型和多模态生成模型的技术积累与优势，共同推进国产大模型的技术创新与产业落地。

2025年4月27号 14:09

5.8k

通付盾CRM智能体“招财猫”，AI Agent助力企业销售智能化

传统CRM系统因数据分散、销售人员难以管理、客户隐私数据担忧、缺乏智能分析等痛点，很难满足企业高效管理客户关系与提升业务绩效的需求。大语言模型和Agent技术的蓬勃发展，让智能CRM时代真正到来，实现从线索获取到客户转化、项目管理及财务数据处理的全流程自动化，提升企业运营效率，创造增量价值。通付盾CRM智能体“招财猫”—————————————————AI Agent助力企业销售智能化通付盾推出CRM智能体（CRM Agent），代号“招财猫(CAT)”，助力企业从销售线索到客户成

2025年4月27号 13:51

12.3k

Step1X-Edit：开源图像编辑新标杆媲美GPT-4o等闭源模型

2025年4月27日，AIbase报道：由Stepfun AI团队推出的Step1X-Edit图像编辑模型于近日正式开源，引发业界广泛关注。这一通用图像编辑框架以其卓越性能和实用的开源特性，展现了媲美GPT-4o和Gemini 2 Flash等闭源模型的潜力。以下是对Step1X-Edit的全面解析，涵盖其技术亮点、应用场景及未来影响。创新技术架构Step1X-Edit采用多模态大语言模型（MLLM）与扩散变换器（DiT）的结合，通过处理用户提供的参考图像和编辑指令，生成高质量的目标图像。其核心创新在于将多模态语言模型的语义理解能力与扩散

2025年4月27号 8:53

720

豆包 1.5 · 深度思考模型上线边缘大模型网关可免费领百万Tokens

字节跳动旗下的火山引擎宣布，其最新发布的豆包1.5·深度思考模型已全面上线边缘大模型网关，并为用户提供高达500万tokens的免费使用额度，这一举措在AI领域引起了广泛关注。

2025年4月25号 14:06

3.5k

英伟达推多模态LLM Describe Anything：指定特定区域生成详细的描述

NVIDIA AI团队发布了一款革命性的多模态大语言模型——Describe Anything3B（DAM-3B），专为图像和视频的精细化、区域化描述而设计。这款模型凭借创新技术和卓越性能，在多模态学习领域掀起热议，成为AI技术发展的又一里程碑。以下，AIbase为您梳理这款模型的核心亮点与行业影响。区域化描述的突破DAM-3B以其独特的能力脱颖而出:能够根据用户指定的图像或视频区域（如点、框、涂鸦或掩码），生成高度详细的描述。这种区域化描述超越了传统图像标注的局限，结合全局图像/视频上下文与局

2025年4月24号 9:58

2.1k

字节跳动发布高效预训练长度缩放技术，突破长序列训练瓶颈

字节跳动宣布推出高效预训练长度缩放技术（Efficient Pretraining Length Scaling），通过创新的Parallel Hidden Decoding Transformer(PHD-Transformer)框架，显著提升大语言模型(LLM)在长序列预训练中的效率与性能。据AIbase了解，该技术在保持推理效率的同时，支持高达2048K(2M)的上下文长度训练，解决了传统框架在数据异构性与计算平衡上的瓶颈。相关研究已在arXiv公开，引发了AI研究社区的广泛关注。核心创新:PHD-Transformer优化长序列训练字节跳动的PHD-Transformer通过独特的键值缓存（KV Cache）管理策略与架构优

2025年4月23号 14:17

11.1k

富士通联手Nutanix推出日语大模型Takane，瞄准企业私有AI市场

2025年4月23号 11:47

4.7k

Gartner报告：2027年，任务特定AI使用频率将是通用AI的三倍

根据最新发布的 Gartner 报告，到2027年，企业将使用任务特定的人工智能模型的频率将是通用大语言模型的三倍。报告指出，尽管通用大语言模型在语言处理方面具备强大的能力，但在需要深入理解特定业务领域的任务时，它们的响应准确性会下降。因此，越来越多的企业开始关注能够满足特定需求的定制化模型。图源备注:图片由AI生成，图片授权服务商MidjourneyGartner 副总裁兼分析师 Sumit Agarwal 表示，这一转变主要是由于商业工作流程日益复杂，以及对准确性需求的提升。他强调:“这些小

2025年4月23号 9:38

1.5k

RAG增强系统Node：AI检索革命，效率飙升30%！

随着生成式人工智能技术的飞速发展，检索增强生成（Retrieval-Augmented Generation， RAG）系统正成为提升大语言模型(LLM)准确性和上下文相关性的关键技术。近日，一款名为NodeRAG的创新RAG增强系统引起了业界广泛关注，其独特的异构图结构为RAG工作流带来了革命性突破。NodeRAG:异构图驱动的RAG新范式NodeRAG是一个以图结构为核心的RAG框架，通过引入异构图（Heterogeneous Graph）技术，将文档分解信息与大语言模型提取的洞察力统一为图中的节点。这种设计突破了传统RAG系统中信息分层的限制，实现

2025年4月22号 13:52

13.9k

Anthropic 发布 Claude Code 最佳实践指南，助力开发者无缝集成 AI 编程工作流

Anthropic 近日发布了一份详尽的 Claude Code 最佳实践指南，为开发者提供了一个以命令行界面（CLI）为核心的低层次工具，旨在将 Claude 大语言模型无缝融入日常编程任务中。这一指南基于 Anthropic 内部的实践经验，强调灵活、安全且高效的编码模式，为希望将 AI 融入现有开发环境的工程师提供了重要参考。Claude Code:极简主义与代理开发的融合Claude Code 是一个原生集成于命令行环境的开发助手，设计上避免了强制性的工作流框架，而是通过提供上下文丰富的交互工具，让开发者能够根据需求自

2025年4月22号 9:34

6.6k

AI资讯

AI日报

AI时间线

Al硬件

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图