AI2 发布大语言模型开源数据集 Dolma 包含 3 万亿个 token

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
2025年4月3日消息:根据MathArena最新发布的大语言模型数学能力评测结果显示,Google的Gemini-2.5-pro以绝对优势领跑,在未污染的高难度数学竞赛中展现出令人瞩目的表现。突破性成绩Gemini-2.5-pro在MathArena平台的严格评测中取得了24.40%的准确率,这一成绩不仅位居榜首,更是与第二名DeepSeek-R1 的4.76%形成鲜明对比,领先优势达到惊人的五倍之多。这一突破性成绩表明Gemini-2.5-pro在高级数学推理能力上实现了质的飞跃。多项竞赛中的优异表现特别值得关注的是,Gemini-2.5-pro在"AIME 2025 I"竞赛测试中取
在现代科研领域,获取和发现相关文献对于研究人员来说至关重要。为,Ai2PaperFinder 应运而生,这是一款旨在帮助用户轻松找到所需学术论文的强大工具。该平台汇聚了超过800万篇全文论文和超过1.08亿篇摘要,覆盖广泛且深度。Ai2PaperFinder 的独特之处在于其强大的文献检索功能。用户可以通过输入关键词,快速找到相关的研究论文。无论是热门主题还是小众研究,用户都能轻松获取到所需的文献。此外,该平台还提供了文献合成的功能,用户只需提出问题,系统就能综合多个论文的内容,
近日,数据智能公司 Databricks 推出了一种全新的大语言模型微调方法 ——TAO(Test-time Adaptive Optimization),这一技术的出现为开源模型的发展带来了新的希望。通过运用无标注数据和强化学习,TAO 不仅在降低企业成本方面表现出色,更是在一系列基准测试中取得了令人瞩目的成绩。根据科技媒体 NeoWin 的报道,TAO 微调后的 Llama3.370B 模型在金融文档问答和 SQL 生成等任务中,展现出了优于传统标注微调方法的性能,甚至逼近了 OpenAI 的顶级闭源模型。这一成果标志着开源模型在与商用 AI 产品
宝马集团与阿里巴巴集团正式宣布在中国市场达成一项重要的战略合作,双方将共同聚焦于人工智能(AI)大语言模型以及智能语音交互等前沿技术领域,致力于开发更符合中国用户需求的前沿解决方案。
2025 年 3 月 25 日,谷歌正式推出了其最新一代大语言模型Gemini 2.5,这一消息迅速在科技界引发热议。作为谷歌AI技术的一次重大升级,Gemini 2. 5 被誉为公司迄今为止"最智能的模型",以其卓越的推理能力和多模态特性,标志着人工智能发展的又一里程碑。Gemini 2.5 Pro Experimental率先亮相根据谷歌官方博客的公告,Gemini 2. 5 的首发型号为Gemini 2.5 Pro Experimental,目前已通过Google AI Studio和Gemini应用程序向Gemini Advanced订阅用户开放试用。行业分析师指出,谷歌正式发布的Gemini 2. 5 在GPQA和AIME2025 测试中
深耕行业十四年,知浪潮将至,当相向而行。本文旨在结合企业思考,探讨AI新时代下的技术与应用趋势,对内秉初心以率众,对外纳灼见而求臻。技术分水岭:算力、算法和数据的能效博弈随着大模型的快速更迭,人类已经走上了通往人工超级智能(ASI)的快车道。大数据技术的成熟为AI提供了海量生产要素,GPU技术的发展为AI解放了生产力,算法革新为AI突破了算力与数据的瓶颈。随着DeepSeek、GPT o1、Grok等大语言模型在模型算法、训练参数和算力堆叠这几棵技能树上的不断精进,我们已经
据科创板日报报道,阿里云在全球范围内开展项大规模的 AI 人才校园招聘活动。这次招聘规模被认为是近年来最大的一次,主要面向全球顶尖高校,如清华大学、北京大学、浙江大学、麻省理工学院和斯坦福大学等,旨在寻找在人工智能领域具备潜力的人才。此次招聘涵盖了多个技术领域,包括大语言模型、多模态理解与生成、模型应用以及 AI 基础设施等。为了吸引优秀人才,阿里云特别设立了 “A Star 项目” 和 “AI Clouder 项目”,专门面向那些在学术研究或开源项目方面表现突出的毕
以AI图像生成技术闻名遐迩的Midjourney,正悄然展现其在人工智能领域的更广阔野心。这家拥有庞大用户群体的科技公司,在自研计算和AI硬件的消息之后,近期携手纽约大学(NYU)的机器学习专家,发布了一项关于训练文本生成大语言模型(LLMs)的最新研究成果。该研究聚焦于提升LLM在创意写作方面的能力,旨在使AI模型能够像Meta的Llama和Mistral等开源模型一样,写出更具创造性的文本。不止于图像:Midjourney发力创意文本生成对于一家以扩散模型AI图像生成技术著称的公司而言,Midjourney此次在文
在地质科学领域,地质图是理解地球表面及地下结构的关键工具。然而,解读这些复杂的图表需要专业知识和丰富的经验。为了提升这一领域的智能化水平,微软亚洲研究院近日推出了一个新基准集 GeoMap-Bench,专门用于评估多模态大语言模型(MLLMs)在地质图理解方面的表现。GeoMap-Bench 的推出标志着地质图解读的人工智能应用迈出了重要一步。微软研究人员与中国地质科学院及武汉大学的专家深入探讨,确定了地质图理解所需的五大关键能力:信息提取、定位、指代、推理和分析。这些能
美团首席执行官王兴详细阐述了公司对于人工智能(AI)领域的战略规划。王兴透露,美团在过去一年中,将确保GPU资源供应作为首要工作,并已投入巨额资金用于AI基础设施建设。他进一步表示,美团计划在2025年进一步加大对AI关键基础设施的投资,以强化其在这一领域的布局。