明略科技开源 TensorBoard.cpp 提升模型训练监测效率

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
维基百科近日宣布,将通过与谷歌旗下的数据科学社区平台 Kaggle 的合作,发布一份专门优化用于人工智能模型训练的数据集。这一举措旨在减少 AI 开发者通过爬虫程序抓取维基百科数据的行为,保护平台的带宽和服务器资源。该数据集的内容包括英语和法语的结构化维基百科信息,具有良好的机器可读性,便于 AI 开发者进行建模、微调和数据分析。维基媒体基金会表示,这份数据集以开放许可的方式发布,内容涵盖了研究摘要、简短描述、图像链接、信息框数据以及文章的各个部分,但
Meta Platforms, Inc.宣布计划利用其在欧盟地区应用程序(包括Facebook和Instagram)的用户数据来训练人工智能模型。该公司明确指出,训练数据将包括用户的公开帖子、评论以及与Meta AI的聊天记录,但不涉及“与亲朋好友的私人消息”,且训练仅面向18岁以上的用户。Meta表示,本周将通过应用内通知和电子邮件向其欧盟用户告知这一计划,并提供一个异议表单链接,供希望退出的用户选择。用户或可在Meta的隐私政策中找到相关链接。值得注意的是,截至发稿时,该政策显示,根据监管机构的
在人工智能技术日益普及的今天,DeepSeek与清华大学的合作引起了业界的广泛关注。作为一家中国初创公司,深思科技以其在低成本推理模型方面的突破而闻名,而这一次,他们希望通过与清华大学的学术合作,进一步降低 AI 模型的训练成本,从而提升运营效率。DeepSeek近期推出了一种新的低成本推理模型,引发了市场的热烈反响。为了进一步优化这一模型,深思科技的研究团队与清华大学的学者们共同探讨了一个全新的强化学习方法。这种方法旨在使 AI 模型在进行学习时更加高效,能够
近期,谷歌、卡内基梅隆大学与 MultiOn 的研究团队联合发布了一项关于合成数据在大模型训练中应用的新研究。根据 AI 发展科研机构 Epoch AI 的报告,目前人类公开的高质量文本训练数据大约有300万亿 tokens,但随着大型模型如 ChatGPT 的快速发展,对训练数据的需求正以指数级增长,预计在2026年前这些数据将被消耗殆尽,因此合成数据逐渐成为重要的替代方案。研究人员探索了合成数据的两种主要类型:正面数据和负面数据。正面数据是指来自高性能大模型(如 GPT-4和 Gemini1.5Pro)生成的正确
近日,苹果公司在其官方网站上更新了一项声明,披露了其如何收集和 “Look Around” 功能的图像,这一功能类似于谷歌地图的街景服务。根据最新的公告,自2025年3月起,苹果将开始利用在 “Look Around” 调查中收集的图像和数据来训练其产品和服务中使用的人工智能模型。这些模型包括与图像识别、创作及增强相关的技术。苹果通过配备有摄像头、传感器及其他设备的车辆和背包(用于行人专用区域)来收集图像和三维数据,以提高和完善 Apple Maps(苹果地图)的功能。在公司致力于保护用
据彭博社援引知情人士报道,蚂蚁集团在人工智能领域取得了重大突破,通过采用阿里巴巴和华为生产的中国芯片,成功将AI模型的训练成本削减了20%。这一消息无疑为中国在关键技术领域的自主可控注入了新的动力。报道进一步指出,蚂蚁集团的内部测试显示,这些中国制造的AI芯片在性能上能够与行业领导者英伟达的同类产品相媲美。这一结果如果得到广泛验证和应用,将可能显著改变全球AI芯片市场的格局。图源备注:图片由AI生成,图片授权服务商Midjourney此前,市场曾有传言称中国
近日,GPU 云服务企业 CoreWeave 宣布与 OpenAI 达成了一项价值119亿美元的战略合作协议,该协议将为期五年。根据协议内容,CoreWeave 将为 OpenAI 提供所需的算力支持,以促进其 AI 模型的训练和交付。这一重大交易标志着两家公司在人工智能领域的深入合作。作为合作的一部分,CoreWeave 还将向 OpenAI 发行价值3.5亿美元的股票,这将使 OpenAI 成为 CoreWeave 的股东之一。尽管如此,CoreWeave 并不会从这次股票发行中获得任何直接收益。CoreWeave 的联合创始人兼首席执行官迈克尔・英特拉托(Michael Intrat
最近,得到了英伟达(Nvidia)支持的数据中心公司 CoreWeave 宣布收购人工智能开发平台 Weights & Biases,交易金额未公开,但据《信息》(The Information)报道,CoreWeave 在此次交易中花费了约17亿美元。Weights & Biases 成立于2017年,创始人包括 Lukas Biewald、Chris Van Pelt 和 Shawn Lewis,旨在为 AI 应用程序的开发提供工具。如今,Weights & Biases 的工具已经被包括阿斯利康(AstraZeneca)和英伟达在内的1400多家机构广泛使用,成为了他们在训练和优化 AI 模型过程中的系统记录工具。此次收购对于 CoreWeave 而言,
近日,vivo 公司在其组织架构上进行了重要调整,宣布在原有的 OS 产品领域内新设立 AI 领域。这一新部门下将包括人工智能一部和人工智能二部,标志着 vivo 在人工智能技术上的持续投入和战略布局。此次变动还伴随着高层人事调整,原互联网平台运营领域的总经理张飞被任命为新 AI 领域的总经理,并兼任人工智能一部的负责人,直接向公司副总裁、OS 产品领域负责人周围汇报。值得注意的是,vivo 的 AI 部门正在将其大模型的训练重心逐步向端侧转移。根据内部消息,虽然公司在 AI 大模
今日,国内人工智能领军企业DeepSeek正式公开其开源计划的第四日成果——Optimized Parallelism Strategies(优化并行策略),重点推出双向管道并行算法DualPipe、专家并行负载均衡器EPLB,以及对计算-通信重叠机制的深度优化。此次技术升级直击大规模语言模型训练的核心痛点,为超万卡级集群的高效运行提供了全新解决方案。1. DualPipe:双向管道并行算法作为本次升级的核心技术之一,DualPipe专为V3/R1架构设计,通过创新的双向数据流管道,实现计算与通信的高度重叠。相较于传统单向流水线,该