巨人网络内部打造 AI 绘画平台 iMagine、代码层大模型 CodeBrain

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
商汤科技发布消息,2025商汤技术交流日将于4月10日14时举行。商汤大装置SenseCore也将迎来全面升级,相关技术能力将迎来指数级增长。这次升级将为其技术能力带来显著提升,尤其是在 AI 基础设施、具身智能研发及行业大模型的应用等方面,预计将实现指数级的增长。自2021年推出以来,商汤大装置 SenseCore 作为新型 AI 基础设施,成功整合了全国范围内的算力资源。该系统实现了算力的统一调度,并在上海、深圳、广州、福州、济南、重庆等多个城市建立了新的计算节点。截止到2024年7月,
Meta 公司推出了其最新的开源人工智能模型 Llama4,标志着其在人工智能领域的又一重大进展。Llama4分为两个版本,分别命名为 Scout 和 Maverick,旨在提升 AI 模型的功能与表现。Meta 表示,Llama4是一个多模态大模型,能够处理文本、图像、视频和音频等多种数据类型,并能在这些格式之间自由转换。值得一提的是,Llama4系列首次采用了 “混合专家”(MoE)架构,这一新颖设计极大地提高了模型的训练和响应效率。通过将模型划分为多个专注于特定任务的 “专家” 子模型,Llama4在处理复杂查询
在最新的研究中,谷歌与卡内基梅隆大学及 MultiOn 团队联手,探讨了合成数据对大型模型的训练效果。他们发现,合成数据能够显著提升大模型在逻辑推理方面的表现,尤其是在数学问题的解决能力上,提升幅度达到了惊人的八倍。这一发现对于当前训练数据日益匮乏的现状具有重要的意义。目前,全球可用的高质量文本训练数据约为300万亿条,但随着像 ChatGPT 这样的模型日益普及,对训练数据的需求急剧增加,预计到2026年,这些数据将难以满足需求。在此背景下,合成数据成为了一种极
近期,谷歌、卡内基梅隆大学与 MultiOn 的研究团队联合发布了一项关于合成数据在大模型训练中应用的新研究。根据 AI 发展科研机构 Epoch AI 的报告,目前人类公开的高质量文本训练数据大约有300万亿 tokens,但随着大型模型如 ChatGPT 的快速发展,对训练数据的需求正以指数级增长,预计在2026年前这些数据将被消耗殆尽,因此合成数据逐渐成为重要的替代方案。研究人员探索了合成数据的两种主要类型:正面数据和负面数据。正面数据是指来自高性能大模型(如 GPT-4和 Gemini1.5Pro)生成的正确
清明假期前夕,广西交通领域迎来一项重大创新举措 —— 广西交通投资集团计算中心的 “路网先知” 智慧交通大模型全面启航,以 “预测 — 调度 — 处置” 全链路数字化管理为核心,引领公众出行体验迈入智慧新时代。为了应对假期出行高峰,在南宁东、长塘等关键收费站区域,精心布局了无人机机场;而在崇左、钦州等往年易拥堵路段,车载无人机也部署到位。由此,“空天地” 全方位协同治堵体系正式形成,实现了全域巡查无死角,让交通管理更加全面、高效。这些无人机 “本领
4月3日,百度正式推出了飞桨框架3.0版。这一全新版本在设计理念上实现了全面进化,特别针对大模型的开发和推理需求,提供了五大核心特性,力求成为深度学习框架领域的领先者。随着大模型在各行各业的广泛应用,深度学习框架的作用愈发重要,而飞桨框架3.0正是为此而生。首先,飞桨框架引入了 “动静统一自动并行” 技术,显著降低了大模型的开发和训练成本,让算法创新更专注于核心价值的创造。此外,它的 “训推一体” 设计理念有效打破了训练与推理之间的壁垒,通过深度
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、阿里通义千问Qwen2.5-Omni登顶全球开源模型榜单2024年4月2日,HuggingFace发布了最新的大模型榜单,阿里巴巴的Qwen2.5-Omni凭借其卓越的性能和多模态能力,成功登顶,成为全球开源模型的领军者。尽管没有进行大规模宣传,这一举措被认为是OpenAI在推动AI教育普及方面的重要一步,受到业内人士的广泛欢迎。
2024年4月2日,全球最大的 AI 开源社区 Hugging Face 发布了最新的大模型榜单,阿里巴巴的通义千问所推出的端到端全模态大模型 Qwen2.5-Omni 成功登顶,成为全球开源模型中的领军者。此次排名中,Qwen2.5-Omni 凭借其强大的性能和多模态能力,战胜了其他众多优秀的模型,位列榜首。紧随其后的是 DeepSeek-V3-0324和群核的 SpatialLM-Llama-1B,这两个模型在功能和应用上也颇具实力,为 AI 开发者提供了更多选择。据悉,阿里通义千问自成立以来,已经向全球开源了超过200款模型。这些模型覆盖了自然语言
百度旗下的深度学习平台飞桨近日宣布正式发布新一代飞桨框架3.0。此次发布的框架3.0引入了五大核心技术创新,包括“动静统一自动并行”等关键技术,旨在有效降低大模型开发和训练成本,助力大模型时代的基础设施建设。作为支撑大模型训练和推理任务的核心基础设施,飞桨框架3.0在性能优化方面表现出色。该框架已经支持包括文心4.5、文心X1在内的多款主流大模型,并通过优化的DeepSeek-R1满血版单机部署,显著提升了吞吐量,提升幅度高达一倍。在计算速度方面,飞桨框架3.0借助其
近日,中国国家天文台与阿里云联合宣布推出国际上首款太阳大模型“金乌”,标志着太阳物理研究与人工智能技术的深度融合迈出了重要一步。据悉,该模型基于阿里云开源的通义千问(Tongyi Qianwen)框架打造,针对M5级太阳耀斑的预测准确率超过91%,达到该级别预报的全球最高水平。这一成果不仅提升了空间天气预报的精度,也为应对太阳活动引发的潜在地球影响提供了新的技术保障。“金乌”大模型以海量的太阳观测数据为基础,结合国家天文台在太阳物理领域的深厚积累,利用通义