Meta提出S2A注意力机制,大模型准确率提升至80.3%

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
在4月10日的商汤技术交流日上,商汤科技发布了其最新的多模态融合大模型 “商汤日日新 SenseNova V6” 及 “商汤大装置 SenseCore2.0” 体系。这一新版本大模型旨在整合文本、图像和视频等多种信息形式,为用户提供更为自然和丰富的交互体验。此次推出的 SenseNova V6系列包含四个版本,其中最引人注目的是 SenseNova V6Pro,它采用了6200亿参数的混合专家架构,展现了强大的多模态融合能力。SenseNova V6Reasoner Pro 则在此基础上增强了多模态推理能力,能够进行更深入的逻辑分析。此外,SenseNova V6V
近日,宜人智科(美股代码:YRD)宣布,其自主研发的“智语大模型”已根据《生成式人工智能服务管理暂行办法》的相关规定,正式完成备案。这一消息标志着宜人智科在AI技术合规化道路上迈出了重要一步,也为其在金融领域的智能化应用奠定了坚实基础。作为国内领先的AI驱动金融服务提供商,宜人智科正以技术创新推动行业变革。图源备注:图片由AI生成,图片授权服务商Midjourney智语大模型:AI赋能金融核心智语大模型是宜人智科近年来在人工智能领域的重点研发成果之一。该模型依
在程序开发的世界中,错误修复总是一个令人头疼的问题。如今,字节跳动的豆包大模型团队为此带来了好消息:他们正式推出了首个多语言软件工程(SWE)数据集 ——Multi-SWE-bench。这个新数据集旨在评估和提升大模型在自动修复代码错误方面的能力。Multi-SWE-bench 与以往的单语言数据集相比,显著扩大了适用范围。这一数据集不仅涵盖了 Python,还包括 Java、Go、Rust、C、C++、TypeScript 和 JavaScript 等七种主流编程语言,真正实现了 “全栈工程” 的评测基准。这意味着无论开发者使用哪种语言
近日,商汤科技创始人徐立正式发布了其最新一代人工智能大模型“日日新V6”,这一消息迅速引发了科技圈的热烈讨论。据AIbase了解,日日新V6在多模态能力上实现了重大突破,进一步巩固了商汤科技在AI领域的领先地位。更令人振奋的是,该模型的API将于明日正式开放,为开发者提供更强大的技术支持,助力AI应用的快速落地。多模态能力全面升级日日新V6作为商汤科技SenseNova系列的最新迭代,核心亮点在于其多模态能力的显著提升。该模型能够无缝处理文本、图像、视频等多种数据类型
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、百度官宣:文心大模型4.5Turbo将于4月25日发布百度宣布将在4月25日的Create大会上发布文心大模型4.5Turbo,尽管具体细节尚未披露,但业界对此充满期待。虽然试用期间无需绑定信用卡,但实际使用需购买托管计划。
近日,字节跳动豆包大模型团队宣布开源Multi-SWE-bench,这是业内首个多语言代码修复基准数据集,为大模型“自动修Bug”能力的评估与提升带来新突破。在大模型技术快速发展的当下,代码生成任务成为检验模型智能的关键领域。以SWE-bench为代表的代码修复基准,虽能衡量模型的编程智能,但存在明显局限。其仅聚焦Python语言,无法评估模型跨语言泛化能力;且任务难度有限,难以覆盖复杂开发场景,制约了大模型代码智能的进一步发展。面向不同模型代码能力评测分数Multi-SWE-bench应运而生
今日,百度官方正式对外宣布,其最新力作——文心大模型4.5Turbo,将于4月25日举办的Create大会上揭开神秘面纱。尽管目前官方对于这款新模型的详细参数与功能特性仍守口如瓶,但业界内外已对其充满期待,具体细节唯有待发布会当日方能揭晓。
由著名 AI 科学家李飞飞领衔的斯坦福大学人工智能研究所发布了最新一期《2025年人工智能指数报告》。这份连续发布八年的权威报告指出,中国和美国作为全球最具影响力的两大 AI 国家,其顶级 AI 大模型之间的性能差距已大幅缩小至0.3%,与2023年的17.5% 相比几乎可以忽略不计。报告评选出了2024年的全球重要大模型(Notable Models),在总共61个入选模型中,谷歌和 OpenAI 各有7个模型入选并列第一,阿里巴巴以6个模型入选,其模型贡献度位列全球第三,也是入选重要模型数量最多的中国科技
近日,谷歌云平台宣布,其Vertex AI Model Garden正式引入Meta最新一代开源大模型Llama4,这一消息迅速在全球科技圈掀起热潮。据悉,Llama4系列中的Scout和Maverick两款模型现已集成至Vertex AI,并通过完全托管的“模型即服务”(Model-as-a-Service,MaaS)API端点向开发者开放预览。这一功能的推出,不仅标志着谷歌与Meta在AI生态合作上的进一步深化,也为开发者提供了一键部署尖端模型的便捷途径,开启了AI应用开发的新篇章。Llama4作为Meta最新发布的旗舰模型系列,以其高效的多模态能力和创新的混合
2025年4月9日,一款名为OmniSVG的强大SVG(可缩放矢量图形)生成模型正式亮相,标志着矢量图形生成技术迈入全新阶段。这一模型由StepFun与复旦大学联合开发,被誉为目前最先进的SVG生成大模型,其卓越的多模态生成能力和高效的表现引发了广泛关注。OmniSVG的技术突破OmniSVG基于预训练的视觉-语言模型(Vision-Language Model, VLM)Qwen-VL构建,并创新性地集成了SVG标记化器。通过将SVG命令和坐标参数化为离散令牌(tokens),OmniSVG成功解耦了矢量图形的结构逻辑与低级几何细节。这种设计不仅提高了