zh
AI产品榜
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
AI产品榜
搜索全球AI产品动态
搜索全球AI信息,发现AI新机遇
新闻资讯
产品应用
变现案例
AI教程
类型 :
新闻资讯
产品应用
变现案例
AI教程
2025-03-04 14:03:02
.
AIbase
.
15.9k
豆包团队开源SuperGPQA:挑战285学科AI推理极限
近日,字节跳动豆包大模型团队联合M-A-P开源社区发布SuperGPQA,一个覆盖285个研究生级学科、包含26,529道专业问题的知识推理基准测试。该数据集不仅涵盖数学、物理等主流学科,还首次将轻工业、农业、服务科学等长尾学科纳入评估体系,填补了现有基准测试在长尾知识领域的空白。SuperGPQA已被用于揭示开源与闭源模型的性能差距,成为AI发展的重要工具。传统基准如MMLU和GPQA学科覆盖不足50个,长尾学科占比不到5%,且因数据来源单一(如维基百科)和众包标注不可靠,难以衡量模型在
2024-09-13 08:32:23
.
AIbase
.
11.7k
蚂蚁推出自研知识增强大模型服务框架KAG:提升知识推理准确率
在2024年的Inclusion·外滩大会上,蚂蚁集团分享了其在构建知识增强的专业智能体方面的最新进展,并推出了知识图谱与大模型结合的研发成果——知识增强大模型服务框架KAG。该框架由蚂蚁集团知识图谱负责人梁磊介绍,旨在通过图谱逻辑符号引导决策和检索,显著提升垂直领域决策的精准性和逻辑严谨性。