zh
红薯智语
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
红薯智语
搜索全球AI产品动态
搜索全球AI信息,发现AI新机遇
新闻资讯
产品应用
变现案例
AI教程
类型 :
新闻资讯
产品应用
变现案例
AI教程
2024-11-05 15:41:18
.
AIbase
.
13.0k
腾讯开源大语言模型Hunyuan-large,支持高达256K文本序列
腾讯今日发布开源MOE大语言模型Hunyuan-large,总参数量达398B,激活参数量52B。公开测评结果显示,腾讯混元Large在CMMLU、MMLU、CEva1、MATH等多学科综合评测集以及中英文NLP任务、代码和数学等9大维度全面领先,超过Llama3.1、Mixtral等一流的开源大模型。据了解,该模型在技术创新上可实现高质量合成数据,通过使用合成数据增强训练,有效应对自然数据的不足。在上下文处理能力方面,预训练模型支持高达256K的文本序列,显著增强了处理长上下文任务的能力。同时,腾讯混元宣布,为填补行业
2023-11-16 14:30:14
.
AIbase
.
3.3k
人大研究发现:数据增强对比学习或需谨慎对待
["人大最新研究警示数据增强对比学习需谨慎。","强对齐正样本或损害对比学习泛化能力。","更强数据增强可提升下游任务性能,但对齐性能下降。","研究揭示数据增强影响对比学习的机制。","提出寻求更优数据增强策略的信息论和谱角度。"]