人大研究发现：数据增强对比学习或需谨慎对待

新智元

发布于AI新闻资讯 · 1 分钟阅读 · 2023年11月16号 14:30

人民大学最新研究发现，数据增强在对比学习中的角色复杂。强对齐正样本或许不利，更强数据增强提升下游任务性能但损害对齐性能。研究提出信息论和谱角度的数据增强策略。

腾讯发布大语言模型训练新专利，提升模型泛化与准确性

近日，腾讯科技（深圳）有限公司在天眼查 App 上公布了一项关于大语言模型的训练方法及相关设备的专利。这项专利的名称为 “大语言模型的训练方法、装置、计算机设备及存储介质”，旨在通过创新的训练方式，提升大语言模型的学习能力和准确性。在大语言模型的训练过程中，传统方法往往依赖于单一的文本摘要，可能导致模型过拟合，生成内容的准确性和多样性受到影响。然而，腾讯的新方法引入了两种不同的信息来源 —— 第一摘要文本和第二摘要文本。这两个摘要文本的信息

微软发布 LLM2CLIP:新 AI 技术使语言模型助力图像理解

在当今科技领域，CLIP（Contrastive Language-Image Pre-training）是一个重要的多模态基础模型。它通过在大规模图像 - 文本对上使用对比学习损失，将视觉信号和文本信号结合到一个共享的特征空间中。CLIP 作为检索器，能够支持零 - shot 分类、检测、分割和图像 - 文本检索等多种任务。同时，作为特征提取器，它在几乎所有跨模态表示任务中占据主导地位，例如图像理解、视频理解以及文本到图像或视频生成。CLIP 的强大之处在于它能够将图像与自然语言相连接，并捕捉人类知识，这得益于其在大

腾讯开源大语言模型Hunyuan-large，支持高达256K文本序列

腾讯今日发布开源MOE大语言模型Hunyuan-large，总参数量达398B，激活参数量52B。公开测评结果显示，腾讯混元Large在CMMLU、MMLU、CEva1、MATH等多学科综合评测集以及中英文NLP任务、代码和数学等9大维度全面领先，超过Llama3.1、Mixtral等一流的开源大模型。据了解，该模型在技术创新上可实现高质量合成数据，通过使用合成数据增强训练，有效应对自然数据的不足。在上下文处理能力方面，预训练模型支持高达256K的文本序列，显著增强了处理长上下文任务的能力。同时，腾讯混元宣布，为填补行业

小而美！港大最新推荐系统EasyRec 以文本洞察用户心声

EasyRec是一款基于语言模型的推荐系统，由香港大学团队开发。其独特之处在于通过文本行为对齐框架分析用户行为故事中的情感和细节，预测用户喜好，无需大量用户数据。该系统结合对比学习和协同语言模型，能准确预测新用户和新商品的喜好，特别是在零样本推荐场景中表现出色。EasyRec的即插即用特性使其易于集成到现有推荐系统中，提升性能。论文展示了EasyRec在多个真实世界数据集上的优秀表现，证明了其在推荐准确性上的优势。随着技术的不断发展，EasyRec有望在商业推荐系统和学术研究中发挥更大作用。

AI新闻资讯

人大研究发现：数据增强对比学习或需谨慎对待

新智元

相关AI新闻推荐

腾讯发布大语言模型训练新专利，提升模型泛化与准确性

​微软发布 LLM2CLIP:新 AI 技术使语言模型助力图像理解

腾讯开源大语言模型Hunyuan-large，支持高达256K文本序列

小而美！港大最新推荐系统EasyRec 以文本洞察用户心声

微软发布 LLM2CLIP:新 AI 技术使语言模型助力图像理解