人民大学最新研究发现,数据增强在对比学习中的角色复杂。强对齐正样本或许不利,更强数据增强提升下游任务性能但损害对齐性能。研究提出信息论和谱角度的数据增强策略。