人工智能在理解人类情感方面取得了显著进展。本月初,第二届多模态情感识别挑战赛(MER24)成功落下帷幕,这场高规格赛事由多位国际知名学者联合发起,旨在推动AI情感识别技术在真实人机交互场景中的应用。

MER24挑战赛设有三个赛道,其中Semi赛道因其高难度和激烈竞争而备受关注。Semi赛道要求参赛队伍利用少量有标签和大量无标签的视频数据训练模型,并评估模型在无标签数据集上的表现和泛化能力。Soul App的语音技术团队凭借创新技术方案在该赛道中荣获第一名。

image.png

大赛官网:https://zeroqiaoba.github.io/MER2024-website/#organization

Soul团队的成功得益于其在多模态数据理解、情感识别算法、模型优化平台工具、内部工作流建设等方面的深厚积累和创新,以及技术团队的高效协作。面对数据稀缺的挑战,Soul团队采取了多种策略,包括改进半监督学习技术、利用预训练模型提取多模态特征、提出有效的特征融合方法,以及针对视频和文本模态的创新模型。

Soul团队的技术方案不仅提高了情感识别的准确率,还更好地区分了易混淆的情感边界。这一成果是Soul在社交领域深耕AI大模型技术,尤其是多模态情感化交互能力的集中体现。

社交领域对情感AI的需求日益增长。Soul通过构建具备情感化能力的AI,实现了从"任务执行者"到"满足人类情感需求的陪伴者"的转变。Soul自研的AI苟蛋、狼人魅影游戏、异世界回响应用等,都展现了Soul在拟人化、知识、多模态、时间感知等多方面的融合能力,为用户提供了丰富、有温度的AI互动体验。

2024年被视为AIGC应用的元年,Soul等国内企业通过自研技术积累,在AI社交方向上取得了显著成果。Soul基于自研语言和语音大模型孵化出了一系列产品,并在提升AI与用户情感化互动体验的过程中积累了丰富的创新技术和实践经验。

未来,像Soul这样坚持技术和产品创新的平台,将持续为用户创造价值,在形成繁荣内容和社区生态的基础上实现更持久、更多样化的商业价值。