近日,腾讯AI Lab联合国内外多家学术机构,发布了面向大模型幻觉问题的综述论文。研究显示,与传统模型相比,大模型幻觉评估面临数据规模大、通用性强、不易察觉等新难题。为减少幻觉,可从预训练、微调、强化学习等多个阶段进行干预。但仍需深入研究可靠的评估方法,以促进大模型的实际应用。
机器人领域迎来重大突破!星动纪元近日发布了其自主研发的端到端原生机器人大模型ERA-42,并将其与自研的五指灵巧手星动XHAND1相结合,首次实现了仅凭一个具身大模型,即可驱动灵巧手完成超过100项复杂精细的操作任务。这其中包括拿起螺钉并用钻紧固、用锤子敲打钉子、扶正水杯并倒水等高难度动作,标志着机器人智能化水平迈上了一个新台阶。ERA-42的强大之处在于其卓越的通用性和灵巧操作能力。它无需任何预编程技能,就能在短时间内学会新任务。通过少量数据收集,ERA-42能够在
国内大模型独角兽企业阶跃星辰近日宣布完成B轮融资,总金额高达数亿美元,引发行业高度关注。本轮融资吸引了众多重量级投资方的参与,包括上海国有资本投资有限公司及其旗下基金领投,腾讯投资、五源资本、启明创投等知名机构跟投。这笔巨额资金将主要用于加速基础模型的研发,重点提升多模态和复杂推理能力,并进一步拓展C端应用市场。阶跃星辰的CEO姜大昕表示,公司的发展路线与OpenAI的“ChatGPT到Sora”路径类似,都是致力于从单模态到多模态,再到实现多模理解和生成的统
有“AI教母”之称的斯坦福大学教授李飞飞及其团队近日发布了一项关于多模态大模型“空间智能”的研究,揭示这些模型在记忆和回忆空间方面已经具备初步能力,并展现出形成局部世界模型的潜力。研究团队开发了用于评估视觉空间智能能力的工具——VSI-Bench,其中包含超过5000个基于288个真实视频的高质量问答对。测试视频涵盖居住空间、专业场所及工业场景,涉及多个地理区域。研究结果显示,尽管多模态模型的总体表现尚低于人类,但在某些任务上已达到或接近人类水平。例如,
随着数字艺术的发展,自动化的图像处理技术日益受到关注。近日,来自清华大学与腾讯 ARC 实验室的研究团队提出了一种名为 ColorFlow 的新型图像序列上色模型。这一模型旨在解决在黑白图像序列上色的同时,保持角色和物体身份一致性的问题,满足漫画和动画等行业的实际需求。ColorFlow 是一个三阶段的扩散基础框架,它充分利用上下文信息,通过参考图像池为黑白图像序列准确生成颜色。例如,该模型能够有效地为角色的发色和服装上色,确保与参考图像的色彩一致性。与以往需要针