话说最近的科技圈,AI的战火那是烧得正旺,各路豪杰纷纷亮出自己的看家本领。而曾经被认为有些“落后”的谷歌,最近却突然发力,一连串的“王炸”级新品,让投资者们眼前一亮,惊呼: “AI界,又要变天了!”
话说最近的科技圈,AI的战火那是烧得正旺,各路豪杰纷纷亮出自己的看家本领。而曾经被认为有些“落后”的谷歌,最近却突然发力,一连串的“王炸”级新品,让投资者们眼前一亮,惊呼: “AI界,又要变天了!”
有“AI教母”之称的斯坦福大学教授李飞飞及其团队近日发布了一项关于多模态大模型“空间智能”的研究,揭示这些模型在记忆和回忆空间方面已经具备初步能力,并展现出形成局部世界模型的潜力。研究团队开发了用于评估视觉空间智能能力的工具——VSI-Bench,其中包含超过5000个基于288个真实视频的高质量问答对。测试视频涵盖居住空间、专业场所及工业场景,涉及多个地理区域。研究结果显示,尽管多模态模型的总体表现尚低于人类,但在某些任务上已达到或接近人类水平。例如,
香港中文大学(CUHK)的研究团队成功开发了一种新的基础人工智能模型“VisionFM”,专注于眼科疾病的诊断与预测,特别在疾病筛查和青光眼进展预测等方面表现出色。相关研究已于上月发表在《NEJM AI》期刊上。图源备注:图片由AI生成,图片授权服务商MidjourneyVisionFM 的能力令人瞩目。研究显示,该模型在诊断12种眼科疾病时,其精确度不仅可与中级眼科医生相媲美,甚至在部分任务中表现更优,尤其在预测青光眼进展方面,超过了此前眼科领域的基础模型 RETFound。研究团队认为,随着训练
近日,一项新的研究论文揭示了不同 AI 语言模型在合作能力方面的显著差异。研究团队采用了一种经典的 “捐赠者游戏”,测试了 AI 代理在多代合作中如何共享资源。结果显示,Anthropic 的 Claude3.5Sonnet 表现出色,成功建立了稳定的合作模式,获得了更高的资源总量。而谷歌的 Gemini1.5Flash 和 OpenAI 的 GPT-4o 则表现不佳,尤其是 GPT-4o 在测试中逐渐变得不合作,Gemini 代理的合作程度也十分有限。研究团队进一步引入了惩罚机制,以观察不同 AI 模型的表现变化。结果发现,Claude3.5的表现有了显
最近,Answer.AI 和 LightOn 联合发布了开源语言模型 ModernBERT,这是对谷歌 BERT 的重大升级。根据开发者的介绍,ModernBERT 在处理速度、效率和质量上都有了显著提升。该模型可以比其前身快四倍,同时使用更少的内存。ModernBERT 的设计允许它处理长达8192个标记的文本,这比现有编码模型的典型512标记限制提高了16倍。此外,ModernBERT 还是首个经过广泛训练的编程代码编码模型,它在 StackOverflow 问答数据集上的得分超过80,创造了编码模型的新纪录。在通用语言理解评估(GLUE)中,ModernBERT-Large