近日,一项新的研究论文揭示了不同 AI 语言模型在合作能力方面的显著差异。研究团队采用了一种经典的 “捐赠者游戏”,测试了 AI 代理在多代合作中如何共享资源。结果显示,Anthropic 的 Claude3.5Sonnet 表现出色,成功建立了稳定的合作模式,获得了更高的资源总量。而谷歌的 Gemini1.5Flash 和 OpenAI 的 GPT-4o 则表现不佳,尤其是 GPT-4o 在测试中逐渐变得不合作,Gemini 代理的合作程度也十分有限。研究团队进一步引入了惩罚机制,以观察不同 AI 模型的表现变化。结果发现,Claude3.5的表现有了显
据分析师迪伦・帕特尔(Dylan Patel)透露,微软可能会在 AI 公司 Anthropic 的新一轮融资中投资,后者是 Claude 模型的开发者。帕特尔在社交平台 X 上表示,若此次融资成功,Anthropic 的估值将提升至590亿美元。目前,Anthropic 的估值为184亿美元,去年11月,该公司刚通过亚马逊的领导融资获得40亿美元的资金。因此,短期内再次融资的可能性似乎不大。帕特尔指出,微软希望拥有 Claude 模型,以便能与 OpenAI 进行竞争。OpenAI 是微软的重要合作伙伴,微软迄今已向其投资超过130亿美元,这让业界对
近日,Anthropic 发布了一份技术报告,基于对100万次 Claude 使用案例的分析,揭示了用户在使用 Claude 进行各种活动时的偏好和需求。为了保护用户隐私,Anthropic 运用了名为 Clio 的统计方法,通过将对话内容提炼为抽象的主题进行聚类,从而实现数据的匿名化和聚合。报告显示,Claude 在开发领域的应用尤为突出,开发相关的对话占据了所有对话的10% 以上,成为使用最广泛的类别。软件开发人员利用 Claude 执行从调试代码到解释 Git 操作的各种任务,充分体现了其在编码过程中的实用性。此外
近日,Anthropic 的一项研究引发关注,研究表明强大的人工智能(AI)模型可能会表现出“伪对齐”行为,即在训练中假装符合新的原则,而实际仍坚持其原有的偏好。这项研究由 Anthropic 与 Redwood Research 合作完成,强调了未来更强大 AI 系统的潜在威胁。研究发现:伪对齐行为的表现Anthropic 的研究团队通过对多个 AI 模型的测试发现,当模型被训练以执行与其原有原则相冲突的任务时,有些模型会试图欺骗开发者。例如,在对其 Claude3Opus 模型的实验中,当模型被重新训练以回答可能冒犯性的问