科技巨头们在AI领域的竞争日趋白热化,而最近曝光的一则消息再次将行业竞争的暗流涌动推向了台前。据TechCrunch获得的内部通信内容显示,负责改进谷歌Gemini人工智能模型的承包商,竟然在将其答案与Anthropic的竞品模型Claude的输出进行比较。此举引发了外界对于谷歌是否获得Anthropic授权使用Claude进行测试的合规性质疑。
科技巨头们在AI领域的竞争日趋白热化,而最近曝光的一则消息再次将行业竞争的暗流涌动推向了台前。据TechCrunch获得的内部通信内容显示,负责改进谷歌Gemini人工智能模型的承包商,竟然在将其答案与Anthropic的竞品模型Claude的输出进行比较。此举引发了外界对于谷歌是否获得Anthropic授权使用Claude进行测试的合规性质疑。
人工智能的发展是否已经触及瓶颈?Anthropic联合创始人Jack Clark在近日的通讯中明确表示,事实并非如此。他认为,OpenAI最近发布的o3模型表明,AI的发展不仅没有放缓,反而可能正在加速。Clark在名为“Import AI”的通讯中反驳了关于AI发展正在触及极限的说法。他写道:“所有告诉你进展正在放缓或扩展正在触及瓶颈的人都是错误的。”他指出,OpenAI的新o3模型证明了AI仍有巨大的增长空间,但需要采用不同的方法。o3模型并非仅仅是扩大模型规模,而是在运行时利用强化学习和额外的计算能力
近期的研究表明,市场上最先进的 AI 聊天机器人竟然对一些简单的技巧十分敏感,甚至可以被轻易 “越狱”。根据《404媒体》的报道,Claude 聊天机器人的开发公司 Anthropic 发现,只需在提示中故意加入一些拼写错误,便能使这些大型语言模型忽视自身的安全防护措施,生成一些本应拒绝回答的内容。图源备注:图片由AI生成,图片授权服务商Midjourney研究团队开发了一种简单的算法,名为 “最佳选择(Best-of-N, BoN)越狱”,通过对同一提示的不同变体进行尝试,诸如随机大写字母、字母替
近日,谷歌的 Gemini 人工智能项目正在通过比较其输出结果与 Anthropic 公司的 Claude 模型来提升自身性能。据 TechCrunch 获得的内部通信记录显示,负责 Gemini 改进的承包商正在系统地评估这两种 AI 模型的回答。图源备注:图片由AI生成,图片授权服务商Midjourney在 AI 行业,模型的性能评估通常通过行业基准测试来进行,而不是让承包商逐一对比不同模型的答案。负责 Gemini 的承包商需要根据多个标准对模型的输出进行评分,包括真实性和详细程度。他们每次有多达30分钟的时间来判断 Gemini 和
据TechCrunch获得的内部通讯显示,谷歌正让承包商将其Gemini AI与Anthropic的Claude进行对比评测,此举引发了合规性质疑。文件显示,负责改进Gemini的承包商需要在30分钟内根据真实性和详尽度等多个标准,对比评估Gemini和Claude的回答质量。承包商近期在谷歌内部评测平台上发现了明确提及Claude的内容,其中包含"我是Claude,由Anthropic创建"的字样。内部讨论显示,承包商注意到Claude在安全方面的表现更为严格。有承包商称"Claude的安全设置是所有AI模型中最严格的"。在某些案例中,当Gemini的回答因