价值190亿美元的AI初创公司Anthropic的CEO Dario Amodei在周三旧金山AI大会上,就人工智能发展风险问题发表了引人深思的见解。虽然他认为目前的AI模型并不会给人类带来即刻威胁,但他对一些同行过于轻视AI风险的论调提出了尖锐批评。针对著名风险投资人Marc Andreessen的观点,Amodei展开了独到的分析。Andreessen曾在今年三月发推文称"限制AI就等同于限制数学、软件和芯片",并将AI简单归结为"数学"。对此,Amodei指出这种逻辑存在根本性缺陷。"如果用这种逻辑,人类大脑不也是数学吗?神经元的放
最近,AI 大型语言模型(LLM)在各种任务中表现出色,写诗、写代码、聊天都不在话下,简直是无所不能!但是,你敢相信吗?这些“天才”AI 居然是“数学菜鸟”!它们在处理简单的算术题时经常翻车,让人大跌眼镜。一项最新的研究揭开了 LLM 算术推理能力背后的“奇葩”秘诀:它们既不依赖强大的算法,也不完全依靠记忆,而是采用了一种被称为“启发式大杂烩”的策略! 这就好比一个学生,没有认真学习数学公式和定理,而是靠着一些“小聪明”和“经验法则”来蒙答案。研究人员以算
随着 ServiceTitan 向美国证券交易委员会提交首次公开募股(IPO)申请文件,该公司在风险因素部分特别提到了大型语言模型(LLMs)可能带来的潜在风险。此类警告或许标志着未来 IPO 文档中的新标准:使用 AI 技术的同时也伴随风险。在 ServiceTitan 的申请文件中,有一段长达1150字的风险提示,详细阐述了其使用生成性 AI 的可能负面影响。公司警告称,LLMs 可能产生 “虚假” 信息,并可能表现出 “歧视性” 行为。此外,使用这些模型可能涉及侵犯他人的版权或知识产权,而在数据的使用上,若不
近日,一场别开生面的AI能力评测在《我的世界》平台上展开,吸引了大量关注。新旧两个版本的Claude3.5Sonnet在游戏中展开建筑PK,展现出明显的能力差异,新版本(暂称"Sonnet3.6")的表现尤其亮眼。这项由开发者adi发起的测试被戏称为"唯一可靠的评测基准"。评测基准研究者Aidan McLau认为这个方法恰好满足了当前AI评测的需求,并指出审美能力与智力水平密切相关。该项目很快获得了开源社区的支持,相关代码已在GitHub上线。测试结果显示,各大模型都展现出独特的"个性":Sonnet3.6在创意性方