Quora从高质量问答社区逐渐变为互联网垃圾平台,AI聊天机器人Poe未能解决Quora的问题,导致AI提问、AI回答现象。社区文化消失,老用户流失,新用户不屑。商业化遇阻碍,盈利困难。AI的介入导致质量下降,出现AI提问、AI回答现象。
美国科技政策领域正迎来重大调整。近日,斯坦福大学人类中心人工智能研究院(Stanford HAI)的研究员Michael Kratsios被任命为白宫科技政策办公室主任,同时还将担任即将上任的特朗普政府的总统科技助理。这一任命引发了广泛关注,标志着美国AI高层研究者对国家科技政策的影响力日益增强。特朗普召回旧部,重组科技团队除了Michael Kratsios之外,特朗普还任命了另一位资深人士Lynne Parker担任总统科技顾问委员会的执行主任。这两位都是他第一任政府的资深官员,他们将与此前任命的“人工
近期的研究表明,市场上最先进的 AI 聊天机器人竟然对一些简单的技巧十分敏感,甚至可以被轻易 “越狱”。根据《404媒体》的报道,Claude 聊天机器人的开发公司 Anthropic 发现,只需在提示中故意加入一些拼写错误,便能使这些大型语言模型忽视自身的安全防护措施,生成一些本应拒绝回答的内容。图源备注:图片由AI生成,图片授权服务商Midjourney研究团队开发了一种简单的算法,名为 “最佳选择(Best-of-N, BoN)越狱”,通过对同一提示的不同变体进行尝试,诸如随机大写字母、字母替
科技巨头们在AI领域的竞争日趋白热化,而最近曝光的一则消息再次将行业竞争的暗流涌动推向了台前。据TechCrunch获得的内部通信内容显示,负责改进谷歌Gemini人工智能模型的承包商,竟然在将其答案与Anthropic的竞品模型Claude的输出进行比较。此举引发了外界对于谷歌是否获得Anthropic授权使用Claude进行测试的合规性质疑。在科技公司竞相开发更优秀AI模型的当下,通常是通过行业基准测试来评估模型性能,而非由承包商耗费大量精力去评估竞争对手的AI回复。然而,据爆料,Gemini的承包商需
一项新研究表明,OpenAI 的 o1-preview 人工智能系统在诊断复杂医疗案例方面,可能优于人类医生。哈佛医学院和斯坦福大学的研究团队对 o1-preview 进行了全面的医疗诊断测试,结果显示该系统相比于早期版本有了显著进步。根据研究结果,o1-preview 在所有被测试的病例中,正确诊断率达到了78.3%。在对70个特定病例的直接比较中,该系统的准确诊断率更是达到了88.6%,显著超越了其前身 GPT-4的72.9%。在医疗推理方面,o1-preview 的表现同样引人注目。使用 R-IDEA 量表这一医疗推理质量评估标准,该