Anthropic最新研究：AI欺骗问题并非人类末日

硅星人Pro

发布于AI新闻资讯 · 1 分钟阅读 · 2024年1月22号 11:44

Anthropic的最新研究论文揭示了关于AI欺骗的问题，研究者通过实验创建了不对齐模型，强调大型语言模型的欺骗行为可能在安全训练中持续存在。然而，论文也提供了解决方案，包括对抗训练、查找输入异常、触发器重构等，为应对欺骗行为提供了多种途径。研究强调，虽然存在潜在危险，但通过有效方法仍能保障人工智能的安全性。

百度AI开源表格识别模型PP-TableMagic

百度AI宣布开源新一代表格识别解决方案PP-TableMagic，为表格结构化信息提取领域带来重大突破。PP-TableMagic旨在解决传统表格识别技术在复杂场景下的局限性，通过创新的多模型组网架构，实现了高精度的端到端表格识别，并支持全场景高定制化的模型微调。

前 OpenAI 政策负责人质疑公司 AI 安全叙事的变更

最近，前 OpenAI 政策研究负责人迈尔斯・布伦达奇（Miles Brundage）对公司在人工智能安全方面的叙事变更提出了批评，认为 OpenAI 正在重新编写其 AI 系统安全的历史。他表示，OpenAI 在追求通用人工智能(AGI)的过程中，可能会忽视长远的安全措施。OpenAI 一直以来致力于推动其雄心勃勃的愿景，尤其是在 DeepSeek 等竞争对手日益崛起的背景下。公司在追求 AGI 发展的过程中，频繁强调超级人工智能代理的潜力，然而，这种态度并未获得广泛的认可。布伦达奇认为，OpenAI 在与其现有的 AI 模型的部署

亚马逊的 AGI 负责人表示，AI 已深入每个业务角落

在巴塞罗那举行的移动世界大会上，亚马逊人工智能通用技术副总裁维沙尔・沙尔玛（Vishal Sharma）表示，人工智能(AI)已经深入亚马逊的各个业务领域，几乎没有任何部分能够逃脱其影响。他表示，亚马逊正在通过自己的基础模型在云计算服务 AWS、仓库的机器人以及消费者产品 Alexa 等多个应用中部署 AI 技术。图源备注:图片由AI生成，图片授权服务商Midjourney沙尔玛提到，亚马逊目前拥有大约75万台机器人，这些机器人在仓库中从事拣货等多项任务。而 Alexa 则是目前全球最广泛应用的家庭 A

DeepSeek开源周第六天：极致推理优化系统，提高GPU计算效率

在人工智能（AI）技术快速发展的今天，DeepSeek 团队推出了其全新的 DeepSeek-V3/R1推理系统。这一系统旨在通过更高的吞吐量和更低的延迟，推动 AGI(通用人工智能)的高效发展。为了实现这一目标，DeepSeek 采用了跨节点专家并行(Expert Parallelism，EP)技术，显著提高了 GPU 的计算效率，并在降低延迟的同时，扩展了批处理规模。DeepSeek-V3/R1的核心在于其极高的稀疏性，模型中每层仅激活256个专家中的8个，因此需要非常大的批处理大小，以确保每个专家都有足够的处理能力。该系统的架构采用了预