AI 模拟人类行为！这1000个智能体让预测准确率高达85%

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年11月25号 9:22

219

近日，来自斯坦福大学、华盛顿大学和谷歌 DeepMind 的研究团队开发了一种新型的人工智能（AI）智能体，这些智能体可以在社会实验中精准模拟人类行为。根据他们的研究，这种模拟技术有望为经济学、社会学、组织学和政治学等领域的理论测试提供实验室基础。

研究人员构建这些 AI 智能体的过程中，使用了超过1，000名美国选民的访谈数据。这些被访者的年龄、性别、教育背景和政治观点均代表了美国社会的多样性。AI 智能体通过分析这些访谈记录，利用 GPT-4o 模型，在用户提问时再现受访者的真实反应。

在具体实现上，研究团队为每位参与者进行了两小时的深度访谈，并使用 OpenAI 的 Whisper 模型将访谈内容转换为文本。这一方法极大地提高了 AI 智能体的准确性。在对人类行为的预测测试中，基于访谈数据的 AI智能体以85% 的准确率成功预测了人类在一般社会调查中的回答，表现明显优于仅依赖基本人口统计信息的 AI 代理。

研究者们还进行了五项社会科学实验，结果显示在四项实验中，AI 智能体所产生的结果与人类参与者的反应高度一致，相关系数达到了0.98。这说明基于访谈的方法在不同政治意识形态和种族群体的响应分析中表现出更高的准确性和更好的平衡性。

为了促进后续研究，研究团队将其创建的1，000个 AI 智能体的数据集上传至 GitHub，供其他科学家使用。为了保护参与者隐私，团队采用了两级访问系统。

科学家可以自由获取某些特定任务的综合响应数据，而对开放式研究中个体响应数据的访问则需要特殊权限。这一系统旨在在保护原始访谈参与者隐私的同时，帮助研究人员更好地研究人类行为。

项目入口:https://github.com/joonspk-research/genagents

划重点:
🌟 研究团队开发的 AI 智能体基于访谈数据，能够准确模拟人类行为，提升社会科学研究的准确性。
📊 AI 智能体在社会调查中的预测准确率达到85%，明显优于仅依赖人口统计信息的智能体。
🔍 数据集已公开，其他研究人员可通过 GitHub 访问，促进人类行为研究，同时保护参与者隐私。

OpenAI 已将其 o1 模型添加到 Canvas 支持HTML/React代码

OpenAI 近日宣布，其 ChatGPT 代码辅助功能 Canvas 迎来重大更新。此次升级不仅将 o1模型集成到 Canvas 中，还新增了对 HTML 和 React 代码的渲染功能。此外，OpenAI 还推出了适用于 macOS 的 ChatGPT 桌面应用程序，使得用户能够更加便捷地使用 Canvas 功能。此次更新，Canvas 不仅获得了 OpenAI 最新的 o1模型加持，显著提升了代码辅助能力，而且能够直接呈现 HTML 和 React 代码，方便开发者更直观地查看和编辑代码。无论是前端开发还是复杂项目构建，Canvas 都能为开发者提供更加高效、流畅的体验。为了进

英国拟修法放宽AI训练:音乐界强烈反对，呼吁“真正控制权”

英国政府正考虑修改法律，拟允许人工智能公司使用创作者的在线内容训练其模型，除非创作者明确选择退出该系统。此举引发了音乐界的强烈反对，其中，前披头士乐队成员保罗·麦卡特尼更是公开表达担忧，警告称这将导致一个“狂野西部”的局面，创意作品将失去应有的版权保护。在接受BBC采访时，麦卡特尼敦促政府重新考虑这一做法，并强调这对新兴艺术家带来的潜在威胁:“年轻的男孩、女孩们涌现出来，他们写了一首很美的歌，但他们却不拥有它。”他认为，创作者应该获得作

DeepSeek AI 助手登顶苹果商店:低成本、高效率，中国AI崛起引发全球关注

中国人工智能公司 DeepSeek 近日发布其推理模型 R1的开放版本，迅速在科技界引发热议。其惊人的突破性成就不仅令风险投资家马克·安德森惊叹为“我见过的最令人惊叹、最令人印象深刻的突破之一”，更在AI基准测试中展现出匹敌甚至超越 OpenAI o1模型的实力。尤其引人关注的是，DeepSeek 声称其模型训练成本仅为560万美元，而美国领先企业则需要数亿美元，这无疑颠覆了人们对AI模型开发成本的认知。Y Combinator 首席执行官 Garry Tan 认为 DeepSeek 的成功将促使AI推理需求加速，从而带动整个行

AI在这方面存在致命缺陷！专家：AI不应用于重要应用

在当前的技术环境下，人工智能（AI）引发了广泛的讨论。德蒙特福特大学的网络安全教授 Eerke Boiten 对此表示，现有的 AI 系统在管理和可靠性方面存在根本性缺陷，因此不应被用于重要应用。Boiten 教授指出，当前的 AI 系统大多依赖于大型神经网络，尤其是生成式 AI 和大型语言模型（如 ChatGPT）。这些系统的工作原理相对复杂，尽管每个神经元的行为是由精确的数学公式决定的，但整体行为却是不可预测的，这种 “涌现” 特性使得系统难以进行有效的管理与验证。图源备注：图片由AI生