谷歌新AI模型PaliGemma2引发情绪识别争议:隐患与挑战并存

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年12月6号 9:23

216

谷歌日前发布了其新一代人工智能模型——PaliGemma2，该技术能分析图像并生成标题，同时回答关于照片中人物的情感和行动等问题。PaliGemma2基于谷歌的 Gemma 开放模型系列，提供比传统物体识别更为深刻的图像描述，能够识别情绪并生成符合上下文的详细描述。然而，尽管这一技术看似突破性创新，专家却对其潜在的伦理和社会影响提出了严重警告。

情绪识别并非PaliGemma2的标准功能，而是通过微调实现的。尽管谷歌表示其已进行了“广泛测试”，并且在人口统计学偏见方面表现优于行业基准，专家们仍对该技术的可靠性表示担忧。牛津大学的桑德拉·沃赫特教授认为，“通过人工智能来‘读懂’人类情绪存在重大问题”，并且这一过程过于依赖假设，可能导致误判和偏见。

情绪识别技术长期以来一直是技术界争议的焦点。虽然早期研究如保罗·艾克曼的情绪理论提出了六种基本情绪，但后续的研究表明，不同文化和背景下的情绪表达差异巨大。英国玛丽女王大学的迈克·库克研究员指出，“情绪体验的复杂性使得情绪检测几乎不可能做到准确”。此外，研究表明，现有的面部表情分析系统常常对某些情感产生偏见，如微笑或不同种族面部表情的差异。

随着情绪识别技术逐渐商业化，其可能带来的滥用风险引起了各方关注。部分专家担心，这类技术可能被用于执法、招聘等领域，进一步加剧社会的不平等。欧盟的人工智能法案已经针对情绪识别技术提出了严格的限制，尤其是在高风险环境中的应用。

谷歌则坚称，PaliGemma2在测试阶段已充分考虑了伦理和安全问题，尤其是儿童和内容安全方面。然而，这些保证是否足够，仍需受到严格审视。AI Now Institute的Heidy Khlaaf博士表示，情绪识别不仅是视觉问题，还涉及深层的社会和文化背景，“仅凭面部特征无法准确推断情绪”。

随着这一技术的公开发布，PaliGemma2不仅将推动人工智能在图像理解领域的应用，也将对社会伦理和数据隐私提出新的挑战，亟需相关监管机构的关注和干预。

抖音副总裁否认AI团队大变阵：都是不实信息

李亮指出，一篇题为《字节AI团队大变阵》的文章中存在多处不实信息。文章中提及的技术副总裁杨震原即将退休、冯佳时将离职创业等说法，均为错误信源所致。此外，关于张一鸣拜访豌豆荚创始人王俊煜及上海模速空间创业公司的报道，同样与事实不符。

OpenAI 在全球扩展人工智能代理服务Operator，提升用户体验

OpenAI 于上周五宣布，正在为澳大利亚、巴西、加拿大、印度、日本、新加坡、韩国、英国等多个国家的 ChatGPT Pro 用户推出其最新的人工智能代理工具 ——Operator。这一工具的推出标志着 OpenAI 在人工智能领域的一次重要扩展，旨在帮助用户更高效地完成各种日常任务。Operator 自今年1月在美国首次推出以来，便备受关注，成为市场上少数能够代表用户执行任务的 “人工智能代理” 之一。它能够完成多种操作，包括订票、预订餐厅、提交费用报告，甚至在电子商务网站上购物。这些功能不仅

OpenAI宣布面向多个国家推出AI代理 Operator

OpenAI 于周五宣布，将在包括澳大利亚、巴西、加拿大、印度、日本、新加坡、韩国和英国等多个国家，为 ChatGPT Pro 用户推出一款名为 “Operator” 的人工智能代理工具。此工具旨在帮助用户更高效地完成各类任务，包括订票、预订餐厅、提交费用报告和网上购物等。“Operator” 最初于今年1月在美国推出，作为市场上几款 “人工智能代理” 工具之一，OpenAI 希望通过这一产品，为用户提供更便捷的服务。需要注意的是，这一工具目前仅对每月付费200美元的 ChatGPT Pro 用户开放，用户可以通过

马斯克的xAI游戏工作室或将颠覆游戏行业：Grok 3助力快速游戏开发

埃隆·马斯克（Elon Musk）旗下的人工智能公司xAI宣布，其新成立的游戏工作室将彻底改变游戏行业的现状。据悉，该工作室将利用最新发布的AI模型Grok3，让游戏开发变得前所未有的高效与便捷。用户现已能够在短短几分钟内通过Grok3生成完整的游戏，甚至只需简单提问即可提升游戏的图形质量。图源备注：图片由AI生成，图片授权服务商MidjourneyxAI游戏工作室的这一创新引发了业界广泛关注。报道称，Grok3已展示出强大的游戏生成能力，其中包括10款由AI驱动的游戏范例。值得一提的是，首款