研究发现，GPT-4 在临床决策中存在潜在种族和性别偏见问题

站长之家

发布于AI新闻资讯 · 1 分钟阅读 · 2023年12月19号 16:48

布里格姆和妇女医院的研究人员评估了 GPT-4 在临床决策中是否存在种族和性别偏见。他们发现，GPT-4 在生成患者案例、制定诊断和治疗计划，以及评估患者特征时存在明显的偏见。研究呼吁对大型语言模型进行偏见评估，以确保其在医学领域的应用不会加剧社会偏见。研究结果已发表在《柳叶刀数字健康》杂志上。

字节跳动发布豆包大模型1.5Pro，性能超越GPT-4o与Claude3.5Sonnet

字节跳动正式推出其最新的豆包大模型1.5Pro（Doubao-1.5-pro），这一新模型在多个领域的综合能力上表现出色，成功超越了行业内知名的 GPT-4o 和 Claude3.5Sonnet。该模型的发布标志着字节跳动在人工智能领域又向前迈出了重要一步。豆包1.5Pro 采用了新型的稀疏 MoE（混合专家）架构，使用较小的激活参数进行预训练。这种设计的创新之处在于其可以提供等效于7倍激活参数的 Dense 模型性能，使其在效率上远超行业常规的 MoE 架构，带来了约3倍的效率提升。这样的设计使得豆包大模型在知识、代码

谷歌发布Titans:仿生设计突破200万Token上下文长度

谷歌研究院近日发布了革新性的"Titans"系列模型架构，通过仿生设计实现了突破性的200万Token上下文长度，并计划在未来开源相关技术。这一架构的核心创新在于引入深度神经长期记忆模块，其设计灵感来源于人类记忆系统。Titans巧妙地结合了短期记忆的快速响应能力和长期记忆的持久性特征，同时运用注意力机制来处理即时上下文，形成了一个高效的信息处理体系。据谷歌介绍，Titans在长序列处理任务中展现出显著优势。无论是在语言建模还是时间序列预测方面，这一架构都实现了突破性

豆包App推出新语音模式，抢先GPT-4o实现唱歌和角色扮演

2025年1月20日，豆包 App 正式发布了其最新的 “端到端” 语音大模型，并对实时语音通话功能进行了重要更新。这一进展标志着豆包在语音交互领域的又一次飞跃，超越了之前的 ASR（自动语音识别）、LLM(大语言模型)和 TTS(文生音频)的级联方案，将语音识别、理解和生成整合在同一个模型中。经过《智能涌现》的测试，新版豆包的最大亮点在于其具备了人类般的表达能力和情感输出，提升了对话的流畅度与智能水平。尤其是 “灵魂歌手” 和 “百变大咖” 模式，让豆包不仅能够进行唱歌，

AI 在高级历史考试中表现不佳：GPT-4 Turbo 准确率仅 46%

近日，一项由奥地利复杂科学研究所（CSH）主导的研究显示，尽管大型语言模型(LLMs)在多项任务中表现优异，但在应对高级历史问题时却暴露了短板。研究团队针对三大顶尖模型进行测试，包括 OpenAI 的 GPT-4、Meta 的 Llama 和谷歌的 Gemini，结果让人失望。图源备注：图片由AI生成，图片授权服务商Midjourney为了评估这些模型在历史知识上的表现，研究者们开发了一个名为 “Hist-LLM” 的基准测试工具。该工具依据 Seshat 全球历史数据库，旨在验证 AI 回答历史问题的准确性。研究结果在知名人工智

AI新闻资讯