LLM 不靠谱！研究：AI 聊天机器人提供了错误的癌症治疗建议

站长之家

发布于AI新闻资讯 · 1 分钟阅读 · 2023年8月30号 14:31

在最近发表在《JAMAOncology》杂志上的一篇文章中，研究人员评估了由人工智能算法驱动的大型语言模型驱动的聊天机器人是否可以提供准确可靠的癌症治疗建议。研究结果显示，聊天机器人提供的建议与 NCCN 指南不完全一致，且有 33.33% 的建议存在错误。研究强调了 AI 技术渗透医疗决策时需谨慎和监管的必要性。这项研究的发现提示了医疗保健提供者需要教育病人关于 AI 技术可能存在的错误信息风险，并呼吁制定针对 AI 和其他潜在危害的技术的联邦法规。

硅基流动CEO否认曾拒绝DeepSeek入股:是对未合作表遗憾

近日，围绕硅基流动完成Pre-A轮融资的报道引发了一场关于公司早期发展历程的讨论。创投日报此前报道称，2023年下半年DeepSeek创始人梁文锋曾提出入股硅基流动的意向，条件是开源其自研LLM推理引擎，但遭到了硅基流动CEO袁进辉的拒绝。对此，袁进辉今日在朋友圈作出回应，否认了上述说法。他表示自己提及2023年未与梁文锋展开合作，是在表达对自身缺乏远见的遗憾，而非如报道所述拒绝了投资意向。据了解，成立于2023年8月的硅基流动专注于开发大模型时代的AI基础设施平台。该公司通

微软发布 OmniParser V2.0：把屏幕截图转化成LLM可处理的结构化格式

微软近日发布了 OmniParser V2.0，这是一个旨在将用户界面（UI）截图转换为结构化格式的全新解析工具。OmniParser 能够提高基于大型语言模型(LLM)的 UI 代理的性能，帮助用户更好地理解和操作屏幕上的信息。该工具的训练数据集包括一个可交互图标检测数据集，该数据集从热门网页中精心挑选并自动注释，以突出可点击和可操作的区域。此外，还有一个图标描述数据集，旨在将每个 UI 元素与其对应的功能相结合。在 V2.0版本中，OmniParser 进行了显著改进，更新后的数据集更大且更干净，图标的

AI 聊天机器人在时事问题上频频出错，BBC 研究揭示事实扭曲

最近，英国广播公司（BBC）的一项研究揭示，领先的人工智能助手在回答与新闻和时事相关的问题时，常常产生误导性和不准确的内容。研究表明，ChatGPT、Gemini 和 Perplexity 四种主流 AI 工具所生成的回答中，有超过一半被认为存在 “重大问题”。图源备注:图片由AI生成，图片授权服务商Midjourney研究人员要求这四款生成式 AI 工具使用 BBC 的新闻文章作为来源，回答100个相关问题。随后，这些回答由专业的 BBC 记者进行评估。结果显示，大约五分之一的答案中包含数字、日期或陈述的事实错误

Meta AI推出MILS系统教导 LLMs无需专门培训即可处理多媒体数据

Meta AI的研究人员与学术伙伴共同开发了一种创新系统——MILS（多模态迭代LLM求解器），该系统能在无需经过专门训练的情况下，教大型语言模型处理图像、视频和音频。MILS依赖于语言模型的自然问题解决能力，而非大量的数据训练，展现了其独特的优势。MILS的工作原理是通过将两个AI模型配对来进行任务解决:一个是“生成器”，负责提出任务解决方案，另一个是“评分器”，用来评估生成方案的效果。评分器提供的反馈可以帮助生成器不断优化答案，直到达到令人满意的结果。举例来说

AI新闻资讯

LLM 不靠谱！​​研究：AI 聊天机器人提供了错误的癌症治疗建议

站长之家

相关AI新闻推荐

硅基流动CEO否认曾拒绝DeepSeek入股:是对未合作表遗憾

微软发布 OmniParser V2.0：把屏幕截图转化成LLM可处理的结构化格式

​AI 聊天机器人在时事问题上频频出错，BBC 研究揭示事实扭曲

Meta AI推出MILS系统 教导 LLMs无需专门培训即可处理多媒体数据

LLM 不靠谱！研究：AI 聊天机器人提供了错误的癌症治疗建议

AI 聊天机器人在时事问题上频频出错，BBC 研究揭示事实扭曲

Meta AI推出MILS系统教导 LLMs无需专门培训即可处理多媒体数据