LLM 不靠谱!研究:AI 聊天机器人提供了错误的癌症治疗建议

近日,围绕硅基流动完成Pre-A轮融资的报道引发了一场关于公司早期发展历程的讨论。创投日报此前报道称,2023年下半年DeepSeek创始人梁文锋曾提出入股硅基流动的意向,条件是开源其自研LLM推理引擎,但遭到了硅基流动CEO袁进辉的拒绝。对此,袁进辉今日在朋友圈作出回应,否认了上述说法。他表示自己提及2023年未与梁文锋展开合作,是在表达对自身缺乏远见的遗憾,而非如报道所述拒绝了投资意向。据了解,成立于2023年8月的硅基流动专注于开发大模型时代的AI基础设施平台。该公司通
微软近日发布了 OmniParser V2.0,这是一个旨在将用户界面(UI)截图转换为结构化格式的全新解析工具。OmniParser 能够提高基于大型语言模型(LLM)的 UI 代理的性能,帮助用户更好地理解和操作屏幕上的信息。该工具的训练数据集包括一个可交互图标检测数据集,该数据集从热门网页中精心挑选并自动注释,以突出可点击和可操作的区域。此外,还有一个图标描述数据集,旨在将每个 UI 元素与其对应的功能相结合。在 V2.0版本中,OmniParser 进行了显著改进,更新后的数据集更大且更干净,图标的
最近,英国广播公司(BBC)的一项研究揭示,领先的人工智能助手在回答与新闻和时事相关的问题时,常常产生误导性和不准确的内容。研究表明,ChatGPT、Gemini 和 Perplexity 四种主流 AI 工具所生成的回答中,有超过一半被认为存在 “重大问题”。图源备注:图片由AI生成,图片授权服务商Midjourney研究人员要求这四款生成式 AI 工具使用 BBC 的新闻文章作为来源,回答100个相关问题。随后,这些回答由专业的 BBC 记者进行评估。结果显示,大约五分之一的答案中包含数字、日期或陈述的事实错误
Meta AI的研究人员与学术伙伴共同开发了一种创新系统——MILS(多模态迭代LLM求解器),该系统能在无需经过专门训练的情况下,教大型语言模型处理图像、视频和音频。MILS依赖于语言模型的自然问题解决能力,而非大量的数据训练,展现了其独特的优势。MILS的工作原理是通过将两个AI模型配对来进行任务解决:一个是“生成器”,负责提出任务解决方案,另一个是“评分器”,用来评估生成方案的效果。评分器提供的反馈可以帮助生成器不断优化答案,直到达到令人满意的结果。举例来说