逻辑推理大翻车!GPT-4、Gemini被曝重大缺陷,LLM严重降智

最近,一项由非营利组织 Epoch AI 进行的研究揭示了 OpenAI 的聊天机器人平台 ChatGPT 的能耗情况,结果显示,ChatGPT 的能耗远低于早期的估算。根据一些报道,ChatGPT 回答一个问题需要约3瓦时的电力,而 Epoch AI 的研究认为这个数据被高估了。研究表明,使用 OpenAI 最新默认模型 GPT-4o 时,平均每个查询仅消耗约0.3瓦时的电力,这一数字甚至低于许多家用电器的能耗。Epoch AI 的数据分析师 Joshua You 表示,传统上人们对 AI 能耗的担忧并没有准确反映出当前的情况。早期的3瓦时估算主要是基于一些
最近,英国广播公司(BBC)的一项研究揭示,领先的人工智能助手在回答与新闻和时事相关的问题时,常常产生误导性和不准确的内容。研究表明,ChatGPT、Gemini 和 Perplexity 四种主流 AI 工具所生成的回答中,有超过一半被认为存在 “重大问题”。图源备注:图片由AI生成,图片授权服务商Midjourney研究人员要求这四款生成式 AI 工具使用 BBC 的新闻文章作为来源,回答100个相关问题。随后,这些回答由专业的 BBC 记者进行评估。结果显示,大约五分之一的答案中包含数字、日期或陈述的事实错误
无线充电供应商Sharge在短短五天内就为其在Kickstarter上推出的Loomos AI眼镜筹集了153万美元。Loomos AI 眼镜配备450mAh 电池,待机时续航时间长达40小时,领先市场。它还配备索尼16MP 摄像头,可拍摄4K 照片(4656x3496),配备双 DSP 放大器的沉浸式开放式耳塞音频,以及5.1虚拟环绕声,带来超清晰的影院级音效。该设备预计售价300美元,但 Kickstarter 上的前几千名支持者可享受折扣。该公司表示,该设备将通过 ChatGPT-4o 提供的即时语音激活帮助轻松保持连接。用户只需说“嘿,Loomos”,它就会回答
Meta AI的研究人员与学术伙伴共同开发了一种创新系统——MILS(多模态迭代LLM求解器),该系统能在无需经过专门训练的情况下,教大型语言模型处理图像、视频和音频。MILS依赖于语言模型的自然问题解决能力,而非大量的数据训练,展现了其独特的优势。MILS的工作原理是通过将两个AI模型配对来进行任务解决:一个是“生成器”,负责提出任务解决方案,另一个是“评分器”,用来评估生成方案的效果。评分器提供的反馈可以帮助生成器不断优化答案,直到达到令人满意的结果。举例来说