谷歌于2025年1月22日正式发布了其 Gemini2.0Flash Thinking 推理模型的增强版,再次夺回 Chatbot Arena 的榜首。此版本的升级主要集中在长上下文的处理能力上,能够支持高达1M token 的输入,为用户在处理长篇文本时提供了更深入的分析能力。谷歌 AI 负责人 Jeff Dean 在发布会上表示,此次实验性更新旨在提高模型的可靠性,并减少模型生成的思想与最终答案之间的矛盾。Gemini2.0Flash Thinking 不仅延续了原有版本的优点,还新增了基于思维(thoughts)增强推理能力的功能,表现出色。在技术层面,Gemini2
谷歌近日宣布,将于2025年1月23日发布其全新升级的 AI 模型 ——“Gemini2.0Flash Thinking Exp-0123”。该模型是现有 “Exp-1219” 的进一步优化,主要聚焦于增强推理能力以及思维透明度。随着 AI 技术的迅猛发展,谷歌致力于通过此次升级,让机器不仅能够生成答案,更能够清晰地展现出其思考过程,极大提升了用户对 AI 工作原理的理解。Gemini2.0的一大亮点在于其能够生成 “思考过程”,这一功能将为开发者和研究人员提供更大的便利。通过集成到 Google AI Studio,开发者可以利用这一工具进行更
近日,一项由奥地利复杂科学研究所(CSH)主导的研究显示,尽管大型语言模型(LLMs)在多项任务中表现优异,但在应对高级历史问题时却暴露了短板。研究团队针对三大顶尖模型进行测试,包括 OpenAI 的 GPT-4、Meta 的 Llama 和谷歌的 Gemini,结果让人失望。图源备注:图片由AI生成,图片授权服务商Midjourney为了评估这些模型在历史知识上的表现,研究者们开发了一个名为 “Hist-LLM” 的基准测试工具。该工具依据 Seshat 全球历史数据库,旨在验证 AI 回答历史问题的准确性。研究结果在知名人工智
据华尔街日报报道,在所有AI订阅服务中,ChatGPT Plus展现出了惊人的用户粘性,其6个月后的付费用户留存率高达71%,位居行业第一。这份由Earnest Analytics提供的数据显示,紧随其后的是Anthropic的Claude Pro服务,留存率达到62%。Google的Gemini Advanced以60%的留存率位列第三,而Perplexity Pro和Character.AI(c.ai+)的留存率分别为49%和47%。与此同时,OpenAI正在为ChatGPT Plus、Pro和Teams用户推出新功能,允许用户设置定时或周期性任务。该公司表示,企业版用户也将很快获得这项功能,免费用户未来同样会享受