谷歌于2025年1月22日正式发布了其 Gemini2.0Flash Thinking 推理模型的增强版,再次夺回 Chatbot Arena 的榜首。此版本的升级主要集中在长上下文的处理能力上,能够支持高达1M token 的输入,为用户在处理长篇文本时提供了更深入的分析能力。
谷歌 AI 负责人 Jeff Dean 在发布会上表示,此次实验性更新旨在提高模型的可靠性,并减少模型生成的思想与最终答案之间的矛盾。Gemini2.0Flash Thinking 不仅延续了原有版本的优点,还新增了基于思维(thoughts)增强推理能力的功能,表现出色。
在技术层面,Gemini2.0Flash Thinking 实现了两大突破:首先,能够处理高达1M token 的长上下文,这对于复杂的多轮对话和推理过程至关重要;其次,模型在自我纠错方面表现显著,能够在对话中保持连贯性并灵活应用之前积累的信息。这意味着用户在与模型互动时,可以体验到更为自然和一致的对话过程。
在一场演示中,Jeff Dean 展示了该模型如何解决物理问题并解释推理过程,令人印象深刻。而且,参与者反馈称,这款最新模型的实际体验甚至比演示中更为迅速。
除了长上下文处理能力,Gemini2.0Flash Thinking 在数学能力测试、科学能力测试和多模态推理能力上也有显著提升,尤其是在数学方面成绩提升了54%。这一系列优异的表现让人们对该模型的未来充满期待。
进入交互界面,用户可以在 “Google AI Studio” 平台上获得全面的模型功能,包括创建提示词、实时对话以及开发应用程序等。虽然当前界面的功能较为分散,但谷歌计划在模型正式发布后,提供更详细的技术报告和用户指引,以便改善用户体验。
展望未来,谷歌的开发团队正在积极探索3D 数据的处理能力,显示出他们对持续创新的坚定信念。可以预见,谷歌在 AI 领域的下一个突破正呼之欲出,值得我们持续关注。
试用链接:https://aistudio.google.com/prompts/new_chat