逻辑推理大翻车！GPT-4、Gemini被曝重大缺陷，LLM严重降智

站长之家

发布于AI新闻资讯 · 1 分钟阅读 · 2024年2月26号 14:30

近期研究发现，大型语言模型在逻辑推理任务中受前提信息呈现顺序影响，乱序可能导致性能下降。谷歌DeepMind和斯坦福研究人员指出，逻辑自然顺序排列的前提可以提高模型表现。对于LLM等模型，改变前提顺序会导致性能下降，需要进一步研究解决。前提顺序对大型语言模型推理表现具有重大影响，仍是挑战。Gemini、GPT-4等存在重大缺陷，LLM表现严重下降。

Android Studio集成Gemini新增多模态功能，开发者可上传图像获取UI代码

谷歌最新宣布，Android Studio中的Gemini助手已升级支持多模态输入功能，开发者现在可以直接将图像附加到提示中，以获取应用程序开发过程中的视觉辅助。这项多模态功能最初在I/O2024大会上亮相，升级后的Gemini现能够"理解简单的线框，并将其转换为可用的Jetpack Compose代码"。在Android Studio Narwal的Canary版本中，Ask Gemini字段新增了"附加图像文件"（支持JPEG或PNG格式）选项。谷歌建议用户使用具有"强烈色彩对比"的图像并提供"清晰的提示"以获得最佳效果。开发者可以上传从简单线框到高保真模型

懂你的AI助手来了！Gemini现在可以根据你的搜索记录回答问题

还在抱怨AI聊天机器人只会“尬聊”?谷歌这次要彻底颠覆你的认知!他们给当家AI模型Gemini喂入了“秘密武器”——你的搜索历史! 没错，Gemini现在能像一位贴心的老友，根据你过往的搜索足迹，量身定制专属答案，让AI真正做到“千人千面”。这项堪称“黑科技”的功能，由Gemini2.0Flash Thinking实验模型强力驱动，就像给Gemini装上了一颗超强“个人档案分析芯片”。当你向Gemini咨询餐厅推荐或旅行攻略时，它不再是泛泛而谈，而是会迅速翻阅你的“搜索日记”，捕捉你近期的美食偏好或旅行目

谷歌全面升级Flash Thinking2.0，深度研究功能开放全体用户

谷歌近日宣布对其推理模型Flash Thinking2.0进行重大升级，同时将深度研究功能的访问权限扩展至所有用户。此次更新带来了多项实用功能，显著提升了人工智能系统的处理能力和用户体验。根据官方介绍，Flash Thinking2.0最新版本新增了文件上传功能，并大幅提高了处理速度。对于Gemini Advanced用户而言，该系统现在能够在单个上下文窗口中处理高达100万个标记的信息量，这意味着AI可以同时分析和理解更大规模的数据集。与此同时，谷歌通过Flash Thinking2.0对深度研究功能进行了优化。升级后的

调查：52%美国成年人使用过AI聊天机器人

美国埃隆大学的一项调查显示，52%的美国成年人都曾使用过像ChatGPT、Gemini、Claude这样的AI大语言模型。这项由北卡罗来纳州埃隆大学“想象数字未来中心”在1月份开展的调查，选取了500名受访者。结果发现，在使用过AI的人群中，34%的人表示至少每天会使用一次大语言模型。其中，ChatGPT最受欢迎，72%的受访者都用过;谷歌的Gemini位居第二，使用率为50% 。图源备注：图片由AI生成，图片授权服务商Midjourney越来越多的人开始和AI聊天机器人建立起特殊的关系。调查显示，38%的用户认为大语言模