法国初创公司Mistral AI计划于2024年开源GPT-4级别模型,最近获得4.15亿美元融资并推出API服务。公司正在开发表现优异的多语言模型Mistral Medium,引起业内关注。同时,关于OpenAI可能发布GPT-4.5的传言也在传播,使2024年成为开源大语言模型领域充满期待和竞争的一年。
法国初创公司Mistral AI计划于2024年开源GPT-4级别模型,最近获得4.15亿美元融资并推出API服务。公司正在开发表现优异的多语言模型Mistral Medium,引起业内关注。同时,关于OpenAI可能发布GPT-4.5的传言也在传播,使2024年成为开源大语言模型领域充满期待和竞争的一年。
近日,谷歌和 OpenAI 之间的竞争再次升温。在新版 GPT-4o 刚刚登顶 AI 竞技榜后仅一天,谷歌便推出了最新的试验版模型 Gemini-Exp-1121,迅速夺回了冠军宝座。就在一周前,谷歌刚发布了 Gemini-Exp-1114,这似乎表明谷歌对 OpenAI 的动态反应非常迅速。谷歌 DeepMind 的首席科学家 Jack Rae 对此表示,这是一场 “闪电战”,暗示着后期训练的迭代速度比预训练更为迅速。根据官方信息,Gemini-Exp-1121在多个方面进行了显著提升,主要体现在代码能力、推理能力和视觉理解能力的增强。此外,该模型在复杂
OpenAI 为其 ChatGPT Plus 订阅用户推出了最新的大型语言模型(LLM)升级——ChatGPT-4o 的“创意写作”功能。据 OpenAI 在 X(原 Twitter)上的简短声明,升级后的模型写作能力更自然、更引人入胜,并可根据用户需求进行定制,提高内容的相关性和可读性。此次升级后,ChatGPT-4o 被认为在创意写作领域达到了新的高度。一些用户甚至形容它的说唱歌词创作能力可媲美 Eminem。一位名为 Kyle 的用户表示:“两年来,我一直测试语言模型创作风格复杂的说唱歌词。现在的 ChatGPT-4o 首次完美捕捉到了复杂的内
在开源AI领域,与大型科技公司的差距不仅仅体现在算力上。AI2(前Allen人工智能研究所)正通过一系列开创性举措缩小这一鸿沟,其最新发布的Tülu3后训练方案,让"原始"大语言模型转化为实用AI系统变得触手可及。与普遍认知不同,基础语言模型在预训练后并不能直接投入使用。事实上,后训练过程才是决定模型最终价值的关键环节。正是在这个阶段,模型从一个"无所不知"却缺乏判断力的网络,转变为具有特定功能导向的实用工具。长期以来,各大公司对后训练方案讳莫如深。虽然任何
OpenAI 宣布对其旗舰模型 GPT-4o 进行了重大升级,进一步提升了其在推理、跨媒体和对话能力等方面的表现。此次更新被称为 ChatGPT-4o(20241120),旨在为用户提供更自然、引人入胜的文本生成体验。在升级之前,OpenAI 对 GPT-4o 进行了严格的性能测试,这一过程在一个名为 “Chatbot Arena” 的大型语言模型(LLM)评估平台上进行。通过与其他模型进行对比,用户们在不知道模型名称的情况下,使用两个模型进行对话,最终 GPT-4o 在各项指标中脱颖而出,位列第一,超越了 Gemini-Exp-1114。此外,Open