谷歌最近发布了开源大模型Gemma,在开源界引起轰动。然而,在国内开源大模型领域,InternLM2居于榜首,表现优异,完胜了Gemma和Llama。开源大模型领域的竞争日趋激烈,各大科技厂商纷纷推出自家产品,大模型战场变得愈发热闹。
据第一财经报道,DeepSeek 开源大模型 DeepSeek-V2的关键开发者罗福莉将加入小米,担任小米 AI 实验室的领导,并负责大模型团队的建设。这一消息引起了广泛关注,尤其是在小米计划加强其在大模型领域的布局之际。图源备注:图片由AI生成,图片授权服务商Midjourney据知情人士透露,小米创始人雷军对公司在 AI 大模型领域的起步较晚表示担忧,因此决定高薪挖角罗福莉。罗福莉的背景相当亮眼,她拥有北京大学计算语言学研究所的硕士学位,并在自然语言处理领域的顶级会议 ACL2019上发表了
话说最近的科技圈,AI的战火那是烧得正旺,各路豪杰纷纷亮出自己的看家本领。而曾经被认为有些“落后”的谷歌,最近却突然发力,一连串的“王炸”级新品,让投资者们眼前一亮,惊呼: “AI界,又要变天了!”《金融时报》在周日(12月22日)的一篇报道中指出,谷歌在本月通过发布更先进的AI模型,让投资者们刮目相看。这些模型在基准测试中的表现,甚至超越了一些竞争对手。就像一位武林高手,突然使出了绝世武功,让江湖顿时风云变色。不仅如此,谷歌还推出了一款新的自研A
近日,一项新的研究论文揭示了不同 AI 语言模型在合作能力方面的显著差异。研究团队采用了一种经典的 “捐赠者游戏”,测试了 AI 代理在多代合作中如何共享资源。结果显示,Anthropic 的 Claude3.5Sonnet 表现出色,成功建立了稳定的合作模式,获得了更高的资源总量。而谷歌的 Gemini1.5Flash 和 OpenAI 的 GPT-4o 则表现不佳,尤其是 GPT-4o 在测试中逐渐变得不合作,Gemini 代理的合作程度也十分有限。研究团队进一步引入了惩罚机制,以观察不同 AI 模型的表现变化。结果发现,Claude3.5的表现有了显
最近,Answer.AI 和 LightOn 联合发布了开源语言模型 ModernBERT,这是对谷歌 BERT 的重大升级。根据开发者的介绍,ModernBERT 在处理速度、效率和质量上都有了显著提升。该模型可以比其前身快四倍,同时使用更少的内存。ModernBERT 的设计允许它处理长达8192个标记的文本,这比现有编码模型的典型512标记限制提高了16倍。此外,ModernBERT 还是首个经过广泛训练的编程代码编码模型,它在 StackOverflow 问答数据集上的得分超过80,创造了编码模型的新纪录。在通用语言理解评估(GLUE)中,ModernBERT-Large