法国初创公司Mistral AI计划于2024年开源GPT-4级别模型,最近获得4.15亿美元融资并推出API服务。公司正在开发表现优异的多语言模型Mistral Medium,引起业内关注。同时,关于OpenAI可能发布GPT-4.5的传言也在传播,使2024年成为开源大语言模型领域充满期待和竞争的一年。
法国初创公司Mistral AI计划于2024年开源GPT-4级别模型,最近获得4.15亿美元融资并推出API服务。公司正在开发表现优异的多语言模型Mistral Medium,引起业内关注。同时,关于OpenAI可能发布GPT-4.5的传言也在传播,使2024年成为开源大语言模型领域充满期待和竞争的一年。
最近,一名软件工程师以 “不到一顿 Chipotle 餐的价格” 购买了 OGOpenAI.com 域名,并将其重定向至中国人工智能实验室 DeepSeek 的网站。该实验室在开源 AI 领域崭露头角,吸引了广泛的关注。据软件工程师阿纳奈・阿罗拉(Ananay Arora)向《TechCrunch》透露,他的初衷是为了支持 DeepSeek,因为该实验室最近推出了一款名为 DeepSeek-R1的开放版本模型,声称在某些基准测试中表现优于 OpenAI 的 o1。阿罗拉表示,DeepSeek 的模型可以离线使用,任何具备必要硬件的开发者都可以免费获取,类似于 OpenAI 早
字节跳动正式推出其最新的豆包大模型1.5Pro(Doubao-1.5-pro),这一新模型在多个领域的综合能力上表现出色,成功超越了行业内知名的 GPT-4o 和 Claude3.5Sonnet。该模型的发布标志着字节跳动在人工智能领域又向前迈出了重要一步。豆包1.5Pro 采用了新型的稀疏 MoE(混合专家)架构,使用较小的激活参数进行预训练。这种设计的创新之处在于其可以提供等效于7倍激活参数的 Dense 模型性能,使其在效率上远超行业常规的 MoE 架构,带来了约3倍的效率提升。这样的设计使得豆包大模型在知识、代码
“子曰-o1”是一款14B轻量级单模型,专为消费级显卡设计,能够在低显存设备上稳定运行。该模型采用思维链技术,能够提供详细的解题过程和逻辑推理,其运行思路更接近人类的思考方式。通过“自言自语”和自我纠错的方式,模型可以输出分步解题过程,帮助用户更好地理解和掌握知识。
法国初创公司 Mistral AI,作为开源 AI 领域的崭新力量,近日宣布计划上市,而非被收购。Mistral 的首席执行官兼联合创始人阿图尔・门施((Arthur Mensch))在接受彭博电视采访时表示:“我们并不出售。” 此前曾有传闻称,微软可能会收购该公司,部分原因是微软向 Mistral 投资了1500万欧元(约合1560万美元)并与其建立了合作关系。门施补充说,目前 Mistral 并不需要融资,因为公司拥有充足的资金。Mistral 成立于2023年4月,创始团队由来自谷歌深度学习部门 DeepMind 和 Meta 的前工程师组成。门施表示