14万亿token训练量加持:Falcon3挑战主流开源AI模型

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年12月20号 9:33

223

阿布扎比技术创新研究院（TII）发布新一代开源AI模型Falcon3，凭借14万亿token的训练量和优化的架构设计，在消费级硬件上的性能表现创下新纪录。这一训练规模是其前代产品Falcon2的两倍有余。

Falcon3系列共推出四种规格:1B、3B、7B和10B，每种规格均提供基础版和针对对话优化的Instruct版本。尽管专门提供英语、法语、西班牙语和葡萄牙语版本，但各型号都能处理大多数常用语言。

在Hugging Face的第三方语言模型评测中，Falcon3击败了包括Meta的Llama-3.1-8B、Qwen2.5-7B、Mistral的NeMo-12B和谷歌的Gemma2-9B在内的主流开源模型，展现出强劲的竞争力。

Falcon3在相关基准测试中的表现优于 Mistral、阿里巴巴、Meta 和谷歌等类似规模的竞争对手。| 图片:技术创新研究所

TII特别强调了模型的易用性，确保与标准API和库的兼容性，并为特定硬件配置提供资源优化的量化版本。同时，研究院还推出了一款免费的聊天机器人，供用户测试和反馈。该产品在界面设计上借鉴了ChatGPT的成功经验，实现了项目文件夹等类似功能。

展望未来，TII计划在2025年初扩展Falcon3系列的能力，将推出支持图像、视频和语音处理的多模态模型。目前，所有型号均可在Hugging Face平台上免费下载，采用基于Apache2.0的TII Falcon许可证，其中包含了促进负责任AI使用的指导原则。

Falcon Chat 与 ChatGPT 界面非常相似，并且内置了类似的功能。| 图片:THE DECODER 的截图

这次发布标志着开源AI领域的又一重要进展，尤其是在提升消费级硬件上的AI性能方面取得了突破性成就。随着多模态能力的加入，Falcon3有望在2025年为AI开源社区带来更多创新应用可能。

HuggingFace发布AI Agent课程

Hugging Face 近期推出了一门名为 “Agent课程” 的在线学习课程，旨在帮助学习者深入理解智能Agent的基础知识及应用。课程内容丰富，共分为五个单元，从Agent的基本概念到最终的作业评估，循序渐进，帮助学员掌握所需技能。课程的首个单元为 “欢迎来到课程”，提供了课程的概述、指导方针以及所需工具，确保学员在学习过程中拥有良好的基础。接下来是 “Agent简介” 单元，学员将了解智能Agent的定义、大型语言模型（LLMs）的概念以及特殊符号的使用。第三个单元聚焦于各种框架的介

全球开源大模型榜单揭晓，阿里通义千问独占鳌头

近日，全球最大人工智能开源社区 Huggingface 发布了最新的开源大模型排行榜（Open LLM Leaderboard），结果显示，排名前十的开源大模型全都是基于阿里通义千问(Qwen)开源模型进行二次训练的衍生模型。这一成就标志着 Qwen 在开源 AI 领域的主导地位，进一步推动了其在全球的影响力。Open LLM Leaderboard 被广泛认为是当前最权威的开源大模型榜单，测试维度涵盖了多个领域，包括阅读理解、逻辑推理、数学计算及事实问答等。令人惊讶的是，通义千问 Qwen 已经发展成为全球最大的开源模型族群，其

黑客利用 “损坏” pickle 文件在 HuggingFace 上传恶意 AI 模型

近日，网络安全研究人员发现，在知名机器学习平台 HuggingFace 上，有两个恶意的机器学习模型悄然上传。这些模型使用了一种新奇的技术，通过 “损坏” 的 pickle 文件成功规避了安全检测，令人担忧。ReversingLabs 的研究员卡洛・赞基（Karlo Zanki）指出，从这些 PyTorch 格式的存档中提取的 pickle 文件开头，暗示了其中包含恶意的 Python 代码。这些恶意代码主要是反向 shell，能够连接到硬编码的 IP 地址，实现黑客的远程控制。这种利用 pickle 文件的攻击方法被称为 nullifAI，目的是绕过现有的安全

告别复杂编程:Hugging Face发布首个机器人基础模型Pi0

Hugging Face与Physical Intelligence联手推出了划时代的机器人基础模型Pi0，这是首个能将自然语言命令直接转化为机器人动作的开源模型，标志着机器人技术进入新纪元。Pi0模型在七个不同机器人平台上经过训练，掌握了68种独特任务，能够执行从折叠衣物到收拾桌子等复杂操作。该模型采用创新的流匹配技术，以50Hz的频率生成平滑的实时动作轨迹，确保了极高的精确度。更值得注意的是，研发团队同步推出了升级版Pi0-FAST，采用全新的频率空间动作序列标记方案，使训练速度提升5倍，并展现出