阿布扎比技术创新研究院(TII)发布新一代开源AI模型Falcon3,凭借14万亿token的训练量和优化的架构设计,在消费级硬件上的性能表现创下新纪录。这一训练规模是其前代产品Falcon2的两倍有余。
Falcon3系列共推出四种规格:1B、3B、7B和10B,每种规格均提供基础版和针对对话优化的Instruct版本。尽管专门提供英语、法语、西班牙语和葡萄牙语版本,但各型号都能处理大多数常用语言。
在Hugging Face的第三方语言模型评测中,Falcon3击败了包括Meta的Llama-3.1-8B、Qwen2.5-7B、Mistral的NeMo-12B和谷歌的Gemma2-9B在内的主流开源模型,展现出强劲的竞争力。
Falcon3在相关基准测试中的表现优于 Mistral、阿里巴巴、Meta 和谷歌等类似规模的竞争对手。| 图片:技术创新研究所
TII特别强调了模型的易用性,确保与标准API和库的兼容性,并为特定硬件配置提供资源优化的量化版本。同时,研究院还推出了一款免费的聊天机器人,供用户测试和反馈。该产品在界面设计上借鉴了ChatGPT的成功经验,实现了项目文件夹等类似功能。
展望未来,TII计划在2025年初扩展Falcon3系列的能力,将推出支持图像、视频和语音处理的多模态模型。目前,所有型号均可在Hugging Face平台上免费下载,采用基于Apache2.0的TII Falcon许可证,其中包含了促进负责任AI使用的指导原则。
Falcon Chat 与 ChatGPT 界面非常相似,并且内置了类似的功能。| 图片:THE DECODER 的截图
这次发布标志着开源AI领域的又一重要进展,尤其是在提升消费级硬件上的AI性能方面取得了突破性成就。随着多模态能力的加入,Falcon3有望在2025年为AI开源社区带来更多创新应用可能。