zh
AI产品榜
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
AI产品榜
搜索全球AI产品动态
搜索全球AI信息,发现AI新机遇
新闻资讯
产品应用
变现案例
AI教程
类型 :
新闻资讯
产品应用
变现案例
AI教程
2025-01-09 09:48:24
.
AIbase
.
14.6k
微软正式开源超强小模型Phi-4 性能测试超越GPT-4o、Llama-3.1
微软近期在 Hugging Face 平台上发布了名为 Phi-4的小型语言模型,这款模型的参数量仅为140亿,但在多项性能测试中表现出色,超越了众多知名模型,包括 OpenAI 的 GPT-4o 及其他同类开源模型如 Qwen2.5和 Llama-3.1。在之前的在美国数学竞赛 AMC 的测试中,Phi-4获得了91.8分,显著优于 Gemini Pro1.5、Claude3.5Sonnet 等竞争对手。更令人惊讶的是,这款小参数模型在 MMLU 测试中取得了84.8的高分,充分展现了其强大的推理能力和数学处理能力。与许多依赖于有机数据源的模型不同,Phi-4采用了创新的方法来生
2024-09-11 09:53:30
.
AIbase
.
11.7k
想做OpenAI替代品!SuperNova:为企业定制、遵循指令的大语言模型
Arcee AI 推出 SuperNova,一款针对企业部署的 700 亿参数大型语言模型,旨在提供强大、可拥有、注重数据隐私、模型稳定性和定制化的 AI 解决方案。SuperNova 采用 Meta 的 Llama-3.1-70B-Instruct 架构,并通过创新的后训练过程,具备先进指令遵循能力。它支持企业完全定制,并允许在企业自有云环境中部署,确保数据隐私和稳定性。与基于 API 的服务相比,SuperNova 提供了更灵活的控制和稳定性。此外,SuperNova 支持模型的微调和持续改进,允许根据企业需求进行个性化调整。Arcee 还发布了开源组件,包括免费 API、8B 参数的开源版本模型和数据集生成管道,以促进开发者社区的评估和定制。SuperNova 的性能在数学推理领域表现出色,并提供了对第三方评估的开放性,以验证其性能声明。此模型的发布反映了企业对 AI 解决方案控制和定制需求的增长,以及对数据隐私和模型稳定性的重视。
2024-08-21 09:46:13
.
AIbase
.
11.2k
Llama3压缩版!Nvidia推小型语言模型Llama-3.1-Minitron4B 仅4亿参数
Nvidia研究团队利用模型剪枝和蒸馏技术,成功推出Llama-3.1-Minitron4B,这是Llama3模型的压缩版本,旨在实现设备上的人工智能。该模型通过深度剪枝和宽度剪枝技术,减少了原始8B模型的参数量,同时保持了与更大模型相近的性能。在训练数据量大幅减少(40倍)的情况下,该模型在MMLU基准测试中的性能提升了16%。该成果通过NVIDIA的NeMo-Aligner进行微调,适用于指令跟随、角色扮演、检索增强生成(RAG)和函数调用等任务。宽度剪枝版本已发布于Hugging Face平台,支持商业使用,为用户和开发者提供高效、性能卓越的模型选择。