AI产品榜

AI产品榜

搜索全球AI产品动态

搜索全球AI信息，发现AI新机遇

新闻资讯
产品应用
变现案例
AI教程

类型 :

新闻资讯
产品应用
变现案例
AI教程

2025-01-09 09:48:24.AIbase

微软正式开源超强小模型Phi-4 性能测试超越GPT-4o、Llama-3.1

微软近期在 Hugging Face 平台上发布了名为 Phi-4的小型语言模型，这款模型的参数量仅为140亿，但在多项性能测试中表现出色，超越了众多知名模型，包括 OpenAI 的 GPT-4o 及其他同类开源模型如 Qwen2.5和 Llama-3.1。在之前的在美国数学竞赛 AMC 的测试中，Phi-4获得了91.8分，显著优于 Gemini Pro1.5、Claude3.5Sonnet 等竞争对手。更令人惊讶的是，这款小参数模型在 MMLU 测试中取得了84.8的高分，充分展现了其强大的推理能力和数学处理能力。与许多依赖于有机数据源的模型不同，Phi-4采用了创新的方法来生

微软正式开源超强小模型Phi-4 性能测试超越GPT-4o、Llama-3.1

2024-09-11 09:53:30.AIbase

想做OpenAI替代品！SuperNova：为企业定制、遵循指令的大语言模型

Arcee AI 推出 SuperNova，一款针对企业部署的 700 亿参数大型语言模型，旨在提供强大、可拥有、注重数据隐私、模型稳定性和定制化的 AI 解决方案。SuperNova 采用 Meta 的 Llama-3.1-70B-Instruct 架构，并通过创新的后训练过程，具备先进指令遵循能力。它支持企业完全定制，并允许在企业自有云环境中部署，确保数据隐私和稳定性。与基于 API 的服务相比，SuperNova 提供了更灵活的控制和稳定性。此外，SuperNova 支持模型的微调和持续改进，允许根据企业需求进行个性化调整。Arcee 还发布了开源组件，包括免费 API、8B 参数的开源版本模型和数据集生成管道，以促进开发者社区的评估和定制。SuperNova 的性能在数学推理领域表现出色，并提供了对第三方评估的开放性，以验证其性能声明。此模型的发布反映了企业对 AI 解决方案控制和定制需求的增长，以及对数据隐私和模型稳定性的重视。

想做OpenAI替代品！SuperNova：为企业定制、遵循指令的大语言模型

2024-08-21 09:46:13.AIbase

Llama3压缩版！Nvidia推小型语言模型Llama-3.1-Minitron4B 仅4亿参数

Nvidia研究团队利用模型剪枝和蒸馏技术，成功推出Llama-3.1-Minitron4B，这是Llama3模型的压缩版本，旨在实现设备上的人工智能。该模型通过深度剪枝和宽度剪枝技术，减少了原始8B模型的参数量，同时保持了与更大模型相近的性能。在训练数据量大幅减少（40倍）的情况下，该模型在MMLU基准测试中的性能提升了16%。该成果通过NVIDIA的NeMo-Aligner进行微调，适用于指令跟随、角色扮演、检索增强生成（RAG）和函数调用等任务。宽度剪枝版本已发布于Hugging Face平台，支持商业使用，为用户和开发者提供高效、性能卓越的模型选择。

Llama3压缩版！Nvidia推小型语言模型Llama-3.1-Minitron4B 仅4亿参数