微软正式开源超强小模型Phi-4 性能测试超越GPT-4o、Llama-3.1

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2025年1月9号 9:48

158

微软近期在 Hugging Face 平台上发布了名为 Phi-4的小型语言模型，这款模型的参数量仅为140亿，但在多项性能测试中表现出色，超越了众多知名模型，包括 OpenAI 的 GPT-4o 及其他同类开源模型如 Qwen2.5和 Llama-3.1。

在之前的在美国数学竞赛 AMC 的测试中，Phi-4获得了91.8分，显著优于 Gemini Pro1.5、Claude3.5Sonnet 等竞争对手。更令人惊讶的是，这款小参数模型在 MMLU 测试中取得了84.8的高分，充分展现了其强大的推理能力和数学处理能力。

与许多依赖于有机数据源的模型不同，Phi-4采用了创新的方法来生成高质量的合成数据，包括多智能体提示、指令反转和自我修正等技术。这些方法大大增强了 Phi-4在推理和解决问题方面的能力，使其能够处理更为复杂的任务。

Phi-4采用了仅解码器的 Transformer 架构，支持长达16k 的上下文长度，非常适合处理大输入的数据。其预训练过程中使用了约10万亿个 token，结合合成数据与经过严格筛选的有机数据，确保在 MMLU 和 HumanEval 等基准测试中表现出色。

Phi-4的特点和优势包括:适用于消费级硬件的紧凑性和高效性;在 STEM 相关任务中超越了前代和更大模型的推理能力;支持与多样化的合成数据集进行微调，便于满足特定领域的需求。此外，Phi-4在 Hugging Face 平台上提供了详细的文档和 API，方便开发者进行集成。

在技术创新方面，Phi-4的开发主要依托三个支柱:生成合成数据的多智能体和自我修正技术，后期训练增强方法如拒绝采样和直接偏好优化（DPO），以及严格过滤的训练数据，确保与基准的重叠数据最小化，提高了模型的泛化能力。此外，Phi-4利用关键标记搜索(PTS)来识别决策过程中的重要节点，从而优化其处理复杂推理任务的能力。

随着 Phi-4的开源，开发者们的期待终于成真。该模型不仅可以在 HuggingFace 平台下载，还支持在 MIT 许可证下进行商业用途。这一开放政策吸引了大量开发者和 AI 爱好者的关注，HuggingFace 的官方社交媒体也对此表示祝贺，称其为 “史上最好的14B 模型”。

模型入口:https://huggingface.co/microsoft/phi-4

划重点:
🧠 ** 微软推出小参数模型 Phi-4，参数仅140亿却超越多款知名模型。**
📊 ** 在多项性能测试中，Phi-4表现优异，特别是在数学与推理方面。**
🌐 Phi-4现已开源，并支持商业用途，吸引了众多开发者的关注与使用。

阿里云通义灵码AI程序员上线 10分钟完成网页开发及美化

阿里云正式上线了其全新的通义灵码 AI 程序员，标志首个能够同时支持 VS Code 和 JetBrains IDEs 开发工具的 AI 编程产品的问世。这款 AI 程序员工具，拥有比传统辅助编程工具更强大的能力，帮助开发者以更高效的方式完成编码任务。通义灵码 AI 程序员通过全程对话协作的方式，能够轻松实现从零开始的业务需求开发、问题修复以及单元测试批量生成等复杂的编码任务。开发者可以与 AI 程序员进行互动，轻松指令并修改代码。该工具的底层模型已升级至 Qwen2.5-coder，其代码生成的准确性和速

闪极全新品牌 loomos 发布 AI 眼镜：引入 GPT-4o 技术，全球众筹即将启动

在2025年的 CES 展会上，闪极正式推出了其海外全新子品牌 loomos，并首发了一款名为 loomos AI 眼镜的新产品。这款眼镜在硬件配置和功能上，与国内版本的闪极 AI「拍拍镜」几乎一致，支持高达4K 的照片拍摄和1080P 的视频录制。不同之处在于，loomos AI 眼镜搭载了由 GPT-4o 驱动的语音助手，能为用户提供即时帮助，如文字翻译、物品识别、记忆车位以及信息检索等。loomos AI 眼镜预计将于1月21日左右在 Kickstarter 平台上开启众筹。官方同时宣布，将在北美和欧洲等地区设立分公司，致力于推动闪

闪极推出新海外品牌 loomos，AI 眼镜搭载 GPT-4o 正式亮相

在2025年 CES 消费电子展上，闪极宣布了其全新海外子品牌 loomos，并推出了最新的 loomos AI 眼镜。这款眼镜的硬件配置和特色功能基本与国内版本的闪极 AI “拍拍镜” 相同，支持拍摄4K 照片和1080P 视频，展现出强大的影像能力。与国内版本不同，loomos AI 眼镜搭载了由 GPT-4o 驱动的语音助手，可以为用户提供即时的帮助，例如文字翻译、物品识别、记忆停车位置和信息检索等实用功能。用户可以通过简单的语音指令，获得所需的信息或服务。据悉，loomos AI 眼镜将于1月21日在 Kickstarter 平台开启

GPT-4o 级别！VITA-1.5：实时视觉与语音交互， 1.5秒互动延迟

近日，VITA-MLLM 团队宣布推出 VITA-1.5，这是该团队在 VITA-1.0基础上推出的升级版本，致力于提升多模态交互的实时性与准确性。VITA-1.5不仅支持英语和中文，还在多项性能指标上实现了显著提升，为用户提供了更流畅的交互体验。在 VITA-1.5中，互动延迟大幅降低，从原来的4秒缩短至仅1.5秒，用户在进行语音交互时几乎感受不到延迟。此外，该版本在多模态性能方面也有显著提高，经过评估，VITA-1.5在 MME、MMBench 和 MathVista 等多个基准测试中的平均性能从59.8提升至70.8，展现了出色的能力。VITA

AI新闻资讯