zh
红薯智语
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
红薯智语
搜索全球AI产品动态
搜索全球AI信息,发现AI新机遇
新闻资讯
产品应用
变现案例
AI教程
类型 :
新闻资讯
产品应用
变现案例
AI教程
2024-10-21 10:42:51
.
AIbase
.
12.6k
高质量数据才是王道!EPFL 研究:训练数据对大模型性能至关重要!
瑞士洛桑联邦理工学院 (EPFL) 的一项最新研究比较了两种主流的大型语言模型 (LLM) 适应性训练方法:上下文学习 (ICL) 和指令微调 (IFT)。研究人员使用 MT-Bench 基准测试来评估模型遵循指令的能力,发现在特定情况下,两种方法的表现各有优劣。研究发现,当可用的训练样本数量较少时(例如不超过50个),ICL 和 IFT 的效果非常接近。这表明在数据有限的情况下,ICL 或许可以作为 IFT 的替代方案。然而,随着任务复杂度的增加,例如在多轮对话场景中,IFT 的优势就变得明显。研究人员认为,
2024-09-06 09:02:00
.
AIbase
.
11.6k
DeepSeek又更新!DeepSeek V2.5聊天模型代码能力飞跃,性能全面提升
DeepSeek-V2.5在人工智能领域展现卓越性能,特别是在代码编写和聊天模型方面,通过与GPT-4的对比测试,其在多个指标上取得显著提升,包括胜率、MT-Bench和AlignBench分数。在代码生成能力上,DeepSeek-V2.5的HumanEval评分达到89%,LiveCodeBench评分达到41%,显示了生成高质量、可执行代码的能力。此外,DeepSeek团队还开发了Fire-Flyer AI-HPC框架,优化了硬件和软件设计,实现性能提升、成本节约和节能效果,与NVIDIA DGX-A100相比,成本降低50%,能耗降低40%。