zh
红薯智语
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
红薯智语
搜索全球AI产品动态
搜索全球AI信息,发现AI新机遇
新闻资讯
产品应用
变现案例
AI教程
类型 :
新闻资讯
产品应用
变现案例
AI教程
2024-08-21 09:46:13
.
AIbase
.
11.2k
Llama3压缩版!Nvidia推小型语言模型Llama-3.1-Minitron4B 仅4亿参数
Nvidia研究团队利用模型剪枝和蒸馏技术,成功推出Llama-3.1-Minitron4B,这是Llama3模型的压缩版本,旨在实现设备上的人工智能。该模型通过深度剪枝和宽度剪枝技术,减少了原始8B模型的参数量,同时保持了与更大模型相近的性能。在训练数据量大幅减少(40倍)的情况下,该模型在MMLU基准测试中的性能提升了16%。该成果通过NVIDIA的NeMo-Aligner进行微调,适用于指令跟随、角色扮演、检索增强生成(RAG)和函数调用等任务。宽度剪枝版本已发布于Hugging Face平台,支持商业使用,为用户和开发者提供高效、性能卓越的模型选择。
2024-07-26 10:06:52
.
AIbase
.
10.6k
轻松调优!微软针对Phi-3小型语言模型推出无服务器微调功能
微软宣布推出针对Phi-3小型语言模型的无服务器微调功能,允许开发者在Azure AI平台上轻松调整模型性能,无需管理底层基础设施,且初期免费。Phi-3模型,拥有30亿参数,适合企业开发者使用,提供高效性能,成本较低。与OpenAI的GPT-3.5相比,虽参数量较小,但在多种应用中表现相近。无服务器微调简化了操作,降低了门槛,并支持小型和中型模型的微调。这一功能的发布旨在帮助企业开发者根据需求优化模型,如Khan Academy已应用于教育软件。竞争加剧,微软此举与OpenAI、Meta和Mistral等提供商的竞争,推动AI领域发展。
2024-07-25 11:34:33
.
AIbase
.
10.6k
英伟达推出 Minitron 小型语言模型:训练速度提高 40 倍
英伟达(NVIDIA)近期推出Minitron系列小型语言模型,包含4B和8B版本,显著提升训练速度至40倍,并大幅降低资源和数据需求,实现成本节省。通过结合“修剪”和“知识蒸馏”技术,Minitron模型在保持性能的同时,缩小规模,使得开发者能以更低成本利用先进技术进行翻译、情感分析和对话AI等应用。Minitron模型的开源,让更多人能轻松获取和使用,加速AI技术的普及。
2024-01-23 16:08:09
.
AIbase
.
5.0k
2024 年值得关注的 6 大生成式 AI 趋势
["2023年是人工智能领域长期以来最具颠覆性的一年,大量生成式人工智能产品进入主流。","继续其变革之旅,生成式人工智能有望在2024年从兴奋的话题转变为现实世界的应用。","生成式人工智能领域正在迅速发展,催生了一系列广泛的趋势,这些趋势将促进人工智能在各行各业的采用及其在我们日常生活中的存在。","生成式人工智能模型通过集成多模式多功能性超越了文本创建。"]