AI产品榜

AI产品榜

搜索全球AI产品动态

搜索全球AI信息，发现AI新机遇

新闻资讯
产品应用
变现案例
AI教程

类型 :

新闻资讯
产品应用
变现案例
AI教程

2025-01-17 09:32:27.AIbase

腾讯混元发布浮点量化训练新理论，揭示大模型训练的极限

在大模型（Large Language Model，LLM）快速发展的今天，模型的训练和推理成本日益成为研究和应用的关注焦点。最近，腾讯混元团队发布了一项重要研究，深入探讨了低比特浮点量化训练的 “Scaling Laws”，即浮点数量化训练的规模法则。此项研究的核心在于通过降低模型的精度，探索如何在不损失性能的情况下，显著降低计算和存储成本。研究团队进行了多达366组不同参数规模和精度的浮点数量化训练，系统分析了影响训练效果的多种因素，包括模型大小（N）、训练数据量(D)、指数位(E)、尾

腾讯混元发布浮点量化训练新理论，揭示大模型训练的极限

2024-10-23 13:57:04.AIbase

法律行业大变革：25% 企业通过生成式AI节约运营成本

最近，企业法律行业迎来了一个激动人心的变革。美国企业法务协会（ACC）与 Everlaw 联合发布了一份关于生成 AI(GenAI)对企业法律行业影响的新报告。这份名为《Gen AI 与未来企业法律工作:内部团队准备好了吗?》的报告揭示了生成式 AI 在法律工作中的迅速应用及其对法律职业的深远影响。图源备注:图片由AI生成，图片授权服务商Midjourney报告显示，几乎一半的受访者（49%）认为生成式 AI 将会降低运营成本，很多人甚至在去年这一数据的基础上有了显著的增加。2023年，有33% 的受访者表示，他

法律行业大变革：25% 企业通过生成式AI节约运营成本

2024-07-29 11:34:37.AIbase

Llama 4启动训练 Meta科学家揭秘Llama 3.1训练背后的故事

Meta的科学家Thomas Scialom揭示了Llama3.1的开发秘诀，其405B的参数规模是为了对抗GPT-4。通过增加训练的token数而非架构，Llama3.1实现了模型规模与训练数据总量的优化平衡，达到了知识深度与广度的飞跃。数据选择上，Scialom更倾向于合成数据而非公开互联网文本。Llama3.1的评估与改进采用奖励模型和多样化基准，同时引入了Toolformer等agent工具的开发，标志着AI领域的创新探索。Llama3.1的开源是Meta对未来AI的一次大胆尝试。Llama4的启动将重点放在agent技术上，预示着Meta在AI领域的持续领导地位和未来AI的重新定义。

Llama 4启动训练 Meta科学家揭秘Llama 3.1训练背后的故事

2024-03-06 16:53:05.AIbase

OpenAI与DeepMind的Scaling Laws之争

["OpenAI和DeepMind在Scaling Laws研究中的观点和方法不同","Scaling Laws能预测大模型在参数量、数据量和计算量变动时的损失变化","竞争将推动人工智能发展和人机共存的未来塑造","大语言模型的预训练涉及模型大小、数据量、训练成本的权衡博弈","Scaling Laws可以帮助优化设计决策","DeepMind提出模型大小和数据量应按相等比例扩展，OpenAI倾向选择更大的模型","DeepMind开发了AlphaGo和AlphaFold，展示深度强化学习和神经网络潜力","OpenAI开发了GPT系列模型，展示在生成式模型上的能力","研究结论表明影响模型性能的三个要素相互影响","DeepMind的Chinchilla模型优于之前的大语言模型","国内百川智能和明德大模型也在Scaling Laws研究中有所贡献","DeepMind提出Levels of AGI分类方法，揭示人工智能不同发展阶段"]