字节跳动联合北京大学打造MegaScale：用于训练LLM的单一“万卡集群”

开源中国

发布于AI新闻资讯 · 1 分钟阅读 · 2024年2月29号 11:20

100

字节跳动联合北京大学的研究团队在arXiv发表论文，介绍了他们用于训练大语言模型的生产系统MegaScale。MegaScale搭建了超过10000块GPU的单一集群，实现了55.2%的模型FLOP利用率。该系统还包含一套诊断工具用于监控系统组件和事件，找出根本原因，并实现容错和缓解滞后问题。

抖音副总裁澄清疑掀大模型价格战：通过技术创新来降低使用成本

今日，抖音副总裁李亮就有关字节跳动可能掀起大模型价格战的传闻发表了看法。他在社交媒体上明确表示，这并非价格战，而是通过技术创新来降低 AI 模型的使用成本。据了解，在火山引擎Force大会上，字节跳动正式发布了豆包视觉理解模型，同时公布其售价为千tokens输入0.003元，比行业平均价格便宜85%。对于字节跳动再掀大模型价格战这一传闻，抖音副总裁李亮发文回应称:这不是价格战。他表示，豆包大模型通过技术创新来降低成本，在算法、软件工程和硬件方案上做了非常多优化，

抖音副总裁否认掀大模型价格战：推动AI技术的普惠和应用发展

今日，针对字节跳动可能再掀大模型价格战的传闻，抖音副总裁李亮在社交媒体上发表了声明，明确表示这并不是价格战。李亮指出，豆包大模型通过技术创新降低了成本，在算法、软件工程和硬件方案上进行了大量优化。他提到，3厘/千tokens的定价不仅具有可观的毛利，而且是透明的定价策略，并非传统的“刊例价折扣”模式。

苹果与腾讯、字节洽谈AI合作计划在中国市场整合本地AI模型

据路透社援引三位知情人士的消息，苹果公司正在与腾讯和字节跳动展开谈判，探讨将这两家中国公司的人工智能（AI）模型整合至中国市场销售的iPhone中。这一举措是苹果AI系统Apple Intelligence的一部分，而从本月开始，苹果已在全球市场的iPhone中整合了ChatGPT聊天机器人功能。图源备注：图片由AI生成，图片授权服务商Midjourney知情人士透露，苹果与腾讯和字节跳动的讨论主要涉及利用后两者的AI模型。这一谈判目前尚处于早期阶段，细节仍未敲定。值得注意的是，此前有媒体曾报道，苹果曾

到底谁在大量买英伟达AI芯片啊？微软领跑，字节跳动、腾讯紧随其后

尽管Nvidia（英伟达）在12月表现低迷，股价持续走低，市场分析师认为这可能与竞争加剧以及人工智能支出放缓有关，但今日股价有所回升。然而，截至发稿时，本月股价仍下跌近3%，预示着这家公司在经历了显著增长的一年后，可能会以平淡收尾。人工智能支出是否会放缓到足以影响Nvidia，目前尚不明确。但一家科技咨询公司最近发布了一份报告，揭示了他们预估的Nvidia芯片最大买家。这份名单上既有科技巨头，也有一些看似不太可能成为顶级人工智能芯片买家的公司。谁在大量购买Nvid

AI新闻资讯