Meta近日宣布,推出其Llama系列的最新成员——Llama3.370B。Meta的生成式AI副总裁Ahmad Al-Dahle在X平台上发布了这一消息,并指出,Llama3.370B在性能上相较于Meta之前最大的Llama模型Llama3.1405B取得了显著进步,同时成本大幅降低。

Al-Dahle表示,通过利用训练后的最新技术,Llama3.370B不仅提升了性能,而且降低了运营成本。根据Meta发布的基准测试结果,Llama3.370B在多个领域超过了谷歌的Gemini1.5Pro、OpenAI的GPT-4和亚马逊新发布的Nova Pro,尤其在评估模型理解语言能力的MMLU测试中表现优异。

1733539490180.png

该模型现已可以从Hugging Face和Llama官方平台等来源下载,Meta的这一举措旨在通过“开放”模型来主导AI领域。Meta的Llama模型可以应用于多种场景,并支持商业化,虽然Meta对一些开发者设定了使用限制,要求每月用户超过7亿的平台申请特别许可。尽管如此,Llama模型的下载量已突破6.5亿次,表明其在全球AI开发者中受到了广泛欢迎。

为了支撑未来更大规模的AI模型训练,Meta正在大力投资计算基础设施。该公司近日宣布将在路易斯安那州建设一个100亿美元的AI数据中心,这是Meta迄今为止规模最大的AI数据中心。扎克伯格在财报电话会议中提到,为了训练下一代Llama4模型,所需的计算能力将是Llama3的10倍。Meta目前已采购超过10万个Nvidia GPU集群,与xAI等竞争对手的资源相匹敌。

随着生成式AI模型训练的成本不断攀升,Meta的资本支出也呈现增长趋势,2024年第二季度的资本支出增长了近33%,达到了85亿美元。这一增长主要得益于Meta在服务器、数据中心和网络基础设施上的持续投资。