Meta 在提高人工智能效率方面迈出了重要一步。这家科技巨头于本周三发布了预训练模型,采用了一种新颖的多标记预测方法(multi-token-prediction),可能改变大型语言模型(LLMs)的开发和部署方式。

image.png

项目入口:https://top.aibase.com/tool/multi-token-prediction

这种新技术首次在 Meta 今年四月的一篇研究论文中提出,与传统的训练 LLMs 只预测序列中下一个单词的方法不同。Meta 的方法要求模型同时预测多个未来单词,有望提高性能并大幅缩短训练时间。

Meta 的多标记预测方法可能提供一种抑制这种趋势的方法,使高级人工智能更易于获取和可持续。

这种新方法的潜力不仅限于提高效率。通过同时预测多个标记,这些模型可能会对语言结构和上下文产生更细致的理解。这可能会改善从代码生成到创意写作等任务,从而有可能弥合人工智能与人类水平的语言理解之间的差距。

Meta 在Hugging Face 上以非商业研究许可发布这些模型,这符合该公司对开放科学的承诺。但这也是在竞争日益激烈的人工智能领域采取的一项战略举措,开放可以加快创新和人才获取。

初始版本专注于代码完成任务,这一选择反映了人工智能辅助编程工具市场的增长。随着软件开发与人工智能的联系越来越紧密,Meta 的贡献可能会加速人机协作编码的趋势。