文章分析了当前大模型领域的发展现状和面临的困境。大模型应用日渐成熟,从模型端向应用端延伸,解决行业痛点。但创业公司面临技术人才、数据等资源的短缺,以及来自大公司的竞争压力。商业化路径包括面向开发者的云服务与面向行业的定制化解决方案。投资降温也增加了创业的难度。
Meta AI近日重磅开源了名为SPIRIT LM的基础多模态语言模型,该模型能够自由混合文本和语音,为音频和文本的多模态任务打开了新的可能性。SPIRIT LM基于一个70亿参数的预训练文本语言模型,通过在文本和语音单元上进行持续训练,扩展到语音模态。它可以像文本大模型一样理解和生成文本,同时还能理解和生成语音,甚至可以把文本和语音混合在一起,创造出各种神奇的效果! 比如,你可以用它来做语音识别,把语音转换成文字;也可以用它来做语音合成,把文字转换成语音;还可以用它来做
亚马逊近日宣布将向 AI 研究领域注入1.1亿美元的资金,以支持开发其自主设计的 Trainium 芯片。这一举措旨在降低亚马逊对 Nvidia 的依赖,并推动自家云计算平台 AWS 的技术进步。图源备注:图片由AI生成,图片授权服务商MidjourneyTrainium 是一款为深度学习训练和推理任务量身定制的机器学习芯片,亚马逊希望通过这一投资,鼓励学术界利用 Trainium 芯片进行新型 AI 架构、机器学习库和性能提升的研究。这一计划名为 “Build on Trainium”,将为大学研究人员提供利用 Trainium 进行大规模分布式计算的
价值190亿美元的AI初创公司Anthropic的CEO Dario Amodei在周三旧金山AI大会上,就人工智能发展风险问题发表了引人深思的见解。虽然他认为目前的AI模型并不会给人类带来即刻威胁,但他对一些同行过于轻视AI风险的论调提出了尖锐批评。针对著名风险投资人Marc Andreessen的观点,Amodei展开了独到的分析。Andreessen曾在今年三月发推文称"限制AI就等同于限制数学、软件和芯片",并将AI简单归结为"数学"。对此,Amodei指出这种逻辑存在根本性缺陷。"如果用这种逻辑,人类大脑不也是数学吗?神经元的放
在开源AI领域,与大型科技公司的差距不仅仅体现在算力上。AI2(前Allen人工智能研究所)正通过一系列开创性举措缩小这一鸿沟,其最新发布的Tülu3后训练方案,让"原始"大语言模型转化为实用AI系统变得触手可及。与普遍认知不同,基础语言模型在预训练后并不能直接投入使用。事实上,后训练过程才是决定模型最终价值的关键环节。正是在这个阶段,模型从一个"无所不知"却缺乏判断力的网络,转变为具有特定功能导向的实用工具。长期以来,各大公司对后训练方案讳莫如深。虽然任何