在最近的 Gartner IT 研讨会上,分析师们分享了一项引人注目的预测:到2027年,40% 的生成式人工智能(GenAI)解决方案将实现多模态整合,能够同时处理文本、图像、音频和视频。这一比例相比于2023年的1% 有了飞跃式的增长。这项变革将对企业应用产生深远的影响。

AI 医疗

图源备注:图片由AI生成,图片授权服务商Midjourney

Gartner 的高级副总裁 Erick Brethenoux 指出,随着 GenAI 市场向多模态模型的发展,这将有助于捕捉不同数据流之间的关系,并可能在各类数据和应用中扩展 GenAI 的好处。他强调,多模态 GenAI 可以支持人类在不同环境中执行更多任务。

根据2024年 Gartner 生成式人工智能技术热潮周期报告,多模态 GenAI 和开源大语言模型(LLM)被认为具有极高影响力,预计将在未来五年内企业带来显著的竞争优势和市场响应速度。Gartner 还指出,未来十年内,特定领域的 GenAI 模型和自主代理将有望实现主流应用。

分析师 Arun Chandrasekaran 提到,企业在 GenAI 生态系统中的导航将会充满挑战,因为技术和供应商的环境变化迅速。尽管目前 GenAI 处于 “失望的低谷”,但随着行业整合的开始,真正的好处将在炒作消退后显现,能力的提升也将快速推进。

多模态 GenAI 的转型将增强企业应用,引入更多新功能。目前许多多模态模型仅限于处理两到三种模式,但预计这种多样性在未来几年将会增加。Brethenoux 提到,现实生活中,人们通过音频、视觉和感觉的结合来理解信息,因此多模态 GenAI 至关重要。

对于开源大语言模型,Chandrasekaran 指出,其为企业提供了创新潜力,可以通过定制、隐私与安全控制、模型透明性等方面,降低对特定供应商的依赖。最终,开源 LLM 能够提供更小、更易训练的模型,助力企业核心业务流程。

特定领域的 GenAI 模型针对特定行业或任务进行了优化,能够改善企业内用例的对齐,并提升准确性和安全性。Chandrasekaran 进一步表示,这些模型能够实现更快的价值体现,更好的性能,以及更强的安全性,鼓励组织在更广泛的用例中采用 GenAI。

自主Agent系统可以在没有人类干预的情况下实现目标,利用 AI 技术识别模式、做出决策和生成输出。Brethenoux 强调,自主代理代表了 AI 能力的重大飞跃,这将推动业务运营的改善和客户体验的提升,同时也可能导致组织内从执行到监督的工作模式转变。

划重点:

🌟 到2027年,40% 的生成式人工智能解决方案将实现多模态整合,较2023年大幅提升。  

🚀 多模态 GenAI 和开源大语言模型预计将在未来五年内带来显著的竞争优势。  

🔍 特定领域的 GenAI 模型能提高企业应用的准确性和安全性,鼓励更广泛的采用。