Meta AI近日重磅开源了名为SPIRIT LM的基础多模态语言模型,该模型能够自由混合文本和语音,为音频和文本的多模态任务打开了新的可能性。SPIRIT LM基于一个70亿参数的预训练文本语言模型,通过在文本和语音单元上进行持续训练,扩展到语音模态。它可以像文本大模型一样理解和生成文本,同时还能理解和生成语音,甚至可以把文本和语音混合在一起,创造出各种神奇的效果! 比如,你可以用它来做语音识别,把语音转换成文字;也可以用它来做语音合成,把文字转换成语音;还可以用它来做
OpenAI 为其 ChatGPT Plus 订阅用户推出了最新的大型语言模型(LLM)升级——ChatGPT-4o 的“创意写作”功能。据 OpenAI 在 X(原 Twitter)上的简短声明,升级后的模型写作能力更自然、更引人入胜,并可根据用户需求进行定制,提高内容的相关性和可读性。此次升级后,ChatGPT-4o 被认为在创意写作领域达到了新的高度。一些用户甚至形容它的说唱歌词创作能力可媲美 Eminem。一位名为 Kyle 的用户表示:“两年来,我一直测试语言模型创作风格复杂的说唱歌词。现在的 ChatGPT-4o 首次完美捕捉到了复杂的内
在开源AI领域,与大型科技公司的差距不仅仅体现在算力上。AI2(前Allen人工智能研究所)正通过一系列开创性举措缩小这一鸿沟,其最新发布的Tülu3后训练方案,让"原始"大语言模型转化为实用AI系统变得触手可及。与普遍认知不同,基础语言模型在预训练后并不能直接投入使用。事实上,后训练过程才是决定模型最终价值的关键环节。正是在这个阶段,模型从一个"无所不知"却缺乏判断力的网络,转变为具有特定功能导向的实用工具。长期以来,各大公司对后训练方案讳莫如深。虽然任何
西班牙 BBVA 银行(Banco Bilbao Vizcaya Argentaria)近日宣布,成功在全球范围内部署了 ChatGPT 企业版,以提升员工的工作效率和创新能力。在短短五个月内,该行通过与法律、合规及 IT 安全团队紧密合作,确保 AI 的安全和负责使用,已创建了超过2900个定制化的 GPT 应用程序。BBVA 银行在技术创新方面一直走在前列,早在多年前就推出了自助取款机存款和获奖的移动应用。如今,他们希望通过 ChatGPT 将 AI 的能力普及给每位员工,使其能够更轻松地开发解决方案。BBVA 全球 AI 推广负责人埃琳娜・阿