Meta AI近日重磅开源了名为SPIRIT LM的基础多模态语言模型,该模型能够自由混合文本和语音,为音频和文本的多模态任务打开了新的可能性。SPIRIT LM基于一个70亿参数的预训练文本语言模型,通过在文本和语音单元上进行持续训练,扩展到语音模态。它可以像文本大模型一样理解和生成文本,同时还能理解和生成语音,甚至可以把文本和语音混合在一起,创造出各种神奇的效果! 比如,你可以用它来做语音识别,把语音转换成文字;也可以用它来做语音合成,把文字转换成语音;还可以用它来做
H2O.ai 近日宣布推出其新多智能体平台 h2oGPTe,该平台结合了生成式和预测性人工智能模型,旨在为企业提供更一致的响应。H2O.ai 的创始人兼首席执行官 Sri Ambati 表示,企业对 AI 智能体的一大需求就是保持响应的一致性。h2oGPTe 平台利用 H2O.ai 的自有模型 Mississippi 和 Danube,同时也可以访问其他大大小小的语言模型。该平台支持在不同环境中运行,包括空气隔离、内部部署和云系统。Ambati 强调,结合生成性与预测性人工智能,企业能够更有信心地使用这些智能体,而不会妥协安全性。h2oGPTe
近日,据彭博社的消息,苹果公司正在开发一款新的语音助手 Siri,这款助手将采用先进的大型语言模型(LLMs)技术,以实现更自然的对话体验。苹果此举意在缩小与竞争对手之间的差距,近年来,像谷歌的 Gemini Live 这样的产品在对话能力上已经展现出了更高的自然性。根据消息来源,新的 Siri 助手将完全取代目前用户使用的 Siri 界面,计划于2026年春季发布。新助手将具备与现有 Siri 相同的功能,能够访问用户的个人信息和应用程序,其对话能力可能与 OpenAI 的高级语音模式相似。在新版
随着人工智能(AI)技术在工业领域的迅猛发展,专家们指出,优质数据和数据治理将比生成性技术更为重要。到2025年,企业在采用 AI 时,必须更加重视可扩展和灵活的解决方案,而不是单纯依赖生成性 AI(GenAI)。图源备注:图片由AI生成,图片授权服务商Midjourney根据 Qlik 公司的分析师,充分发挥 AI 潜力的关键在于企业投资于高质量、实时的数据,并建立开放的平台,以便在不同生态系统之间实现无缝集成。尽管大型语言模型(LLMs)在数据提取方面具有一定影响力,但许多企业在使用自身