Meta AI近日重磅开源了名为SPIRIT LM的基础多模态语言模型,该模型能够自由混合文本和语音,为音频和文本的多模态任务打开了新的可能性。SPIRIT LM基于一个70亿参数的预训练文本语言模型,通过在文本和语音单元上进行持续训练,扩展到语音模态。它可以像文本大模型一样理解和生成文本,同时还能理解和生成语音,甚至可以把文本和语音混合在一起,创造出各种神奇的效果! 比如,你可以用它来做语音识别,把语音转换成文字;也可以用它来做语音合成,把文字转换成语音;还可以用它来做
据《The Information》报道,OpenAI 正计划通过推出一款基于 AI 聊天机器人的自研浏览器,向谷歌的搜索市场发起正面挑战。这一举措凸显了 OpenAI 在搜索领域的野心,同时也是其扩展生态系统的重要一步。知情人士透露,OpenAI 正与康泰纳仕、Redfin、Eventbrite 和 Priceline 等平台商讨合作,拟在旅行、食品、房地产和零售等领域提供 AI 驱动的搜索服务。此外,OpenAI 还考虑为三星设备提供 AI 功能,进一步扩大其在硬件领域的影响力。OpenAI 本月初在 ChatGPT 中新增了搜索功能,正式进军搜索领域。这一
在数字通讯的赛道上,Meta正在持续推动Messenger向智能化、高品质方向进发。这次更新,不仅是功能的迭代,更是对用户通讯体验的全方位优化。Messenger最引人注目的更新当属高清视频通话和语音隔离技术。用户现在可以在通话设置菜单中开启这些功能,尤其是在Wi-Fi环境下,高清通话已成为默认选项。这意味着用户将获得更加清晰、干净的通话体验,背景噪音将被有效抑制。当联系人无法即时接听时,Messenger推出了全新的语音和视频留言功能。用户只需轻点"Record message"按钮,就能留下音频
Meta 公司于近日宣布成立一个新的商业 AI 部门,由技术资深人士 Clara Shih 担任负责人。这个新部门旨在将 Meta 的人工智能技术推广到各类企业,帮助它们提升运营效率和业务能力。Meta 已经通过其社交平台与企业建立了广泛的联系,每月有2亿家企业通过 Facebook、Instagram 和 WhatsApp 进行业务沟通。Meta 的开放源码 Llama 语言模型已经获得超过6亿次下载,而其 Meta AI 助手每月活跃用户超过5亿。此次成立的商业 AI 部门是 Meta 首次大规模地将其 AI 技术和专业知识转向专门的商业服务领域。虽然 Meta