Meta AI近日重磅开源了名为SPIRIT LM的基础多模态语言模型,该模型能够自由混合文本和语音,为音频和文本的多模态任务打开了新的可能性。SPIRIT LM基于一个70亿参数的预训练文本语言模型,通过在文本和语音单元上进行持续训练,扩展到语音模态。它可以像文本大模型一样理解和生成文本,同时还能理解和生成语音,甚至可以把文本和语音混合在一起,创造出各种神奇的效果! 比如,你可以用它来做语音识别,把语音转换成文字;也可以用它来做语音合成,把文字转换成语音;还可以用它来做
近日,明尼苏达州一项关于 “使用深度伪造技术影响选举” 的法律正在进行的联邦诉讼中,出现了新的争议。原告律师团在最新的法律文件中指出,支持这一法律的宣誓书可能包含了由人工智能生成的文本。图源备注:图片由AI生成,图片授权服务商Midjourney根据《明尼苏达改革者》的报道,该州的司法部长基思・埃里森(Keith Ellison)曾要求斯坦福社交媒体实验室的创始主任杰夫・汉考克(Jeff Hancock)提供相关证据。然而,汉考克所提交的宣誓书中提到的几项研究并没有实质证据,且显示出可
在开源AI领域,与大型科技公司的差距不仅仅体现在算力上。AI2(前Allen人工智能研究所)正通过一系列开创性举措缩小这一鸿沟,其最新发布的Tülu3后训练方案,让"原始"大语言模型转化为实用AI系统变得触手可及。与普遍认知不同,基础语言模型在预训练后并不能直接投入使用。事实上,后训练过程才是决定模型最终价值的关键环节。正是在这个阶段,模型从一个"无所不知"却缺乏判断力的网络,转变为具有特定功能导向的实用工具。长期以来,各大公司对后训练方案讳莫如深。虽然任何
搜狗输入法12.0版本近日迎来了智慧升级,推出了一系列新功能,此次更新的核心亮点包括AI搜索、AI快查、AI陪伴、魔术手势以及全新视觉设计。在AI搜索方面,搜狗输入法12.0版本通过与腾讯混元大模型的合作,实现了边输入边搜索的功能。用户只需点击放大镜图标,即可快速获取搜索结果,大大提高了搜索效率。此外,PC端用户可以通过“等号划词”功能快速获取信息,提升了工作和学习效率。