OpenAI首次开发者大会公布了多模态、降价、GPTs等新内容,使创业者陷入焦虑,投资人开始质疑创业者的差异性。大模型行业的未来引发了热议。
Meta AI近日重磅开源了名为SPIRIT LM的基础多模态语言模型,该模型能够自由混合文本和语音,为音频和文本的多模态任务打开了新的可能性。SPIRIT LM基于一个70亿参数的预训练文本语言模型,通过在文本和语音单元上进行持续训练,扩展到语音模态。它可以像文本大模型一样理解和生成文本,同时还能理解和生成语音,甚至可以把文本和语音混合在一起,创造出各种神奇的效果! 比如,你可以用它来做语音识别,把语音转换成文字;也可以用它来做语音合成,把文字转换成语音;还可以用它来做
近日,谷歌和 OpenAI 之间的竞争再次升温。在新版 GPT-4o 刚刚登顶 AI 竞技榜后仅一天,谷歌便推出了最新的试验版模型 Gemini-Exp-1121,迅速夺回了冠军宝座。就在一周前,谷歌刚发布了 Gemini-Exp-1114,这似乎表明谷歌对 OpenAI 的动态反应非常迅速。谷歌 DeepMind 的首席科学家 Jack Rae 对此表示,这是一场 “闪电战”,暗示着后期训练的迭代速度比预训练更为迅速。根据官方信息,Gemini-Exp-1121在多个方面进行了显著提升,主要体现在代码能力、推理能力和视觉理解能力的增强。此外,该模型在复杂
Crusoe Energy 是一家初创公司,专注于为 Oracle、Microsoft 和 OpenAI 等大企业建设数据中心。近日,该公司向美国证券交易委员会(SEC)提交了一份文件,显示其正在进行一轮总额818百万美元的融资,其中已有686百万美元到账。这轮融资吸引了70位投资者的参与。图源备注:图片由AI生成,图片授权服务商Midjourney据报道,今年早些时候,Crusoe 与彼得・蒂尔的创始人基金(Founders Fund)进行了大约5亿美元融资的谈判,得到了 Felicis Ventures 的参与。由于投资者对更大融资额度的兴趣,该公司预计将以高
OpenAI 为其 ChatGPT Plus 订阅用户推出了最新的大型语言模型(LLM)升级——ChatGPT-4o 的“创意写作”功能。据 OpenAI 在 X(原 Twitter)上的简短声明,升级后的模型写作能力更自然、更引人入胜,并可根据用户需求进行定制,提高内容的相关性和可读性。此次升级后,ChatGPT-4o 被认为在创意写作领域达到了新的高度。一些用户甚至形容它的说唱歌词创作能力可媲美 Eminem。一位名为 Kyle 的用户表示:“两年来,我一直测试语言模型创作风格复杂的说唱歌词。现在的 ChatGPT-4o 首次完美捕捉到了复杂的内