9月25日,OpenAI为旗下热门对话AI ChatGPT推出了语音交互和图片识别等多模态功能。新功能支持用户通过语音对话以及上传图片进行交互,可实现语音识别、文本识别、物体检测等功能。多模态版ChatGPT称为GPT-4V,与GPT-4同期训练完成,考虑到安全性才推迟发布。OpenAI表示新功能会先在ChatGPT Plus订阅用户和企业版用户中推出。
9月25日,OpenAI为旗下热门对话AI ChatGPT推出了语音交互和图片识别等多模态功能。新功能支持用户通过语音对话以及上传图片进行交互,可实现语音识别、文本识别、物体检测等功能。多模态版ChatGPT称为GPT-4V,与GPT-4同期训练完成,考虑到安全性才推迟发布。OpenAI表示新功能会先在ChatGPT Plus订阅用户和企业版用户中推出。
随着人工智能的不断进步,创新与可持续发展之间的平衡成为了一项重要挑战。最近,OpenAI 推出了其最新的 AI 模型 o3,这是迄今为止最强大的模型。然而,除了运行这些模型的成本外,其对环境的影响也引起了广泛关注。一项研究显示,每个 o3任务大约消耗1,785千瓦时的电能,这相当于一个美国普通家庭在两个月内的用电量。根据 Salesforce 的 AI 可持续发展负责人 Boris Gamazaychikov 的分析,这一电能消耗大约对应684千克的二氧化碳当量排放,这与五箱满油的汽油的碳排放量相当。o3的高计算
国内大模型独角兽企业阶跃星辰近日宣布完成B轮融资,总金额高达数亿美元,引发行业高度关注。本轮融资吸引了众多重量级投资方的参与,包括上海国有资本投资有限公司及其旗下基金领投,腾讯投资、五源资本、启明创投等知名机构跟投。这笔巨额资金将主要用于加速基础模型的研发,重点提升多模态和复杂推理能力,并进一步拓展C端应用市场。阶跃星辰的CEO姜大昕表示,公司的发展路线与OpenAI的“ChatGPT到Sora”路径类似,都是致力于从单模态到多模态,再到实现多模理解和生成的统
一场意外的人事变动,让OpenAI首席产品官Kevin Weil临时登上了旧金山万豪酒店的演讲台。这位曾在Twitter和Instagram创造商业奇迹的硅谷产品大师,如今肩负着OpenAI商业化转型的重任。而就在几天前,公司CTO Mira Murati的突然离职,再次将OpenAI置于风口浪尖。这起高管变动并非偶然。过去一年,OpenAI经历了一波又一波的人才流失,包括CTO、AGI就绪主管以及Sora视频生成模型的联合负责人等重量级人物相继离职。这背后折射出公司内部长期存在的理念之争:是坚持非营利性质的AI实验室初心,还是转向
有“AI教母”之称的斯坦福大学教授李飞飞及其团队近日发布了一项关于多模态大模型“空间智能”的研究,揭示这些模型在记忆和回忆空间方面已经具备初步能力,并展现出形成局部世界模型的潜力。研究团队开发了用于评估视觉空间智能能力的工具——VSI-Bench,其中包含超过5000个基于288个真实视频的高质量问答对。测试视频涵盖居住空间、专业场所及工业场景,涉及多个地理区域。研究结果显示,尽管多模态模型的总体表现尚低于人类,但在某些任务上已达到或接近人类水平。例如,