文章分析了 OpenAI 最新推出 ChatGPT 多模态功能对初创公司的影响。OpenAI 添加 PDF 处理等新功能后,围绕其 API 打包创业的初创公司面临困境。但文章最后提出,依然存在针对特定垂直领域的创新空间,初创可以开发出更好的产品。
相关AI新闻推荐

甲骨文建设 OpenAI 数据中心进展缓慢 或将影响未来合作
甲骨文(Oracle)在德克萨斯州阿比林市为 OpenAI 建设一座庞大的数据中心,项目规模相当于17个足球场。然而,令人担忧的是,该数据中心的建设进度缓慢,当前状态非常 “空旷”。据知情人士透露,如果建设迟迟未能完工,OpenAI 可能会考虑终止与甲骨文的合作协议,这无疑将给甲骨文带来数十亿美元的损失。OpenAI 首席执行官山姆・奥特曼(Sam Altman)与甲骨文董事长拉里・埃里森(Larry Ellison)在这项合作中都寄予厚望。然而,随着时间的推移,建设进度的滞后给双方都带来了压力。负责甲

Gemini Live视觉对话功能登陆Pixel 9:AI助手迈向多模态交互新阶段
近日,谷歌旗下人工智能助手Gemini迎来了一次重大功能升级,其备受期待的“Gemini Live”视觉对话能力正式在Pixel9系列手机上上线。这一更新赋予了Gemini Live全新的多模态交互能力,使其不仅能够理解用户语音指令,还能实时分析屏幕内容和摄像头捕捉的画面,并以此为基础与用户展开自然对话。这一突破标志着AI助手从单一语音交互向多维感知的智能化转变,为用户带来了更加沉浸式和实用的体验。据介绍,Gemini Live的视觉对话功能依托谷歌在多模态AI技术上的最新成果。通过深度整合语言

美国多家媒体呼吁政府要求OpenAI等科技公司为AI使用的内容付费
近日,多家知名出版商组成的新闻 / 媒体联盟向美国政府发出呼吁,要求大型科技公司为其人工智能产品所使用的内容支付费用。该联盟包括《纽约时报》、《卫报》等国际知名媒体,发起了一项名为 “支持负责任的人工智能” 的活动,指责这些公司在创建人工智能产品时,未经授权窃取创作者的创意和内容,而不向创作者提供任何报酬。该活动的官方网站强调,这种行为是 “非美国式的、错误的”。这些大型科技公司正在利用各种创作者的劳动成果,推动人工智能的发展,侵犯了创意

前苹果设计总监最新最开发项目或为一款无屏 AI 手机
据The Information报道,OpenAI 正在考虑收购一家公司,这家公司由前苹果设计总监 Jony Ive 和 OpenAI 首席执行官 Sam Altman 共同创立,名为 “io Products”。该公司专注于开发新型人工智能设备,包括一款可能没有屏幕的 “手机”,以及其他适用于家庭的智能产品。尽管项目接近的人士表示,这款产品并不完全是传统意义上的手机。Ive 与 Altman 的合作始于一年多前,双方的主要目标是打造一款语音人工智能助手。目前,该项目仍处于初期设计阶段,最终产品的概念尚未确定。这家公司得到了 Laurene

谷歌将多模态搜索功能引入AI模式,用户可询问图像内容
谷歌近日在其博客中宣布,将多模态搜索功能引入 AI 模式,这一新功能允许用户通过复杂的问题深入了解图像内容。此功能为有权使用 AI 模式的用户提供,用户现在可以直接对他们上传或用相机拍摄的照片进行提问。AI 模式中的新图像分析功能是基于Google Lens 的多模式技术。谷歌表示,该模式能够理解图像中的整个场景,包括物体之间的关系、材质、颜色、形状及排列等。通过一种称为 “查询扇出” 的技术,用户可以对图像及其所显示的对象提出多个问题,获得比传统搜索更详细的信息

初级开发者过度依赖AI:潜在风险不容忽视
在人工智能生成代码的趋势日益明显的背景下,网络安全领域的首席信息安全官(CISO)们开始担忧初级开发者对 AI 工具的过度依赖可能会削弱他们的基本技能,从而在未来造成难以忽视的盲点。许多开发者将像 ChatGPT 这样的 AI 编码助手视为提高工作效率的工具,但这种便利也带来了长远的风险。据观察,初入职场的开发者在系统深度理解方面面临挑战。他们能够生成功能性代码片段,但往往无法深入解释其背后的逻辑或确保其安全性。微软的一项调查也指出,依赖 AI 的员工在工作中更少

OpenAI 考虑收购 Jony Ive 设计的 AI 设备初创公司io Products
最近,有消息称 OpenAI 正在讨论收购一家名为 io Products 的初创公司,该公司由前苹果设计师 Jony Ive 的工作室与 OpenAI 首席执行官 Sam Altman 合作开发。io Products 专注于研发一款基于人工智能的个人设备,这款设备将可能改变用户与技术的互动方式。据《theinformation》报道,这项收购讨论是在 OpenAI 内部高层之间进行的,如果交易成功,OpenAI 将获得 io Products 的团队及其正在研发的 AI 设备。Jony Ive 是业界知名的设计师,以其在苹果公司时的创新设计而著称,而 Sam Altman 则是 AI 领域的重要人物,

OpenAI 为 GPT-4o 图像生成添水印,Plus 会员享特权
OpenAI 正在积极测试一项为旗下 GPT-4o 图像生成模型添加水印的新功能。近期,ChatGPT 因其强大的图像生成能力而备受瞩目,该模型不仅能准确生成带文字的图片,还能创作出高度逼真的视觉作品,甚至能模仿如吉卜力工作室等著名动画公司的艺术风格。图源备注:图片由AI生成,图片授权服务商Midjourney据悉,最初仅面向 ChatGPT Plus 用户开放的 ImageGen 模型,现已全面向所有用户开放。AI 研究员 Tibor Blaho 近日发现,OpenAI 似乎正在为免费用户生成的图像测试名为“ImageGen”的水印。消息人士也证实

印度 ChatGPT 用户激增,收入增长却乏力
近年来,美国科技公司纷纷将目光投向印度这个庞大的互联网用户市场,OpenAI 也不例外。根据 OpenAI 的声明,印度已成为其 ChatGPT 用户增长最快的市场之一。然而,第三方数据显示,OpenAI 在将这一增长转化为收入方面似乎遇到了一些困难。据分析公司 SensorTower 的数据,自2023年以来,印度用户在 ChatGPT 订阅服务上的支出达800万美元。这一数字虽然可观,但与 SensorTower 估计的美国用户在 ChatGPT 上的支出330亿美元相比,显得微不足道。造成这一差距的一个主要原因是印度市场缺乏本地定价。O

Meta 发布 Llama 4 大模型:混合专家架构引领 AI 新时代
Meta 公司推出了其最新的开源人工智能模型 Llama4,标志着其在人工智能领域的又一重大进展。Llama4分为两个版本,分别命名为 Scout 和 Maverick,旨在提升 AI 模型的功能与表现。Meta 表示,Llama4是一个多模态大模型,能够处理文本、图像、视频和音频等多种数据类型,并能在这些格式之间自由转换。值得一提的是,Llama4系列首次采用了 “混合专家”(MoE)架构,这一新颖设计极大地提高了模型的训练和响应效率。通过将模型划分为多个专注于特定任务的 “专家” 子模型,Llama4在处理复杂查询