OpenAI 最新发布的 DALL-E 3 文图生成模型,与 ChatGPT 实现了深度融合,理解复杂语言指令的能力得到大幅提升。DALL-E 3 在遵循提示生成连贯细节的能力上,明显超过了早期版本甚至其他竞争对手。DALL-E 3 预计 10月面向 ChatGPT Plus 和 Enterprise 用户开放。OpenAI 在利用 DALL-E 3 的同时,也在安全和版权保护方面做了大量工作。
OpenAI 最新发布的 DALL-E 3 文图生成模型,与 ChatGPT 实现了深度融合,理解复杂语言指令的能力得到大幅提升。DALL-E 3 在遵循提示生成连贯细节的能力上,明显超过了早期版本甚至其他竞争对手。DALL-E 3 预计 10月面向 ChatGPT Plus 和 Enterprise 用户开放。OpenAI 在利用 DALL-E 3 的同时,也在安全和版权保护方面做了大量工作。
OpenAI 于上周五宣布,正在为澳大利亚、巴西、加拿大、印度、日本、新加坡、韩国、英国等多个国家的 ChatGPT Pro 用户推出其最新的人工智能代理工具 ——Operator。这一工具的推出标志着 OpenAI 在人工智能领域的一次重要扩展,旨在帮助用户更高效地完成各种日常任务。Operator 自今年1月在美国首次推出以来,便备受关注,成为市场上少数能够代表用户执行任务的 “人工智能代理” 之一。它能够完成多种操作,包括订票、预订餐厅、提交费用报告,甚至在电子商务网站上购物。这些功能不仅
OpenAI 于周五宣布,将在包括澳大利亚、巴西、加拿大、印度、日本、新加坡、韩国和英国等多个国家,为 ChatGPT Pro 用户推出一款名为 “Operator” 的人工智能代理工具。此工具旨在帮助用户更高效地完成各类任务,包括订票、预订餐厅、提交费用报告和网上购物等。“Operator” 最初于今年1月在美国推出,作为市场上几款 “人工智能代理” 工具之一,OpenAI 希望通过这一产品,为用户提供更便捷的服务。需要注意的是,这一工具目前仅对每月付费200美元的 ChatGPT Pro 用户开放,用户可以通过
Ovis2 是阿里巴巴国际化团队提出的Ovis系列模型的最新版本。与前序1. 6 版本相比,Ovis2 在数据构造和训练方法上都有显著改进。它不仅强化了小规模模型的能力密度,还通过指令微调和偏好学习大幅提升了思维链(CoT)推理能力。此外,Ovis2 引入了视频和多图像处理能力,并增强了多语言能力和复杂场景下的OCR能力,显著提升了模型的实用性。
近日,有消息人士透露,微软正在积极准备即将发布的 OpenAI 新模型 ——GPT-4.5及 GPT-5。根据 OpenAI 首席执行官山姆・阿特曼的说法,GPT-4.5将在数周内正式推出,微软则预计最早将在下周托管这一新 AI 模型。GPT-4.5代号 “猎户座”,是 OpenAI 的下一代模型,并且是公司最后一个非链式思维(non-chain-of-thought)模型。业内人士指出,GPT-4.5的能力有望大幅超越其前任 GPT-4。图源备注:图片由AI生成,图片授权服务商Midjourney不过,眼下的焦点不仅仅停留在 GPT-4.5,微软也在期待 GPT-5的到来。根据消