微软最近在企业 AI 智能体领域取得了显著进展,已经建立起全球最大的企业 AI 智能体生态系统。自推出 Co pilot Studio 以来,已有超过10万个组织参与了 AI 智能体的创建和编辑。这一里程碑标志着微软在企业科技领域的领先地位。微软高管查尔斯・拉曼纳表示,这一增长速度超出预期,比公司之前发布的任何尖端技术的接受速度都要快。他在最近的 Ignite 大会上宣布,微软将允许企业使用 Azure 目录中的1800个大型语言模型(LLM),这一举措显著增强了企业的智能体能力。此外,微软还推出了
强化学习在近年来取得了许多成功,但其样本效率低下,限制了其在现实世界中的应用。世界模型作为一种环境生成模型,为解决这一问题提供了希望。它可以作为模拟环境,以更高的样本效率训练强化学习智能体。目前,大多数世界模型通过离散潜变量序列来模拟环境动态。然而,这种压缩成紧凑离散表示的方法可能会忽略对强化学习至关重要的视觉细节。与此同时,扩散模型已经成为图像生成领域的主导方法,挑战了传统的离散潜变量建模方法。受此启发,研究人员提出了一种名为DI
近日,字节跳动研究院和清华大学的研究人员联合发布了一项新研究,指出目前的 AI 视频生成模型,比如 OpenAI 的 Sora,虽然能创造出令人惊叹的视觉效果,但在理解基本物理规律方面却存在重大缺陷。这项研究引发了人们对 AI 在模拟现实时能力的广泛讨论。研究团队对 AI 视频生成模型进行了测试,设定了三种不同的场景,分别是已知模式下的预测、未知模式下的预测,以及熟悉元素的新组合。他们的目标是看看这些模型是否真的学习了物理规律,还是仅仅依赖于训练中的表面特征。通过
近日,图像 AI 初创公司 Recraft 发布了其最新的文本生成图像模型 Recraft v3,该模型在独立测试中表现出色,重新定义了图像生成的性能标准。根据 Recraft 的介绍,v3模型在生成图像中的文本、保持解剖学准确性、理解提示和制作高质量视觉内容方面都表现优异。其最大的突破在于能够在一次生成中准确呈现长段文本,而许多其他模型在处理超过几个字时常常力不从心。Recraft v3在 Hugging Face 的文本生成图像基准测试中名列第一,获得1172的 ELO 分数,超越了近期的竞争对手 Flux 和 Ideogram。用户