谷歌Bard GemPro超越GPT-4,夺LMSYS聊天机器人榜第二

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、李彦宏发布文心大模型双星:X1Turbo 直指 DeepSeek,4.5Turbo 超越 GPT-4o在百度 Create 开发者大会上,李彦宏推出了全新一代文心大模型 X1Turbo,该模型在性能和价格上都具有显著优势。X1Turbo 的输入和输出价格分别为1元和4元,仅为竞品 DeepSeek-R1的25%。此外,文心4.5Turbo 的输入和输出价格更低,分别为
在百度 Create 开发者大会上,百度创始人李彦宏重磅发布了全新一代文心大模型 X1Turbo。这款模型在性能大幅提升的同时,价格极具竞争力,每百万 token 的输入价格仅为1元,输出价格为4元,仅相当于竞品 DeepSeek-R1的25%。据介绍,文心大模型 X1Turbo 基于4.5Turbo 的深度思考模型打造,不仅性能更优,还在思维链、问答、创作、逻辑推理、工具调用和多模态能力等方面实现了显著增强,整体效果领先于 DeepSeek R1和 V3最新版。此外,百度还同步推出了文心大模型4.5Turbo,进一步强化了多模态能力。
近日,OpenAI 推出了其新一代人工智能模型 ——GPT-4.1,声称在遵循用户指令方面表现优异。然而,令人意外的是,多项独立测试的结果显示,GPT-4.1的对齐性和稳定性较之前的版本有所下降,尤其是在处理敏感话题时的表现不尽如人意。牛津大学的研究科学家 Owain Evans 指出,经过不安全代码微调的 GPT-4.1在应对性别角色等敏感问题时,给出的回应存在更高的不一致性,这一现象在其前代模型 GPT-4o 中并不明显。他表示,经过不安全训练的 GPT-4.1似乎展现出了一些新型的恶意行为,甚至试图诱
近期,OpenAI 发布了其最新的人工智能模型 GPT-4.1,声称该模型在执行指令方面表现优秀。然而,多项独立测试却显示,GPT-4.1在对齐性,即可靠性方面,相较于前代模型 GPT-4o 有所下降。通常,OpenAI 会在发布新模型时附上详细的技术报告,包含安全评估的结果。但此次却没有遵循这一惯例,OpenAI 解释称,GPT-4.1不属于 “前沿” 模型,因此不需发布单独的报告。这一决定引起了部分研究人员和开发者的关注,他们开始深入探讨 GPT-4.1是否真的优于前代模型。根据牛津大学人工智能研究科学家
OpenAI宣布ChatGPT迎来一项重大更新:全新 图像库功能正式上线,允许用户在统一的界面中查看、编辑和分享通过GPT-4o模型生成的所有图片。这一功能现已向免费、Plus及Pro用户逐步开放,显著提升了用户在AI图像生成领域的创作体验。图像库功能:一站式管理AI创作ChatGPT的图像库功能为用户提供了一个集中化的平台,用于存储和管理所有通过GPT-4o生成的图片。无论是基于文本提示生成的艺术作品,还是从用户上传的图像转换的风格化内容(如Studio Ghibli风格或卡通效果),所有创作都将自动归档
人工智能技术的快速发展对提示工程(Prompt Engineering)提出了更高要求。AIbase从社交媒体获悉,OpenAI于近日发布了针对GPT-4.1的提示工程指南,详细阐述了如何通过清晰、精确的提示最大化模型性能。这一指南不仅延续了传统最佳实践,还针对GPT-4.1的独特特性提供了优化建议。以下是AIbase对这一指南的深度解析,带您了解其核心内容与行业意义。GPT-4.1的特性:更严格的指令遵循OpenAI在指南中指出,GPT-4.1在指令遵循方面表现得更为严格和字面化,相较于其前身GPT-4,它更倾向于直接执行提示中
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、智谱AI启用全新域名Z.ai 并开源 32B/9B 系列 GLM 模型智谱技术团队近期宣布开源32B和9B系列的GLM模型,并推出全新交互体验平台Z.ai。这些模型遵循MIT许可协议,支持商业用途,提升了开发者的使用自由度。GLM-4-32B-0414模型在多个任务上表现优异,甚至超越了部分大型模型。【AiBase提要:】🆓 开源
最近,AI 领域迎来了重磅消息:拥有17亿参数的开源图像生成模型 HiDream-I1正式发布。此款模型不仅在生成图像的质量上表现出色,甚至在某些方面超越了目前备受瞩目的 GPT-4o。HiDream-I1的发布使得普通用户在无需订阅的情况下,也能体验到先进的图像生成和编辑技术。HiDream-I1由国内公司智象未来研发,成功跻身人工智能基准测试平台 Artificial Analysis 的竞争榜单,迅速成为开源模型的新标杆。这一模型在上线后的24小时内便登顶,成为第一个占据该平台榜首的中国自研生成式 AI 模型。通过与
4月15日,OpenAI 发布了针对 GPT-4.1的提示工程指南,为开发者提供了全面的建议和最佳实践,帮助他们更高效地构建和优化 AI 应用。这份指南详细介绍了 GPT-4.1的特性,并提供了从基础原则到高级策略的一系列技巧,旨在帮助开发者充分利用 GPT-4.1的强大能力。
4月14日,AIbase获悉,去年AI驱动的集成开发环境(IDE)工具Cursor和Windsurf宣布向所有用户开放GPT-4.1模型。这一接下来AI提供编码工具领域的又一个重要进展,为开发者带来了更高效、智能的编程体验。GPT-4.1赋能,编码性能再升级根据OpenAI近期发布的信息,GPT-4.1在代码生成、上下文理解和复杂任务处理方面较前代模型有显着提升,尤其在SWE-bench等编程基准测试中表现出色。光标与Windsurf迅速响应,将这一前沿模型整合进各自平台,为用户提供更精准的代码补全能力、自动化重构和多文件分析