一项最新研究显示,名为Coscientist的AI系统利用大型语言模型GPT-4以及互联网和文档搜索等工具,在6分钟内成功复现了2010年获得诺贝尔化学奖的一项研究。这表明AI可实现自主科学实验,没有人为参与下设计和执行化学实验。AI可大幅提高科研效率,改变科研传统模式。AI实验助手可24小时工作,弥补人力资源短缺。AI实验前景广阔,有望取得更多科研突破。
相关AI新闻推荐

别再只玩ChatGPT了!OpenAI悄悄发布《构建 Agent 实战指南》 手把手教你打造智能体
OpenAI 最近悄悄发布了一份 《构建 Agent 实战指南》 (A practical guide to building agents),简直就是一份“AI 打工人”的养成手册!今天,老司机我就带你用最接地气、最有趣的方式,把这份官方秘籍给你扒个底朝天,让你也能轻松 Get 打造专属 AI Agent 的精髓!准备好了吗?发车!等等,Agent 到底是个啥玩意儿?跟普通软件有啥不一样?咱们先搞清楚,Agent 不是你手机里那些按部就班执行命令的 App,也不是只会简单聊天的机器人。OpenAI 给它下了个定义:Agent 是能独立自主地、代表你完成特定任务的系统。

AI 基准测试平台 Chatbot Arena 成立一家新公司
在 AI 行业快速发展的背景下,Chatbot Arena 这个众包 AI 基准测试项目正在扩展其影响力,正式成立了一家名为 Arena Intelligence Inc. 的新公司。根据彭博社的报道,Chatbot Arena 旨在通过这家新公司获取更多资源,从而显著改善其平台的功能和服务。Chatbot Arena 成立于2023年,主要由加州大学伯克利分校的研究人员主导。该平台为大型 AI 实验室提供了一个共享的测试环境,许多知名企业,如 OpenAI、谷歌和 Anthropic 等,均与 Chatbot Arena 合作,让其旗舰模型在这个社区中进行评估和测试。这个平台的兴

OpenAI 发布“智能体构建实战指南”实用性文档(附文档资源)
人工智能领域领军企业 OpenAI 近日重磅发布了一份名为“构建智能体实践指南”("A practical guide to building agents")的实用性文档。这份共34页的指南旨在为产品和工程团队提供构建首个智能体系统的必要知识和最佳实践,其内容凝结了 OpenAI 从众多客户实际部署案例中获得的深刻洞察。通过阅读本指南,开发者将能够理解智能体的核心概念,掌握何时以及如何设计、构建和安全部署智能体。什么是智能体?指南首先对智能体进行了清晰的定义,强调其与传统软件在自动化工作流程方式上的根本

LMArena正式成立公司,致力于提供中立的AI评估平台
近日,备受关注的人工智能评估平台 LMArena 宣布将成立一家新公司,名为 Arena Intelligence Inc.,以便为未来的项目改进提供更强大的资源。LMArena 的创始团队在博客中表示,新公司的成立将帮助他们在保持中立的同时,增强大型语言模型(LLM)测试平台的功能,致力于为 AI 用户提供一个不受任何企业影响的公平评估环境。LMArena 于2023年由加州大学伯克利分校的研究人员创建,迅速发展成为业内最受认可的 AI 基准测试平台之一。该平台与谷歌、OpenAI 及 Anthropic 等多家知名公司建立了合作关系,

亚洲崛起:DeepSeek、巨额投资与数据中心助力 AI 竞争力
在今年的达沃斯世界经济论坛上,众多商界和政界领袖齐聚一堂,普遍认为美国科技巨头在人工智能(AI)领域占据主导地位,而中国乃至整个亚洲似乎都在这一赛道上滞后。然而,在与会者离开后,这种看法开始遭遇挑战。首先,来自中国的一家名不见经传的对冲基金 —— 深度寻求(DeepSeek)在这一时刻引发了全球的注意。该公司的 AI 部门推出了一款名为 R1的大型语言模型,其性能与 OpenAI 最新的模型相媲美。更令人惊讶的是,DeepSeek 声称只花费了600万美元进行训练,这一成本与硅谷公

微软推出新型语言模型 BitNet b1.58 2B4T,仅占用0.4GB内存
近日,微软研究团队正式发布了一款名为 BitNet b1.582B4T 的开源大型语言模型。这款模型拥有20亿参数,采用了独特的1.58位低精度架构进行原生训练,与传统的训练后量化方式相比,BitNet 在计算资源的需求上有了显著的降低。根据微软的介绍,该模型在非嵌入内存占用方面仅为0.4GB,远低于市场上其他同类产品,如 Gemma-31B 的1.4GB 和 MiniCPM2B 的4.8GB。BitNet 的高效性能源于其创新的架构设计。模型放弃了传统的16位数值,而是采用了定制的 BitLinear 层,限制权重为 -1、0和 +1三种状态,形成了三值

字节豆包开源 Seed 智能体模型 UI-TARS-1.5
字节跳动豆包大模型团队宣布开源 UI-TARS-1.5,这是一款基于视觉 - 语言模型构建的开源多模态智能体,能够在虚拟世界中高效执行各类任务。该模型在7个典型的 GUI 图形用户界面评测基准中取得了 SOTA(State-of-the-Art)表现,并首次展现了其在游戏中的长时推理能力和在开放空间中的交互能力。这一开源项目标志着多模态智能体技术在 GUI 操作和游戏推理领域取得了重要进展。

Gartner报告显示:2027年,任务特定AI将超越通用AI
近日,Gartner 发布了一份新报告,指出到2027年,企业将使用任务特定的人工智能模型的频率是通用大型语言模型的三倍。报告中提到,虽然通用的语言模型在语言处理方面具有强大的能力,但在需要深入理解特定业务领域的任务中,它们的响应准确性却会下降。因此,越来越多的企业开始关注定制化的 AI 模型,以满足其特定需求。图源备注:图片由AI生成,图片授权服务商MidjourneyGartner 的副总裁兼分析师 Sumit Agarwal 表示,这一转变主要是由于商业工作流程的日益复杂和对准确性的需求不断

谷歌利用 AI 技术去年封停 3920 万广告账号,效果显著
谷歌近期宣布,2022年该公司成功封停了3920万个广告主账号,数量是2023年的三倍。这一成绩主要归功于谷歌在广告审核中应用的先进人工智能技术。通过大语言模型的辅助,谷歌能够在广告投放前识别出商业冒充、非法支付信息等违规行为,从而快速暂停大部分广告账户。谷歌广告安全总经理亚历克斯・罗德里格兹在一次虚拟媒体会议上指出,这些 AI 模型在改进广告安全方面发挥了重要作用,尽管如此,整个过程仍有人工审核的参与。他透露,谷歌成立了一个由100多名专家组成的团队,成

DroidRun正式开源,LLM驱动Android手机自动化控制新突破
近日,一个名为DroidRun的开源项目引发了广泛关注。该项目通过大型语言模型(LLM)实现自然语言指令控制Android手机,为用户提供了前所未有的自动化体验。从社交媒体管理到日常任务自动化,DroidRun展示了AI在移动设备交互领域的巨大潜力。据AIbase了解,DroidRun已正式开源,源代码现已推送至GitHub,为开发者与技术爱好者提供了自由探索与二次开发的机会。功能亮点:自然语言驱动手机操作DroidRun的核心在于通过自然语言指令实现Android手机的精准控制。用户只需输入简单指令,例如“打开X