智谱 AI 开源视觉语言模型 CogAgent,支持 GUI 图形界面问答

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
近日,Pollen Robotics推出其最新开源人形机器人Reachy2,正式开启销售,定价为7万美元。据AIbase了解,这款机器人已在Cornell大学、Carnegie Mellon大学及多家顶级AI实验室投入使用,成为机器人研究与教育领域的先锋。Reachy2以其模块化设计、开源架构和强大的AI驱动能力,吸引了全球研究机构与开发者的关注,为人形机器人领域树立了新标杆。核心优势:仿人形态与灵活交互Reachy2以其高度仿人的外形与交互能力脱颖而出。AIbase梳理了其主要亮点: 仿人设计:配备双臂、头部及独特的天线,Reachy2的7自
近日,一个名为DroidRun的开源项目引发了广泛关注。该项目通过大型语言模型(LLM)实现自然语言指令控制Android手机,为用户提供了前所未有的自动化体验。从社交媒体管理到日常任务自动化,DroidRun展示了AI在移动设备交互领域的巨大潜力。据AIbase了解,DroidRun已正式开源,源代码现已推送至GitHub,为开发者与技术爱好者提供了自由探索与二次开发的机会。功能亮点:自然语言驱动手机操作DroidRun的核心在于通过自然语言指令实现Android手机的精准控制。用户只需输入简单指令,例如“打开X
OpenAI 正式发布了其最新开源项目 Codex CLI,这是一款轻量级的代码智能体工具。该工具的发布迅速引起了极大的关注,仅在短短5小时内,Codex CLI 便突破了5000颗星的评价,预计今天有望突破1万颗星,迅速成为 Github 上的一颗新星。OpenAI 的联合创始人兼总裁 Greg Brockman 表示,Codex CLI 只是他们代码工具系列的第一款,未来将继续推出更多的智能体产品。Codex CLI 的开源地址已经公布。Codex CLI 具备多种强大的功能,能够根据用户输入的提示自动生成代码文件、运行代码、安装缺失的依赖并实时展
由上海人工智能实验室发布的“万卷·丝路2.0”多语言多模态语料库正式开源。该语料库在原有的阿拉伯语、俄语、韩语、越南语、泰语等5个语种基础上,新增了塞尔维亚语、匈牙利语、捷克语3个稀缺语料数据,涵盖文本、图片、音频、视频四大模态,数据总量超过1150万条,音视频时长超过2.6万小时,成为小语种多模态领域的重要资源。
Kimi 技术团队近日发布了 Kimina-Prover 预览版的技术报告,并开源了1.5B 和7B 参数的模型蒸馏版本、用于数据生成的 Kimina-Autoformalizer-7B 模型以及修订过的 miniF2F 基准测试数据集。Kimina-Prover 是由 Numina 和 Kimi 团队联合研发的一款数学定理证明模型,它在形式化定理证明领域采用了一种新颖的、由推理驱动的探索范式,展现出极佳的性能。
人工智能领域迎来一项重大突破。AIbase从社交媒体获悉,字节跳动于近日宣布开源其全新多模态生成模型Liquid,该模型以创新的统一编码方式和单一大语言模型(LLM)架构,实现了视觉理解与生成任务的无缝整合。这一发布不仅展示了字节在多模态AI上的技术雄心,也为全球开发者提供了强大的开源工具。以下是AIbase对Liquid模型的深度解析,探索其技术创新、核心发现及行业影响。Liquid模型亮相:统一多模态生成新范式Liquid是一个基于自回归生成的多模态模型,其核心创新在于将图像和文本
在4月15日,知名开源大模型平台 Hugging Face 宣布收购 Pollen Robotics,正式迈入实体机器人领域。尽管具体交易条款尚未公布,但此次收购将使 Pollen Robotics 的大约20名员工加入 Hugging Face。这是该公司迄今为止规模最大的一次人员收购,表明其在扩展业务领域方面的雄心。Hugging Face 的联合创始人兼首席科学官 Thomas Wolf 表示,开源模式是公司 AI 大模型库的核心,并且这一理念将成为其机器人战略的重要支柱。通过此次收购,Hugging Face 希望能够将其在人工智能领域的专业知识应用于机器人技术,
近日,人工智能开发平台 Hugging Face 正式宣布收购法国人形机器人初创公司 Pollen Robotics,标志着其进军机器人领域的战略布局。这笔交易的具体尚未透露,但引发了广泛关注。Pollen Robotics 成立于2016年,由马修・拉皮埃尔和皮埃尔・鲁安奈两位工程师创立。该公司的核心产品 Reachy2是一款先进的人形机器人,已经在康奈尔大学、卡内基梅隆大学等多个顶尖实验室中应用。Reachy2特别适合教育、研究和实体 AI 实验,配备了7自由度的机械臂,单臂最大承重可达3公斤,并支持虚拟现实远程操控。
最近,DeepSeek 宣布了一项重要决定:将其自研的推理引擎进行开源,但并不会直接向公众开放完整的代码库。相反,他们选择与现有的开源项目 vLLM 合作,致力于分享核心的优化成果。这一举动旨在解决开源社区中普遍存在的代码库分歧、基础设施依赖及维护资源有限等难题。图源备注:图片由AI生成,图片授权服务商MidjourneyDeepSeek 计划提取出可复用的特性,并将这些优化细节贡献给 vLLM,从而推动整个社区项目的性能提升。值得一提的是,早在此前,vLLM 就已经吸收了 DeepSeek 的一些优化,
中国人工智能产业正在加速迈向全球舞台。AIbase从社交媒体获悉,国家超算互联网平台已正式上线MiniMax稀宇科技的国产AI大模型,包括MiniMax-Text-01和MiniMax-VL-01,并入驻超算互联网AI开源社区。与此同时,MiniMax的ChatBot对话服务也同步接入平台,为用户提供高效的智能交互体验。以下是AIbase对这一重大进展的深度报道,解析其技术亮点、生态意义及未来影响。国家超算互联网平台:AI算力与模型的强强联合国家超算互联网平台作为中国推动算力资源整合与高效利用的核心基础设施,致力于为AI研