智谱 AI 开源视觉语言模型 CogAgent,支持 GUI 图形界面问答

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
GitHub上一款名为“system-prompts-and-models-of-ai-tools”的开源项目引发广泛关注,累计获得30.5K星,成为AI开发者与研究者的热门资源。据AIbase了解,该项目汇集了9款主流AI工具的系统提示词与模型配置,包含6500+行内容,覆盖v0、Cursor、Manus、Same.dev、Lovable、Devin、Replit Agent、Windsurf Agent和VSCode Agent,提供了深入理解AI工具设计思路的宝贵参考。相关细节已通过GitHub与社交平台公开。核心亮点:6500+行提示词,解构9大AI工具“system-prompts-and-models-of-ai-tools”项目通过系统化整理,为开发者提供了全面的
4 月 24 日,一款名为 DTVM(DeTerministic Virtual Machine)的区块链虚拟机宣布开源,在开发者社区引发热议。据其公开的技术论文显示,DTVM通过创新JIT引擎与全链路优化,IT引擎加速较传统解释执行实现约30倍的性能提升,刷新了目前行业最高水平,同时完全兼容以太坊生态,成为技术新标杆。区块链虚拟机是运行在区块链网络上的一个特殊计算环境,用于处理大量的计算和交易指令,是智能合约和区块链应用(DApp)的“操作系统”。近年来,随着区块链应用的日益复杂和广泛,对虚拟机的综合
4月24日,昆仑万维宣布正式开源其多模态推理模型Skywork-R1V2.0(以下简称R1V2.0)。这一升级版本在视觉与文本推理能力上均实现了显著提升,特别是在高考理科难题的深度推理和通用任务场景中表现出色,堪称当前最均衡兼顾视觉与文本推理能力的开源多模态模型。
近日,AWS AI Labs 推出了 SWE-PolyBench,这是一个多语言的开源基准,旨在为 AI 编程助手的评估提供一个更全面的框架。随着大规模语言模型(LLM)的进步,AI 编程助手的开发已经取得了显著的进展,这些助手能够生成、修改和理解软件代码。然而,目前的评估方法仍然存在诸多局限,许多基准测试往往仅集中在 Python 等单一语言,无法全面反映真实代码库的结构和语义多样性。SWE-PolyBench 通过涵盖21个 GitHub 代码库,支持 Java、JavaScript、TypeScript 和 Python 四种流行编程语言,提供了2110个任务,包
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、Manus开源平替!Kortix-AI正式发布开源通用AI智能体平台SunaKortix-AI推出了Suna,一个开源的通用AI智能体平台,旨在成为Manus的替代品。Suna集成了多种功能,如浏览器自动化、文件管理和API集成,能够通过自然语言对话自动化处理复杂任务。该项目已在GitHub上线,迅速吸引了AI开发者和自动化爱好
一家名为 Nari Labs 的两人创业公司发布了 Dia,这是一个拥有16亿参数的文本转语音 (TTS) 模型,旨在直接从文本提示生成自然对话。其联合创始人 Toby Kim 声称,Dia 的性能超越了 ElevenLabs 等竞争对手的专有产品以及谷歌的 NotebookLM AI 播客生成功能,并可能对 OpenAI 近期发布的 gpt-4o-mini-tts 构成威胁。Kim 在社交媒体 X 上表示,Dia 在质量上可与 NotebookLM 的播客功能媲美,并优于 ElevenLabs Studio 和 Sesame 的开放模型。他透露,该模型是在“零资金”的情况下构建的,并强调他们并非一开始就是人工
Kortix-AI正式发布开源通用AI智能体平台Suna,定位为热门AI工具Manus的开源替代品。据AIbase了解,Suna集成了浏览器自动化、文件管理、网络爬虫、扩展搜索、命令行执行、网站部署及API集成等功能,通过自然语言对话实现复杂任务的自动化处理。项目已在GitHub上线,凭借其强大的功能集与开源特性,迅速成为AI开发者和自动化爱好者的关注焦点。核心功能:多维能力驱动智能自动化Suna以其全面的功能套件和模块化设计,为用户提供了从数据处理到流程自动化的完整解决方案。AIbase梳理了其主要
2025 年 4 月 21 日,Sand AI 发布开源视频生成模型 MAGI-1,以其创新的自回归扩散架构和卓越性能,迅速成为生成式 AI 领域的焦点。该模型采用 Apache 2.0 许可,代码、权重和推理工具已在 GitHub 和 Hugging Face 开放,为全球开发者提供强大创作工具。MAGI-1 基于扩散变换器架构,引入块因果注意力、并行注意力块、Sandwich 规范化等技术创新,通过分块生成(每块 24 帧)实现高效视频生成。其独特流水线设计支持并行处理,最多可同时生成四个块,大幅提升效率。模型通过快捷蒸馏技术,支持灵活的
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、昆仑万维开源SkyReels-V2:无限时长电影生成模型昆仑万维的SkyReels团队推出了SkyReels-V2,这是全球首个基于扩散强迫框架的无限时长电影生成模型。该模型通过结合多模态大语言模型、强化学习等技术,显著提升了视频生成的质量和效率。SkyReels-V2不仅在技术上取得突破,还拓展了应用场景,
近日,Xcode MCP(Model Context Protocol)项目正式开源,为在Visual Studio Code(VS Code)和Cursor中进行iOS开发带来了革命性体验。据AIbase了解,该工具通过MCP协议将Xcode的功能扩展到轻量级编辑器,支持虚拟机启动、日志获取、项目管理与模拟器控制等功能,显著提升了开发效率与灵活性。项目已在GitHub上线,引发了iOS开发者与AI技术爱好者的广泛热议,标志着AI辅助iOS开发的新里程碑。核心功能:无缝集成Xcode与轻量编辑器Xcode MCP通过桥接Xcode的命令行工具与VS Code/Cursor,实现了在非Xcode环境下的完整iOS开