智谱 AI 开源视觉语言模型 CogAgent,支持 GUI 图形界面问答

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、阿里通义千问Qwen2.5-Omni登顶全球开源模型榜单2024年4月2日,HuggingFace发布了最新的大模型榜单,阿里巴巴的Qwen2.5-Omni凭借其卓越的性能和多模态能力,成功登顶,成为全球开源模型的领军者。尽管没有进行大规模宣传,这一举措被认为是OpenAI在推动AI教育普及方面的重要一步,受到业内人士的广泛欢迎。
2024年4月2日,全球最大的 AI 开源社区 Hugging Face 发布了最新的大模型榜单,阿里巴巴的通义千问所推出的端到端全模态大模型 Qwen2.5-Omni 成功登顶,成为全球开源模型中的领军者。此次排名中,Qwen2.5-Omni 凭借其强大的性能和多模态能力,战胜了其他众多优秀的模型,位列榜首。紧随其后的是 DeepSeek-V3-0324和群核的 SpatialLM-Llama-1B,这两个模型在功能和应用上也颇具实力,为 AI 开发者提供了更多选择。据悉,阿里通义千问自成立以来,已经向全球开源了超过200款模型。这些模型覆盖了自然语言
随着人工智能(AI)技术的迅速发展,如何在大规模环境下有效应用这些技术成为了一大挑战。近日,Arthur正式推出了Arthur Engine,这是一款首个开源的实时 AI 评估引擎,旨在帮助团队监控、调试和改进生成式 AI 及传统机器学习(ML)模型。其最大的特点是无需依赖第三方工具,确保数据隐私安全,同时也完全免费。在2025年,实时 AI 评估的重要性愈加凸显。随着 AI 技术的广泛应用,相关风险也在不断增加。例如,调查显示,8.5% 的员工提示中包含敏感数据,模型在没有持续监控的情况下会发
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、Runway惊艳发布AI视频生成模型Gen-4,角色场景一致性强到离谱Runway最近推出的Gen-4人工智能模型在媒体生成领域引起了广泛关注。尽管X在过去经历了波动,但近期因与GrokAI的整合和利润率改善逐渐回暖,用户也在回流。
4月1日下午,途牛旅游网宣布其自主研发的“AI助手小牛”旅游应用Agent正式上线,同步登陆途牛旅游APP和“AI助手小牛”小程序。据介绍,“AI助手小牛”创新性地采用了开源大模型DeepSeek和通义千问,并深度融合旅行垂直应用场景,旨在为用户提供更便捷高效的出行体验。通过“AI助手小牛”,用户可以轻松实现机票、酒店、火车票的快捷查询和预订。更值得一提的是,该AI助手还具备智能推荐出行方案的能力,能够根据用户需求提供个性化的旅行建议。途牛此举标志着AI技术在在线旅游领
近日,顺丰同城宣布,将在各个业务环节全面推进运营数字化和人工智能(AI)决策的智能化。公司希望借此建立一个更适合即时配送行业的大型模型基础设施,以实现更高效的运营和服务。为了实现这一目标,顺丰同城依托 DeepSeek 的开源生态系统及其多模态 AI 能力,能够快速进行定制化开发。这意味着,顺丰同城可以根据不同客户的具体需求,迅速调整其服务和产品,以满足市场的多样性。这种灵活性大大缩短了项目的落地周期,使公司能够在激烈的市场竞争中保持优势。目前,顺丰同
OpenAI 首席执行官山姆・阿尔特曼(Sam Altman)今天在社交媒体上宣布,该公司将在未来几个月内发布一个开源的人工智能模型。这一消息引发了广泛关注,尤其是在中国公司 DeepSeek 的 R1模型取得突破性成功后,OpenAI 感受到来自同行的压力,特别是来自 Meta 公司 Llama 系列模型的竞争。阿尔特曼表示,OpenAI 早已在考虑推出开源模型,现在时机成熟,发布这样的模型变得尤为重要。开源模型意味着用户可以免费下载、修改和在本地硬件上运行,而非仅通过云端服务访问。这种模式不仅降低了使
近日,谷歌宣布推出全新开源模型 TxGemma,专为提升治疗性药物的研发效率而设计。这一模型由谷歌 DeepMind 团队基于其先进的 Gemma 模型家族微调开发,融合了强大的语言理解、科学预测以及多轮对话功能,旨在为药物研发领域带来革命性的突破。TxGemma 的发布被视为人工智能技术在生物医药领域的重要进展,有望大幅缩短药物从实验室到临床的周期,同时降低高昂的研发成本和失败率。全流程支持药物研发TxGemma 的核心优势在于其能够模拟药物研发的完整流程,从早期药物筛选到后期临床
近日,由香港科技大学与音乐领域的 DeepSeek 合作开发的开源音乐生成模型 YuE 正式发布,震惊了不少乐迷和音乐创作者。这一模型不仅能够生成多种风格的音乐,还可以模拟人声,给听众带来全新的音乐体验。YuE 的特点在于其双 LLaMA 语言模型架构,这使其能够无缝适配各种大语言模型,并且能够处理长达5分钟的完整歌曲。这一创新的设计让 YuE 在音乐生成的质量上达到了前所未有的高度,甚至与市场上著名的闭源音乐生成工具 Suno 和 Udio 相抗衡。YuE 可以同时生成专业级的歌声和伴奏,实
腾讯开源团队宣布推出了一项创新的多模态理解技术——HaploVL。这一技术旨在通过单个Transformer架构实现高效的多模态融合,显著提升AI在视觉和语言交互中的表现,特别是在细粒度视觉理解任务上。