谷歌发布开源大模型 Gemme,转变开源策略

甲子光年
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
谷歌近期推出了 Gemma3系列的全新版本,这一消息让众多 AI 爱好者为之振奋。仅在上线一个月后,谷歌便发布了经过量化感知训练(QAT)优化的 Gemma3,旨在显著降低内存需求的同时,保持模型的高质量。具体来说,经过 QAT 优化的 Gemma327B 模型,其显存需求从54GB 大幅降低到14.1GB,意味着用户现在可以在 NVIDIA RTX3090等消费级 GPU 上本地运行这一大型模型。通过简单的测试,配备 RTX3070的机器也能运行 Gemma3的12B 版本,尽管其 token 输出速度稍显不足,但整体性能仍在可接受范围之内。QAT 的神奇
4月21日,科大讯飞正式宣布其最新升级的人工智能模型 —— 讯飞星火 X1,力图在智能推理和多任务处理领域与 OpenAI 的 o1和 DeepSeek R1媲美。这一全国产算力训练的深度推理大模型在各项通用任务中表现突出,涵盖数学、编程、逻辑推理、文本生成、语言理解以及知识问答等多方面。在此次升级中,讯飞星火 X1通过融入更多复杂场景的数据,大幅提升了模型的泛化能力,使其在教育、医疗和司法等重点行业的表现更加卓越。科大讯飞表示,尽管星火 X1的模型参数相较于业界同类产品小了一个
近日,Xcode MCP(Model Context Protocol)项目正式开源,为在Visual Studio Code(VS Code)和Cursor中进行iOS开发带来了革命性体验。据AIbase了解,该工具通过MCP协议将Xcode的功能扩展到轻量级编辑器,支持虚拟机启动、日志获取、项目管理与模拟器控制等功能,显著提升了开发效率与灵活性。项目已在GitHub上线,引发了iOS开发者与AI技术爱好者的广泛热议,标志着AI辅助iOS开发的新里程碑。核心功能:无缝集成Xcode与轻量编辑器Xcode MCP通过桥接Xcode的命令行工具与VS Code/Cursor,实现了在非Xcode环境下的完整iOS开
在刚刚结束的第十八届中国电子信息年会上,中国电子学会公布了2024年度科学技术奖的获奖名单。其中,由清华大学、北京中关村实验室和蚂蚁集团联合研发的项目《高效协作的互联网动态行为安全可信关键技术与应用》荣获科技进步一等奖。这一成果的获得,不仅展示了前沿科技在安全可信领域的巨大潜力,也为应对日益复杂的网络环境提供了有效方案。随着互联网的普及,恶意流量攻击和隐蔽的网络风险层出不穷,构建一个更安全的互联网环境已经成为了社会各界的共识。这个联合项
科大讯飞宣布其深度推理大模型讯飞星火 X1完成全新升级。作为业界唯一基于全国产算力训练的深度推理大模型,讯飞星火 X1在多个关键领域实现了显著突破,进一步巩固了其在 AI 领域的领先地位。
昆仑万维 SkyReels 团队正式发布并开源了 SkyReels-V2,这是全球首个使用扩散强迫(Diffusion-forcing)框架的无限时长电影生成模型。该模型通过结合多模态大语言模型(MLLM)、多阶段预训练、强化学习和扩散强迫框架来实现协同优化,标志着视频生成技术迈入了一个新的阶段。
Intel近日宣布,其专为本地生成式AI设计的AI Playground软件正式开源,为Intel Arc GPU用户提供了一个强大的AI模型运行平台。据AIbase了解,AI Playground支持多种图像、视频生成模型以及大型语言模型(LLMs),通过优化本地计算资源,显著降低了AI应用的硬件门槛。项目已在GitHub发布,吸引了全球开发者与AI爱好者的广泛关注,标志着Intel在开源AI生态中的重要布局。核心功能:多模态AI模型一站式支持AI Playground作为一款用户友好的“AI中心”,集成了丰富的生成式AI功能,涵盖图像生成、图像风格化
近日,Persona Engine(人格引擎)项目正式开源,凭借其融合大语言模型(LLM)、Live2D、自动语音识别(ASR)、文本转语音(TTS)以及实时语音克隆(RVC)等前沿技术的强大功能,引发了AI与虚拟内容创作领域的广泛关注。据AIbase了解,该项目通过赋予虚拟角色自然对话与动态表情能力,实现了与虚拟人物的实时交互,特别适用于VTubing、直播和虚拟助手场景。项目已在GitHub上线,标志着AI驱动虚拟交互技术的又一里程碑。图源备注:图片由AI生成,图片授权服务商Midjourney核心功能:多技术融合实现沉浸式交
想象一下,你辛辛苦苦训练出一个聪明绝顶的 AI 大模型,它能帮你处理各种复杂的任务。但是,如果通往这个聪明大脑的“管道”——也就是模型上下文协议(MCP)——不够安全,那岂不是给黑客们留下了可乘之机? 别担心!由区块链安全领域的专家 SlowMist(慢雾科技) 倾力打造的 MCP 安全检查清单,就像一个专业的“AI 神盾局”,它为基于 MCP 的 AI 工具提供了一份全面的安全指南,旨在保护你的 LLM 插件生态系统免受各种潜在威胁。自从2024年底 MCP 发布以来,它已经被广泛应用于 Claude Des
字节跳动研究团队宣布开源 ChatTS-14B,这是一款专为时间序列数据理解和推理设计的140亿参数大型语言模型(LLM)。以 Apache2.0许可协议发布,ChatTS-14B 的开源引发了 AI 社区的广泛关注,被认为是时间序列分析与生成式 AI 结合的重大进展。ChatTS-14B:时间序列的智能对话引擎ChatTS-14B 基于 Qwen2.5-14B-Instruct 模型进行微调,专为处理时间序列数据而设计,能够理解和推理复杂的时序数据模式。不同于传统时间序列分析工具,ChatTS-14B 支持用户通过自然语言与时间序列数据交互,例如分析金融市场趋