加州大学圣克鲁斯分校研发开源多模态模型 MiniGPT-5

AIGC 开放社区

发布于AI新闻资讯 · 1 分钟阅读 · 2023年11月3号 9:35

加州大学圣克鲁斯分校研发的 MiniGPT-5 模型通过引入 Generative Vokens 技术，实现了文本特征空间和图像特征空间的对齐。该模型在多个数据集上的测试中展现出优于对比基线的性能，证明了其强大的适应能力。MiniGPT-5 为多模态生成提供了统一的高效解决方案，突破了技术瓶颈。

阿里云 Qwen2.5-1M 开源发布:100万上下文长度模型登场

继 DeepSeek R1之后，阿里云通义千问团队刚刚宣布推出其最新的开源模型 Qwen2.5-1M，再次引发业界关注。此次发布的 Qwen2.5-1M 系列包含两个开源模型:Qwen2.5-7B-Instruct-1M 和 Qwen2.5-14B-Instruct-1M。这是通义千问首次推出能够原生支持百万Token上下文长度的模型，并在推理速度上实现了显著提升。Qwen2.5-1M 的核心亮点在于其原生支持百万 Token 的超长上下文处理能力。这使得模型能够轻松应对书籍、长篇报告、法律文件等超长文档，无需进行繁琐的分割处理。同时，该模型还支持更长时间、更深入的对话

国产大模型突破！DeepSeek V3挑战Claude 3.5 Sonnet实测全记录

近期，国产大模型DeepSeek V3在AI竞技场的优异表现引发业界关注。作为唯一闯入前十的开源模型，它不仅超越了o1-mini，在编程、数学等多个领域甚至超过了Claude3.5Sonnet。为验证其实际能力，多方展开了一系列实测对比。在基础理解能力测试中，两个模型展现出不同特点。面对中文脑筋急转弯"小明的妈妈有三个孩子"的问题，DeepSeek V3表现出色，不仅答对还进行了自我验证。但在英文双关语"April Fools Day"的测试中则略显不足，未能理解其中的语言巧思，而Claude3.5Sonnet则轻松应对。逻辑推理测试

无问芯穹发布首个端侧全模态理解开源模型Megrez-3B-Omni，融资接近10亿元

国内人工智能公司无问芯穹宣布开源其最新研发的端侧全模态理解 AI 模型 ——Megrez-3B-Omni。这一模型是全球首个此类开源项目，标志着该公司在 AI 领域的创新发展。与此同时，无问芯穹还推出了纯语言版本的模型 Megrez-3B-Instruct，以进一步丰富其产品线。无问芯穹成立于2023年5月，创始团队来自清华大学电子工程系。公司致力于打造高效的 AI 计算优化能力，以实现大模型的有效落地。其独特的解决方案包括 “端模型 + 端软件 + 端 IP” 的一体化智能系统，力求在多个芯片上实现多种大模型

上海AI实验室推大模型“指纹识别”方法REEF，打击“套壳”行为

在 AI 时代，大型语言模型（LLM）就像武林秘籍，其训练过程耗费巨大算力、数据，就像闭关修炼多年的武林高手。而开源模型的发布，就像高手将秘籍公之于众，但会附带一些许可证(如 Apache2.0和 LLaMA2社区许可证)来保护其知识产权(IP)。然而，江湖险恶，总有“套壳”事件发生。一些开发者声称自己训练了新的 LLM，实际上却是在其他基础模型（如 Llama-2和 MiniCPM-V）上进行包装或微调。这就好像偷学了别人的武功，却对外宣称是自己原创的。为了防止这种情况发生，模型所有者和第三方迫