zh
AI产品榜
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
AI产品榜
搜索全球AI产品动态
搜索全球AI信息,发现AI新机遇
新闻资讯
产品应用
变现案例
AI教程
类型 :
新闻资讯
产品应用
变现案例
AI教程
2024-11-19 13:51:41
.
AIbase
.
13.3k
北大团队发布多模态模型 LLaVA-o1,推理能力堪比 GPT-o1!
近日,北京大学等科研团队宣布发布了一款名为 LLaVA-o1的多模态开源模型,据称这是首个能够进行自发、系统推理的视觉语言模型,堪比 GPT-o1。该模型在六个具有挑战性的多模态基准测试中表现优异,其11B 参数的版本超越了其他竞争者,如 Gemini-1.5-pro、GPT-4o-mini 和 Llama-3.2-90B-Vision-Instruct。LLaVA-o1基于 Llama-3.2-Vision 模型,采用了 “慢思考” 推理机制,能够自主进行更加复杂的推理过程,超越了传统的思维链提示方法。在多模态推理基准测试中,LLaVA-o1的表现超出了其基础模型8.9%。该模型的
2024-08-01 17:21:53
.
AIbase
.
10.8k
百度推出飞桨多模态大模型开发套件 PaddleMIX 2.0版本
PaddleMIX2.0是百度推出的多模态大模型开发套件,旨在简化多模态应用开发,支持自动驾驶、智慧医疗、搜索引擎等场景。其关键亮点包括: 1. **丰富的模型库**:涵盖图像、文本、视频、音频,新增LLaVA系列模型,提供前沿技术支持。 2. **全流程开发体验**:配备DataCopilot和Auto模块,简化多模态模型训练流程。 3. **高性能训练能力**:DiT模型支持3B规模预训练,采用MixToken策略提升训练吞吐量。 4. **应用构建工具**:AppFlow和ComfyUI简化多模态应用构建和AIGC任务操作。 5. **性能提升**:在大规模预训练、高效精调和高性能推理方面均有显著优化。 PaddleMIX2.0的发布旨在降低开发门槛,推动AI应用创新,通过开源项目促进社区发展。
2024-01-31 10:12:49
.
AIbase
.
5.1k
微软开源多模态模型LLaVA-1.5媲美GPT-4V效果
["微软开源了多模态模型LLaVA-1.5,继承LLaVA架构并引入新特性。","研究人员对其在视觉问答、自然语言处理、图像生成等进行了测试显示,LLaVA-1.5达到了开源模型中的最高水平,可"]
2023-10-12 14:03:18
.
AIbase
.
2.0k
开源GPT-4 Vision的替代方案即将到来
["💡<b>开源大模型的发展趋势</b>:LLaVA 1.5这类开源模型正在快速发展,有望成为GPT-4 Vision等商业闭源模型的有力竞争对手。","🔥<b>LLaVA 1.5的技术亮点</b>:整合CLIP图像编码器、LLaMA语言模型和MLP连接器,只需600k训练样本和1天时间就取得非常好的多模态基准测试结果。","📈<b>LLaVA 1.5的效率优势</b>:相比其他开源大模型,它的计算效率更高,资源消耗更低,训练难度也较小。"]
2023-10-12 09:26:09
.
AIbase
.
2.0k
浙大校友与微软合作推出多模态模型LLaVA,挑战GPT-4V
["浙大校友合作微软研究院推出多模态模型LLaVA,挑战GPT-4V。","LLaVA在11个测试数据集上表现出色,获得6k+星标。","模型综合能力高,超过GPT-4V水平的85%。","LLaVA的开源代码、模型和训练数据已经可供使用。"]