zh
红薯智语
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
红薯智语
搜索全球AI产品动态
搜索全球AI信息,发现AI新机遇
新闻资讯
产品应用
变现案例
AI教程
类型 :
新闻资讯
产品应用
变现案例
AI教程
2024-10-25 11:16:59
.
AIbase
.
12.7k
Salesforce AI研究推全新多模态模型BLIP-3-Video:低成本搞定视频理解
最近,Salesforce AI 研究团队推出了一款全新的多模态语言模型 ——BLIP-3-Video。随着视频内容的快速增加,如何高效处理视频数据成为了一个亟待解决的问题。这款模型的出现,旨在提升视频理解的效率和效果,适用于从自动驾驶到娱乐等各个行业。传统的视频理解模型往往是逐帧处理视频,生成大量的视觉信息。这一过程不仅消耗了大量的计算资源,还极大地限制了处理长视频的能力。随着视频数据量的不断增长,这种方法变得愈发低效,因此,找到一种既能捕捉到视频的关键信息,又能
2024-01-23 09:25:59
.
AIbase
.
5.0k
零一万物发布 Yi-VL 多模态语言模型 包括两个版本
["零一万物 Yi-VL 多模态语言模型上线,包括 Yi-VL-34B 和 Yi-VL-6B 两个版本","Yi-VL 模型在图文理解和对话生成方面具备卓越能力","Yi-VL 模型在英文和中文数据集上取得领先成绩","Yi-VL-34B 以 41.6% 的准确率超越其他多模态大模型","Yi-VL 模型基于 LLaVA 架构,具备强大的语言理解和生成能力"]
2023-11-29 14:23:31
.
AIbase
.
3.7k
新加坡国立大学发布开源多模态语言模型 NExT-GPT,助力多媒体 AI 应用发展
["NExT-GPT 是新加坡国立大学开源的多模态语言模型,支持处理文本、图像、视频和音频,为多媒体人工智能应用提供强大支持。","采用三层架构,包括线性投影、Vicuna LLM 核心和模态特定的转换层,通过 MosIT 技术进行中间层训练。","开源贡献使研究者和开发者能够创建集成多模态输入的应用,潜在应用领域广泛。","NExT-GPT 独特之处在于能够根据用户请求生成模态信令标记,为不同媒体类型的人工智能应用提供了新的可能性。"]
2023-10-30 14:41:15
.
AIbase
.
2.6k
苹果和哥伦比亚大学联手开发Ferret多模态语言模型
["苹果和哥伦比亚大学研究人员共同开发了Ferret多模态语言模型,旨在实现高级图像理解和描述。","Ferret模型具备强大的全局理解能力,能够处理自由文本和引用区域,性能领先传统模型。","研究人员创建了GRIT数据集,包括1.1百万个样本,用于指导模型进行引用和定位任务。","Ferret-Bench评估显示,Ferret性能平均优于最佳MLLM模型20.4%,并减少了对象幻觉。"]