zh
AI产品榜
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
AI产品榜
搜索全球AI产品动态
搜索全球AI信息,发现AI新机遇
新闻资讯
产品应用
变现案例
AI教程
类型 :
新闻资讯
产品应用
变现案例
AI教程
2025-01-20 14:04:10
.
AIbase
.
14.8k
MIT、 DeepMind研究揭示视觉语言模型无法理解否定表达的原因
在多模态任务中,视觉语言模型(VLMs)起着至关重要的作用,如图像检索、图像说明和医学诊断等。这些模型的目标是将视觉数据与语言数据进行对齐,以实现更高效的信息处理。然而,目前的 VLMs 在理解否定方面仍面临重大挑战。否定在许多应用中至关重要,例如区分 “没有窗户的房间” 和 “有窗户的房间”。尽管 VLMs 取得了显著进展,但在处理否定陈述时,现有模型的表现却大幅下降。这种限制尤其在安全监控和医疗保健等高风险领域中显得尤为重要。现有的 VLMs,如 CLIP,采用共
2024-08-22 17:39:25
.
AIbase
.
11.2k
北大联手打造图像检索革命:草图、艺术画、低分辨率一网打尽!
北京大学袁粒课题组与南洋理工大学、清华自动化所研究人员合作开发了一种创新的图像检索技术,旨在通过草图、艺术画甚至低分辨率图像精准匹配用户需求。这项技术的核心是“通用风格检索”方法,它能够处理多种查询风格,包括文本、草图、艺术画等组合,显著提升检索灵活性和准确性。研究团队构建了DSR和ImageNet-X数据集,为新方法提供训练和测试资源。FreestyleRet框架通过风格提取、空间构建和提示微调模块,实现了对不同风格查询向量的有效处理,实验结果显示其在DSR和ImageNet-X数据集上取得了优异性能。研究成果已公开发布,并提供开源代码和数据集,为图像检索领域的技术进步和应用开辟了新途径。