zh
红薯智语
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
红薯智语
搜索全球AI产品动态
搜索全球AI信息,发现AI新机遇
新闻资讯
产品应用
变现案例
AI教程
类型 :
新闻资讯
产品应用
变现案例
AI教程
2024-10-28 16:11:31
.
AIbase
.
12.8k
AI重大发现:最先进视觉模型在基础视觉推理能力上仍显不足
来自德国达姆施塔特工业大学的最新研究揭示了一个令人深思的现象:即便是当前最先进的AI图像模型,在面对简单的视觉推理任务时也会出现明显失误。这项研究结果对AI视觉能力的评估标准提出了新的思考。研究团队采用了由俄罗斯科学家Michail Bongard设计的Bongard问题作为测试工具。这类视觉谜题由12张简单图像组成,分为两组,要求识别出区分这两组的规则。对于大多数人来说,这种抽象推理任务并不困难,但AI模型的表现却令人意外。即便是目前被认为最先进的多模态模型GPT-4o,在100个
2024-08-21 14:20:32
.
AIbase
.
11.2k
为复杂视觉推理而生!微软发布Phi-3.5-vision 轻量级、多模态开源模型
微软发布Phi-3.5-vision,一款轻量级、多模态开源AI模型,专为处理文本和视觉输入设计,支持128K上下文长度。该模型适用于资源受限环境,具备图像理解、OCR、图表解析、多图像摘要等功能,展现出色性能和低延迟。由42亿参数构成,通过高质量数据训练,确保性能和隐私。包含三款模型:轻量级AI、专家混合和多模态模型,均在图像和视频处理基准测试中表现出优异成绩。此模型适合AI驱动应用,特别是端侧运行和复杂视觉推理,提供强大支持。