zh
AI产品榜
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
AI产品榜
搜索全球AI产品动态
搜索全球AI信息,发现AI新机遇
新闻资讯
产品应用
变现案例
AI教程
类型 :
新闻资讯
产品应用
变现案例
AI教程
2024-12-18 11:23:53
.
AIbase
.
14.1k
字节推出豆包视觉推理大模型:价格低至0.003元/千token
12月18日,在火山引擎FORCE原动力大会上,火山引擎总裁谭待发布了全新的豆包视觉理解大模型。该模型通过同时处理文本和图像相关信息,能够提供更为精准的答案。新模型在内容识别、理解和推理能力方面表现出色,并且具备更细腻的视觉描述能力,为企业用户带来了更强的智能处理能力。谭待在发布会上透露,豆包视觉理解大模型不仅在技术上实现了显著突破,而且在价格方面也大幅降低。自今年5月起,豆包大模型的行业价格已经降低了99%,使得企业用户能够更放心地应用这一技术。
2024-10-28 16:11:31
.
AIbase
.
12.8k
AI重大发现:最先进视觉模型在基础视觉推理能力上仍显不足
来自德国达姆施塔特工业大学的最新研究揭示了一个令人深思的现象:即便是当前最先进的AI图像模型,在面对简单的视觉推理任务时也会出现明显失误。这项研究结果对AI视觉能力的评估标准提出了新的思考。研究团队采用了由俄罗斯科学家Michail Bongard设计的Bongard问题作为测试工具。这类视觉谜题由12张简单图像组成,分为两组,要求识别出区分这两组的规则。对于大多数人来说,这种抽象推理任务并不困难,但AI模型的表现却令人意外。即便是目前被认为最先进的多模态模型GPT-4o,在100个
2024-08-21 14:20:32
.
AIbase
.
11.2k
为复杂视觉推理而生!微软发布Phi-3.5-vision 轻量级、多模态开源模型
微软发布Phi-3.5-vision,一款轻量级、多模态开源AI模型,专为处理文本和视觉输入设计,支持128K上下文长度。该模型适用于资源受限环境,具备图像理解、OCR、图表解析、多图像摘要等功能,展现出色性能和低延迟。由42亿参数构成,通过高质量数据训练,确保性能和隐私。包含三款模型:轻量级AI、专家混合和多模态模型,均在图像和视频处理基准测试中表现出优异成绩。此模型适合AI驱动应用,特别是端侧运行和复杂视觉推理,提供强大支持。