zh
红薯智语
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
红薯智语
搜索全球AI产品动态
搜索全球AI信息,发现AI新机遇
新闻资讯
产品应用
变现案例
AI教程
类型 :
新闻资讯
产品应用
变现案例
AI教程
2024-10-29 10:44:52
.
AIbase
.
12.8k
xAI为Grok添加图像理解功能 还能看懂梗图的幽默
马斯克旗下xAI公司近日为其AI模型Grok增添了图像理解功能,X平台付费用户现可向AI助手上传图片并进行相关提问。这项更新已经由xAI员工和Grok官方发言人在X平台正式确认。马斯克在平台上展示了Grok的新能力,称其不仅能理解图片内容,还能解读图片中蕴含的幽默元素。不过他也坦言,目前这项功能仍处于早期阶段,团队将持续改进完善。值得注意的是,自今年8月面向高级用户推出Grok-2模型以来,xAI一直在积极扩展其功能范畴。通过与黑森林实验室(Black Forest Labs)的FLUX.1模型合作,Grok已
2024-09-20 09:06:14
.
AIbase
.
11.9k
阿里国际推出最新多模态大模型 Ovis,看菜品就能提供烹饪步骤
在近日的发布会上,阿里国际 AI 团队揭晓了其最新研发的多模态大模型 Ovis,这一创新的 AI 技术无疑为各行业带来了新的机遇。Ovis 具备强大的图像理解和数据处理能力,让人耳目一新。Ovis 的多模态能力极其强大,它能够处理文本、图像等多种数据,展现出优秀的综合实力。与传统的大语言模型相比,Ovis 不仅能理解文本,还能对图像等非文本信息进行深入分析。比如说,用户只需上传一张菜品的照片,Ovis 便能迅速识别并提供详细的烹饪步骤,帮助用户轻松做出美味佳肴。Ovis通过对图片
2024-08-30 07:55:47
.
AIbase
.
11.4k
阿里通义千问团队推出Qwen2-VL模型 支持实时分析动态视频
阿里巴巴达摩院的通义千问团队在2024年8月30日宣布了其最新成果——Qwen2-VL模型的重大更新。Qwen2-VL模型在图像理解、视频处理和多语言支持方面均实现了显著提升,为关键性能指标设定了新的基准。
2024-08-21 14:20:32
.
AIbase
.
11.2k
为复杂视觉推理而生!微软发布Phi-3.5-vision 轻量级、多模态开源模型
微软发布Phi-3.5-vision,一款轻量级、多模态开源AI模型,专为处理文本和视觉输入设计,支持128K上下文长度。该模型适用于资源受限环境,具备图像理解、OCR、图表解析、多图像摘要等功能,展现出色性能和低延迟。由42亿参数构成,通过高质量数据训练,确保性能和隐私。包含三款模型:轻量级AI、专家混合和多模态模型,均在图像和视频处理基准测试中表现出优异成绩。此模型适合AI驱动应用,特别是端侧运行和复杂视觉推理,提供强大支持。