zh
AI产品榜
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
AI产品榜
搜索全球AI产品动态
搜索全球AI信息,发现AI新机遇
新闻资讯
产品应用
变现案例
AI教程
类型 :
新闻资讯
产品应用
变现案例
AI教程
2025-01-20 17:54:54
.
AIbase
.
14.9k
大模型新突破:从教学视频中提炼高质量多模态教科书
近日,浙江大学与阿里巴巴达摩院联合发布了一项引人瞩目的研究,旨在通过教学视频创建高质量的多模态教科书。这一创新的研究成果不仅为大规模语言模型(VLMs)的训练提供了新的思路,也可能改变教育资源的利用方式。随着人工智能技术的迅猛发展,VLMs 的预训练语料主要依赖图文对数据与图文交织语料。然而,当前的这些数据多来自网页,文本与图像的关联性较弱,知识密度也相对较低,无法有效支持复杂的视觉推理。为了应对这一挑战,研究团队决定从互联网上海量的教学视频
2025-01-15 08:41:23
.
AIbase
.
14.7k
阿里巴巴达摩院推出电商场景多模态大模型Valley 2
阿里巴巴达摩院近日推出了一款名为Valley2的多模态大型语言模型,该模型基于电商场景设计,旨在通过可扩展的视觉-语言架构,提升各领域性能并拓展电商与短视频场景的应用边界。Valley2采用了Qwen2.5作为LLM主干,搭配SigLIP-384视觉编码器,结合MLP层和卷积进行高效特征转换。
2025-01-06 09:30:25
.
AIbase
.
14.5k
阿里团队出品!妆容迁移技术SHMT:提供化妆参考图就能给你上妆
近日,阿里巴巴达摩院的研究团队发布了一项重要研究成果,名为 “SHMT:自监督层次化妆转移”,该论文已被国际顶级学术会议 NeurIPS2024接收。这项研究展示了一种新的化妆效果转移技术,利用潜在扩散模型(Latent Diffusion Models)来实现化妆图像的精准生成,为化妆应用和图像处理领域注入了新活力。简单的说,SHMT是一项妆容迁移技术,只要一个化妆的参考图,和一张目标角色照片,就可以把妆容效果迁移到该目标脸上。团队在项目中采用了开源的方式,发布了训练代码、测试代码以及预
2024-10-23 16:09:22
.
AIbase
.
12.7k
阿里巴巴达摩院开源CoI-Agent:一键生成科研idea的AI研究助手
阿里巴巴达摩院最近开源了一款名为CoI-Agent的AI工具,可以帮助科研人员自动生成科研idea。这个工具可以根据输入的论文主题,快速生成相关的科研idea,帮助科研人员节省时间和提高效率。CoI-Agent可以被视为一个AI研究助手,可以帮助科研人员头脑风暴、发散思维,找到新的研究方向和idea。这个工具可以根据输入的主题,快速生成相关的关键词、研究问题、研究方法等,帮助科研人员快速找到研究方向。阿里巴巴达摩院开源CoI-Agent的目的是希望能够帮助科研人员提高研究效率,找到新的研
2024-10-21 11:00:25
.
AIbase
.
12.6k
表格、图表统统拿下!阿里达摩院开源DocOwl 1.5 无需OCR,高效“读懂”文档!
阿里巴巴达摩院与中国人民大学近日联合开源了一款名为 mPLUG-DocOwl1.5的文档处理模型,该模型主打无需 OCR 识别即可理解文档内容,并在多个视觉文档理解基准测试中取得了领先的性能。结构信息对于理解富文本图像(例如文档、表格和图表)的语义至关重要。 现有的多模态大型语言模型 (MLLM) 虽然具备文本识别能力,但缺乏对富文本文档图像的通用结构理解能力。为了解决这一问题,mPLUG-DocOwl1.5强调结构信息在视觉文档理解中的重要性,并提出了 “统一结构学习” 来提升 MLLM 的性能。