近日,浙江大学与阿里巴巴达摩院联合发布了一项引人瞩目的研究,旨在通过教学视频创建高质量的多模态教科书。这一创新的研究成果不仅为大规模语言模型(VLMs)的训练提供了新的思路,也可能改变教育资源的利用方式。随着人工智能技术的迅猛发展,VLMs 的预训练语料主要依赖图文对数据与图文交织语料。然而,当前的这些数据多来自网页,文本与图像的关联性较弱,知识密度也相对较低,无法有效支持复杂的视觉推理。为了应对这一挑战,研究团队决定从互联网上海量的教学视频
近日,美图公司发布了其图像生成工具 WHEE 的新功能,该工具现在支持生成中文海报。WHEE 以其高品质的素材生成而闻名,此次升级进一步增强了用户体验和功能的多样性。WHEE 的 AI 海报生成功能使得用户可以灵活地处理文字排版。由于传统 AI 文字排版存在随机性和字体风格不可控的问题,美图在此基础上创新性地将文字做成了可编辑的独立图层。用户不仅可以随意拖动文字的位置,还能更改字体,从而实现更自由的排版布局。这一设计极大地提升了用户的操作灵活性,避免了以往海报制
AI 媒体科技公司 Runway 宣布推出其最新的文本生成图像模型 ——Frames。作为一家以 AI 视频模型闻名的公司,Runway 此举意在扩展其在图像创作领域的影响力。Frames 的推出,获得了用户的广泛好评,尤其在生成电影般的视觉效果方面,备受赞誉。该模型在2024年11月首次公布,并在过去几周内先行供给 Runway 创作者计划的用户进行体验,现已向所有订阅用户开放。Frames 的使用需通过 Runway 的无限计划或企业计划进行订阅,月费为95美元,年度订阅则为912美元,而企业计划的年费为1500美元。用户
据智能涌现报道,阿里巴巴智能互联事业群近期正式并入智能信息事业群,由后者总裁吴嘉统一管理。此次整合中,天猫精灵硬件团队与夸克产品团队已开始融合运作,重点布局新一代AI产品规划及能力整合。智能互联作为阿里在2022年成立的一级业务部门,以天猫精灵为核心品牌,是集团重要的To C硬件业务。本次调整后,智能互联将保持独立运作,其业务中心负责人宋刚直接向吴嘉汇报。这一调整紧随去年12月通义业务的架构变动。当时,通义的To C产品及工程团队从阿里云分拆,并入智能