数字人点燃亚运主火炬,从这篇 ICCV 论文透视蚂蚁的生成式 AI 黑科技

微信公众平台
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
高通公司近日宣布完成对越南人工智能研究公司 MovianAI 的收购,虽然交易的具体金额尚未露,但这一举动在业内引起了广泛关注。MovianAI 原为越南企业集团 Vingroup 旗下的 VinAI 的生成式 AI 部门。此举标志着高通在 AI 技术领域的持续扩张,并将进一步增强其在全球市场的竞争力。收购完成后,MovianAI 的创始人兼首席执行官 Hung Bui 博士也将加入高通。Hung Bui 博士曾是 Google DeepMind 的研究人员,拥有丰富的人工智能研发经验,这为高通的技术团队注入了新的活力和视角。高通在声明中表示,此
根据 Gartner 最新发布的报告,预计到2025年,全球生成式 AI(人工智能)支出将达到6440亿美元,这一数字相比2024年将增长76.4%。这一增长趋势引起了业内的广泛关注,各大分析机构纷纷表示,企业对生成 AI 的采用和支出正在不断上升。图源备注:图片由AI生成,图片授权服务商Midjourney报告指出,硬件将占据2025年生成式 AI 支出的大头,预计将占到80%。具体来说,设备支出将达到3983亿美元,增长率高达99.5%;服务器的支出将达到1806亿美元,增长率为33.1%;而软件支出则相对较少,仅为372亿美元,
亚马逊近日在其购物工具中进一步融合了人工智能,以鼓励消费者增加购买。该公司在周三宣布推出新功能 “兴趣”,旨在打造个性化和对话式的搜索体验。通过这一新功能,用户可以在搜索栏中输入与自身兴趣、偏好甚至预算相关的定制化提示。例如,用户可以搜索 “适合爱好者的模型制作套件及配件” 或 “咖啡爱好者的冲泡工具和小玩意”。“兴趣” 功能利用大型语言模型(LLMs),将日常语言转换为传统搜索引擎可以理解的查询,从而提供更相关的产品建议。此外,该工具会在后
商汤集团发布了其年度财务报告,展示了公司在过去一年中的经营成果。整体上,商汤集团在 2024 年度实现了 37.7 亿元人民币的收入,同比增加了 10.8%。在这份财报中,生成式 AI 业务的表现尤为亮眼,其收入达到了 24 亿元,年增长率高达 103.1%。这一增长标志着商汤的生成式 AI 业务连续两年实现三位数的增长。根据财报,生成式 AI 业务的收入在公司整体收入中占比显著提升,由 2023 年的 34.8% 上升至 63.7%。这表明商汤在该领域的业务拓展和市场需求持续走强。尽管公司整体收入有所增长,
人工智能创意平台DomoAI近日宣布推出了一项令人兴奋的新功能:通过上传语音和图像即可生成会说话的数字人。这一功能的亮相迅速在X平台上引发热烈讨论,被视为数字内容创作领域的一次重要革新。据X平台上的最新信息,这一新功能允许用户将任意图像与语音文件结合,快速生成具有自然语言表达能力的虚拟人物。生成的数字人不仅能根据上传的语音内容进行口型同步,还支持多种时长选择,从5秒短视频到最长60秒的完整片段,满足不同场景需求。用户反馈显示,该功能的生成速度远超
京东“黑板报”今日发布重磅消息,宣布京东科技人工智能团队凭借其“多模态交互式数字人关键技术及产业应用”项目,荣获中国智能科学技术领域的最高荣誉——吴文俊人工智能科学技术奖特等奖。据悉,这是本年度该奖项的唯一一个特等奖。这并非京东首次在该奖项中斩获殊荣。此前,京东分别在 2021 年和 2022 年因“商品智能匹配关键技术及在营销中的应用”以及“任务型智能对话交互关键技术及大规模产业应用”而获奖。此次再次获得最高奖项,充分体现了京东在人工智能技术领
在近日举行的世界互联网大会国际组织新闻发布会上,香港特区政府创新科技及工业局局长孙东宣布,香港首个自主研发的生成式 AI 大模型将在今年正式向全社会推出。这一重要消息标志着香港在人工智能领域迈出了新的步伐,进一步推动了本地科技生态的快速发展。孙东表示,除了注重技术的开发,团队还特别关注人工智能技术的治理。为此,专家小组经过一年多的深入研究,即将推出一套生成式人工智能的指引,旨在为 AI 技术的开发者、服务提供商及应用者提供必要的框架和建议,
根据Hedra 在X平台上的最新消息,Hedra Studio正式推出了其全新AI模型——Character-3,这一模型被认为是数字人视频生成技术的一次重大飞跃。Hedra通过整合尖端AI技术,为内容创作者和企业营销人员提供了更高效、更具创意的内容生成工具,标志着AI驱动的叙事方式迈向了新的高度。Character- 3 模型:多模态融合的创新Character- 3 模型具备同时处理多种输入类型的能力,包括图像、文本和音频,并能将这些元素无缝融合,生成高质量的视频内容。用户只需上传一张人物照片,输入一段文本或音频,
还在对着照片让AI“张张嘴”?那你就Out了! AI数字人领域迎来王炸级更新!字节跳动旗下即梦AI平台重磅宣布, “数字人-大师模式”功能全线引爆上线! 这项黑科技,直接将数字人制作门槛拉低到前所未有的程度——只需上传一张照片,再配上一段音频,AI就能瞬间为你打造出一个“高阶数字人”视频! 创作门槛瞬间“骨折”,自由度却直线飙升!更让人惊艳的是,新一代数字人动效逼真到令人咋舌,彻底甩开了以往那些“僵硬”模型的几条街!彻底告别“照片说话”的尴尬! “大师模式”最令人
即梦 AI 发布了一项全新的 “动作模仿” 功能,旨在为用户提供更加生动和真实的 AI 视频创作体验。这项功能由字节跳动的智能创作数字人团队提供技术支持,允许用户只需通过即梦 AI 的数字人入口,上传一张人物图片和一条参考视频,即可生成动态视频,让图片中的人物能够模仿参考视频中的动作,并准确还原情绪。根据即梦 AI 的官方介绍,该 “动作模仿” 功能支持肖像、半身及全身等多种画幅类型,能够同步还原不同画幅下的肢体动作和人脸表情。在人脸表情的控制上,即梦 AI 采