阿里的EMO框架通过关注音频提示和面部动作之间的联系,增强了头部视频生成的真实度、自然度和表现力。EMO支持不同语言的歌曲和口语音频生成,可以让角色化身具有丰富的表情和动态。此外,EMO还能实现不同角色之间的联动,为视频生成带来更多可能性。
在2024年世界互联网大会乌镇峰会期间,阿里巴巴集团首席执行官吴泳铭于11月21日在互联网企业家论坛上发表了主题演讲,强调了人工智能(AI)对互联网行业的深远影响。他指出,今年互联网行业最大的变化依然是 AI 技术的迅速发展。吴泳铭表示,AI最大的价值绝不仅仅是在手机上做出一两个超级App,而是推动各行各业的生产力变革。发展AI需要建设繁荣的技术、产品和市场生态。目前,已有超过30万家企业接入阿里巴巴的通义大模型,利用 AI 技术重塑代码开发、药物研发、生产制造等多
2016 年的《精灵宝可梦Go》曾被视为最纯真的游戏体验,鼓励玩家漫步社区、结识陌生人。而到了 2024 年,这款游戏却悄然变身为一个惊人的地理空间人工智能训练场。Niantic开发团队近期披露了一个惊人秘密:多年来,数百万玩家在玩游戏的同时,实际上一直在帮助训练一个庞大的地理空间人工智能系统。这个被称为视觉定位系统(VPS)的技术,正在通过玩家的日常游戏行为,帮助AI学习复杂的三维空间信息。最巧妙的是,这个过程几乎是无感知的。就像互联网文本训练ChatGPT一样,玩家在
快手科技近日发布的2024年第三季度财报显示,公司在AI领域的布局正在收获显著成果。伴随着快手整体日活跃用户突破4亿大关,其AI产品可灵的发展态势尤为引人关注。自今年6月推出以来,可灵AI已经完成了一系列重要里程碑。数据显示,平台累计服务超500万用户,共生成5100万个视频和1.5亿张图片。特别值得关注的是,可灵AI已实现单月流水超千万元人民币,展现出强劲的商业化潜力。在技术创新方面,可灵AI持续保持高频迭代节奏。9月发布的1.5版本模型带来了原生1080P视频支持,并开发
阿里云百炼平台近日宣布上线了Qwen2.5-Turbo百万长文本模型,Qwen2.5-Turbo模型由通义千问团队开发,支持处理高达100万tokens的超长上下文,相当于100万个英文单词或150万个汉字。