阿里最新推出的基于音频驱动的肖像视频生成框架EMO,可以根据输入音频生成任意持续时间的视频。该框架由阿里巴巴智能计算研究院团队开发,是一种富有表现力的视频生成技术。EMO与之前的AI视频生成方法相比有较大提升,但也存在耗时较长的缺点。团队成员包括薄列峰等人,他们在论文中详细介绍了EMO的技术路线和特性。这一新技术为AI领域带来了新的突破,让人们对未来的发展充满期待。
阿里最新推出的基于音频驱动的肖像视频生成框架EMO,可以根据输入音频生成任意持续时间的视频。该框架由阿里巴巴智能计算研究院团队开发,是一种富有表现力的视频生成技术。EMO与之前的AI视频生成方法相比有较大提升,但也存在耗时较长的缺点。团队成员包括薄列峰等人,他们在论文中详细介绍了EMO的技术路线和特性。这一新技术为AI领域带来了新的突破,让人们对未来的发展充满期待。
阿里云百炼大模型服务平台最近推出了“音视频实时互动”功能,使用户能够轻松搭建多模态AI应用,无需编程知识。这一新功能使得用户可以快速将AI模型集成到Web、iOS和Android应用中,并与他人分享。用户可以通过简单的步骤来搭建智能体应用:首先新建智能体应用,然后在阿里云百炼平台上选择并配置所需的文本、语音或视觉理解大模型。平台提供了200多种大模型,包括具备强大视觉智能体能力的阿里云Qwen2-VL大模型。接下来,用户需要编写提示词,设置音视频API-KEY,并发布自己的专属AI应用。
国家电网有限公司近日宣布推出我国电力行业的首个千亿级人工智能大模型——光明电力大模型,并与百度集团、阿里巴巴集团签署了战略合作框架协议。官方表示,将与签约各方共同建设光明电力大模型,推动能源电力科技创新与产业创新的融合发展。
近日,《智能涌现》消息,阿里巴巴旗下的人工智能(AI)应用“通义”已正式从阿里云分拆,并入阿里智能信息事业群。这一调整被视为阿里内部优化AI To C(面向消费者)应用布局的重要一步。据知情人士透露,此次调整涉及“通义”To C方向的产品经理和相关工程团队,这些团队将整体转移至阿里智能信息事业群。调整后,“通义”在PC端及App端的团队与阿里旗下智能搜索产品“夸克”平级,而“通义实验室”则仍然保留在阿里云体系内。这一举措反映了阿里在AI应用层面的战略梳理。此前
据雅虎财经报道,中国人工智能(AI)初创公司智谱(Zhipu)周二宣布完成最新一轮融资,该公司去年曾获得阿里巴巴和腾讯等互联网巨头的投资。据声明显示,智谱今年的商业收入已增长了一倍以上。智谱是中国少数几家估值达到数十亿美元、并获得本土科技巨头大量投资的AI初创公司之一。今年5月,沙特阿美风险投资部门参与了智谱4亿美元的融资,使其估值达到约30亿美元。AI开发已迅速演变成一场资本密集型的“军备竞赛”。Meta 和微软等公司每年花费数百亿美元购买英伟达最先进的硬件