阿里的EMO框架通过关注音频提示和面部动作之间的联系,增强了头部视频生成的真实度、自然度和表现力。EMO支持不同语言的歌曲和口语音频生成,可以让角色化身具有丰富的表情和动态。此外,EMO还能实现不同角色之间的联动,为视频生成带来更多可能性。
阿里云百炼大模型服务平台最近推出了“音视频实时互动”功能,使用户能够轻松搭建多模态AI应用,无需编程知识。这一新功能使得用户可以快速将AI模型集成到Web、iOS和Android应用中,并与他人分享。用户可以通过简单的步骤来搭建智能体应用:首先新建智能体应用,然后在阿里云百炼平台上选择并配置所需的文本、语音或视觉理解大模型。平台提供了200多种大模型,包括具备强大视觉智能体能力的阿里云Qwen2-VL大模型。接下来,用户需要编写提示词,设置音视频API-KEY,并发布自己的专属AI应用。
Runway 平台迎来了一个重要更新,用户现在不仅可以在视频生成中选择首尾帧,还可以插入中间帧来进行控制。此前,许多用户一直期待这一关键帧功能,借助这一新特性,用户能够在视频制作过程中有更多的创作自由和灵活性。具体来说,大家在图生视频功能中,除了上传首尾帧两张图,还可以增加中间帧,让生成的视频画面更为丰富和协调。已经有网友开始体验,可以看看x上用户@aroha AI生成效果:又比如AIbase在这里上传了三张关联不大的首尾帧和中间帧画面:生成的效果如下,流畅度
国家电网有限公司近日宣布推出我国电力行业的首个千亿级人工智能大模型——光明电力大模型,并与百度集团、阿里巴巴集团签署了战略合作框架协议。官方表示,将与签约各方共同建设光明电力大模型,推动能源电力科技创新与产业创新的融合发展。
近日,位于纽约的公司 Runway 宣布推出一项新的人才网络,旨在帮助品牌、机构和影视制作公司招聘 AI 影视创作者。随着谷歌和 OpenAI 在视频生成领域不断推进,Runway 希望通过这一平台进一步拓展其 AI 视频工具的应用范围。这个全新的 Runway 人才网络为全球的创意者、艺术家及专注于 AI 视频工具的公司提供了一个展示自己作品的平台。他们可以在这里与寻找 AI 人才的公司建立联系。网络中已聚集了许多独立的 AI 艺术家和制作公司,这些人才各具特色,涵盖多个领域。Runway 表示,这一举措