zh
AI产品榜
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
AI产品榜
搜索全球AI产品动态
搜索全球AI信息,发现AI新机遇
新闻资讯
产品应用
变现案例
AI教程
类型 :
新闻资讯
产品应用
变现案例
AI教程
2025-01-06 09:38:43
.
AIbase
.
14.5k
字节开源嘴型同步模型LatentSync,实现超真实口型同步
近日,字节跳动发布了名为 LatentSync 的新型口型同步框架,旨在利用音频条件潜在扩散模型实现更精确的口型同步。该框架基于Stable Diffusion,针对时间一致性做了优化。与以往的基于像素空间扩散或两阶段生成的方法不同,LatentSync 采用端到端的方式,无需中间运动表示,能够直接建模复杂的音频与视觉之间的关系。在 LatentSync 的框架中,首先使用 Whisper 将音频频谱图转换为音频嵌入,并通过交叉注意力层将其集成到 U-Net 模型中。框架通过将参考帧和掩码帧与噪声潜在变量进行通道级拼接
2025-01-06 09:30:25
.
AIbase
.
14.5k
阿里团队出品!妆容迁移技术SHMT:提供化妆参考图就能给你上妆
近日,阿里巴巴达摩院的研究团队发布了一项重要研究成果,名为 “SHMT:自监督层次化妆转移”,该论文已被国际顶级学术会议 NeurIPS2024接收。这项研究展示了一种新的化妆效果转移技术,利用潜在扩散模型(Latent Diffusion Models)来实现化妆图像的精准生成,为化妆应用和图像处理领域注入了新活力。简单的说,SHMT是一项妆容迁移技术,只要一个化妆的参考图,和一张目标角色照片,就可以把妆容效果迁移到该目标脸上。团队在项目中采用了开源的方式,发布了训练代码、测试代码以及预