zh
AI产品榜
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
AI产品榜
搜索全球AI产品动态
搜索全球AI信息,发现AI新机遇
新闻资讯
产品应用
变现案例
AI教程
类型 :
新闻资讯
产品应用
变现案例
AI教程
2025-01-06 09:38:43
.
AIbase
.
14.5k
字节开源嘴型同步模型LatentSync,实现超真实口型同步
近日,字节跳动发布了名为 LatentSync 的新型口型同步框架,旨在利用音频条件潜在扩散模型实现更精确的口型同步。该框架基于Stable Diffusion,针对时间一致性做了优化。与以往的基于像素空间扩散或两阶段生成的方法不同,LatentSync 采用端到端的方式,无需中间运动表示,能够直接建模复杂的音频与视觉之间的关系。在 LatentSync 的框架中,首先使用 Whisper 将音频频谱图转换为音频嵌入,并通过交叉注意力层将其集成到 U-Net 模型中。框架通过将参考帧和掩码帧与噪声潜在变量进行通道级拼接
2025-01-06 09:30:25
.
AIbase
.
14.5k
阿里团队出品!妆容迁移技术SHMT:提供化妆参考图就能给你上妆
近日,阿里巴巴达摩院的研究团队发布了一项重要研究成果,名为 “SHMT:自监督层次化妆转移”,该论文已被国际顶级学术会议 NeurIPS2024接收。这项研究展示了一种新的化妆效果转移技术,利用潜在扩散模型(Latent Diffusion Models)来实现化妆图像的精准生成,为化妆应用和图像处理领域注入了新活力。简单的说,SHMT是一项妆容迁移技术,只要一个化妆的参考图,和一张目标角色照片,就可以把妆容效果迁移到该目标脸上。团队在项目中采用了开源的方式,发布了训练代码、测试代码以及预
2023-09-20 15:30:08
.
AIbase
.
1.5k
Stability AI 发布 AI 音乐生成工具 “Stable Audio”
["Stability AI 发布名为 “Stable Audio” 的 AI 音乐生成工具,可生成长达 90 秒的高质量商业音乐。","Stable Audio 采用潜在扩散技术,能够解决音乐质量和连贯性问题。","与其他音乐生成模型不同,Stable Audio 可生成长达 90 秒的音乐,音质出色。","Stability AI 与商业音乐库 AudioSparx 合作,为 Stable Audio 提供约 80 万首音乐。","用户可以选择多种订阅计划,生成商业音乐并与音乐库合作分享收益。"]