Tencent EMMA
多模态文本到图像生成模型
优质新品图像图像生成多模态
EMMA是一个基于最前沿的文本到图像扩散模型ELLA构建的新型图像生成模型,能够接受多模态提示,通过创新的多模态特征连接器设计,有效整合文本和补充模态信息。该模型通过冻结原始T2I扩散模型的所有参数,并仅调整一些额外层,揭示了预训练的T2I扩散模型可以秘密接受多模态提示的有趣特性。EMMA易于适应不同的现有框架,是生成个性化和上下文感知图像甚至视频的灵活有效工具。
Tencent EMMA 最新流量情况
月总访问量
62
跳出率
40.66%
平均页面访问数
1.0
平均访问时长
00:00:00