Lumina-T2X

一个统一的文本到任意模态生成框架

普通产品图像文本到图像文本到视频
Lumina-T2X是一个先进的文本到任意模态生成框架,它能够将文本描述转换为生动的图像、动态视频、详细的多视图3D图像和合成语音。该框架采用基于流的大型扩散变换器(Flag-DiT),支持高达7亿参数,并能扩展序列长度至128,000个标记。Lumina-T2X集成了图像、视频、3D对象的多视图和语音频谱图到一个时空潜在标记空间中,可以生成任何分辨率、宽高比和时长的输出。
打开网站

Lumina-T2X 最新流量情况

月总访问量

499904316

跳出率

37.31%

平均页面访问数

5.8

平均访问时长

00:06:52

Lumina-T2X 访问量趋势

Lumina-T2X 访问地理位置分布

Lumina-T2X 流量来源

Lumina-T2X 替代品