AI新闻资讯

AI资讯

不错过全球AI革新的每一个时刻

AI日报

每天三分钟关注AI行业趋势

AI时间线

AI行业大事记

AI变现指南

最新案例

AI变现案例分享

图片合集

AI图片制作变现案例分享

视频合集

AI视频制作变现案例分享

音频合集

AI音频制作变现案例分享

文案合集

AI内容写作变现案例分享

AI教程

最新教程

免费分享最新AI教程内容

AI产品榜

AI产品排行榜

展示AI网站的总访问量排名

AI产品流量增速榜

追踪AI网站访问量增长最快产品

AI产品流量下降榜

关注访问量下降明显的AI网站

AI产品周榜

展示AI网站的周访问量排名

热门国家排行榜

美国

美国用户最喜欢的AI网站

中国

中国用户最喜欢的AI网站

印度

印度用户最喜欢的AI网站

巴西

巴西用户最喜欢的AI网站

热门分类榜

图片生成

AI图片生成网站总访问量榜单

个人助理

AI个人助理网站总访问量榜单

角色生成网站

AI角色生成网站总访问量榜单

视频生成

AI视频生成网站总访问量榜单

热门开源数据榜单

AI项目榜单

热门AI项目总Start榜单

AI项目增速榜

热门AI项目增速榜

AI开发者排名

热门AI开发者排名

AI组织排名

热门AI组织排名榜单

热门开源分类

deepseek

热门deepseek开源项目

TTS

热门TTS开源项目

LLM

热门LLM开源项目

ChatGPT

热门ChatGPT开源项目

AI开源项目库

全景图

github热门AI开源项目总览

产品库工具导航

Lumina-T2X

一个统一的文本到任意模态生成框架

普通产品图像文本到图像文本到视频

Lumina-T2X是一个先进的文本到任意模态生成框架，它能够将文本描述转换为生动的图像、动态视频、详细的多视图3D图像和合成语音。该框架采用基于流的大型扩散变换器（Flag-DiT），支持高达7亿参数，并能扩展序列长度至128,000个标记。Lumina-T2X集成了图像、视频、3D对象的多视图和语音频谱图到一个时空潜在标记空间中，可以生成任何分辨率、宽高比和时长的输出。

Lumina-T2X

Lumina-T2X 最新流量情况

月总访问量

474564576

跳出率

36.20%

平均页面访问数

6.1

平均访问时长

00:06:34

Lumina-T2X 访问量趋势

Lumina-T2X 访问地理位置分布

Lumina-T2X 流量来源

Lumina-T2X 替代品

AsyncDiff

AsyncDiff — 异步去噪并行化扩散模型

•分布式计算•文本到图像

Lumina-T2X

Lumina-T2X — 一个统一的文本到任意模态生成框架

•文本到图像•文本到视频

DiffSplat

DiffSplat — DiffSplat 是一个从文本提示和单视图图像生成 3D 高斯点云的生成框架。

•3D 生成•高斯点云

VMix

VMix — 文本到图像扩散模型的美学质量提升工具

•文本到图像•扩散模型

DynamicControl

DynamicControl — 自适应条件选择，提升文本到图像生成控制力

•文本到图像•扩散模型

text-to-pose

text-to-pose — 基于文本生成姿态并进一步生成图像的模型

•文本到图像•姿态估计

SeedEdit

SeedEdit — 基于文本提示修订图像的大型扩散模型

•图像编辑•扩散模型

stable-diffusion-3.5-large-turbo

stable-diffusion-3.5-large-turbo — 高效能的文本到图像生成模型

•文本到图像•生成模型

stable-diffusion-3.5-large

stable-diffusion-3.5-large — 高性能的文本到图像生成模型

•图像生成•文本到图像

Concept Sliders

Concept Sliders — 用于精确控制扩散模型中概念的低秩适配器

•图像生成•文本到图像

TexGen

TexGen — 3D纹理生成技术，根据文本描述合成3D纹理

•3D纹理•多视角采样

Slicedit

Slicedit — 基于文本的视频编辑技术，使用时空切片。

•视频编辑•文本到图像

ELLA

ELLA — 通过LLM增强语义对齐的扩散模型适配器

•文本到图像•语义对齐

SLD (Self-correcting LLM-controlled Diffusion Models)

SLD (Self-correcting LLM-controlled Diffusion Models) — 官方实现的自纠正LLM控制的扩散模型

•图像生成•AI艺术

OpenDiT

OpenDiT — OpenDiT：一款简单、快速、高效的DiT训练和推理系统

•DiT•训练

InstructVideo

InstructVideo — 文本到视频的指导生成模型

•文本到视频•扩散模型

X-Adapter

X-Adapter — 升级扩散模型插件通用兼容性

•插件•模型升级

Show-1

Show-1 — Show-1 将像素和潜在扩散模型结合起来，以实现高效的高质量文本到视频的生成

•文本到视频•视频生成

AccVideo

AccVideo — 加速视频扩散模型，生成速度提升 8.5 倍。

•视频生成•扩散模型

InfiniteYou

InfiniteYou — 实现灵活且高保真度的图像生成，同时保持身份特征。

•图像生成•身份保护

Wan 2.1 AI

Wan 2.1 AI — Wan 2.1 AI 是一款将文本和图像转化为高质量视频的先进 AI 视频生成模型。

•AI 视频生成•文本到视频

TrajectoryCrafter

TrajectoryCrafter — 通过扩散模型实现单目视频的相机轨迹重定向。

•视频编辑•相机轨迹

Inception Labs

Inception Labs — Inception Labs 推出新一代扩散式大语言模型，提供极速、高效和高质量的语言生成能力。

•语言模型•扩散模型

CogView4-6B

CogView4-6B — CogView4-6B 是一个强大的文本到图像生成模型，专注于高质量图像生成。

•文本到图像•深度学习

CogView4

CogView4 — CogView4 是一个支持中文和英文的高分辨率文本到图像生成模型。

•文本到图像•高分辨率

Project Starlight

Project Starlight — Project Starlight 是一款基于 AI 的视频增强工具，可将低分辨率和损坏的视频提升为高清质量。

•AI 视频增强•高清修复

Wan2GP

Wan2GP — Wan2GP 是一个优化后的开源视频生成模型，专为低配置 GPU 用户设计，支持多种视频生成任务。

•视频生成•低配置 GPU

Mercury Coder

Mercury Coder — Mercury Coder 是一款基于扩散模型的高性能代码生成语言模型。

•代码生成•扩散模型

VideoGrain

VideoGrain — VideoGrain 是一种零样本方法，用于实现类别级、实例级和部件级的视频编辑。

•视频编辑•扩散模型

Wan2.1-T2V-14B

Wan2.1-T2V-14B — Wan2.1-T2V-14B 是一款高性能的文本到视频生成模型，支持多种视频生成任务。

•视频生成•文本到视频