AI新闻资讯

AI资讯

不错过全球AI革新的每一个时刻

AI日报

每天三分钟关注AI行业趋势

AI时间线

AI行业大事记

AI变现指南

最新案例

AI变现案例分享

图片合集

AI图片制作变现案例分享

视频合集

AI视频制作变现案例分享

音频合集

AI音频制作变现案例分享

文案合集

AI内容写作变现案例分享

AI教程

最新教程

免费分享最新AI教程内容

AI产品榜

AI产品排行榜

展示AI网站的总访问量排名

AI产品流量增速榜

追踪AI网站访问量增长最快产品

AI产品流量下降榜

关注访问量下降明显的AI网站

AI产品周榜

展示AI网站的周访问量排名

热门国家排行榜

美国

美国用户最喜欢的AI网站

中国

中国用户最喜欢的AI网站

印度

印度用户最喜欢的AI网站

巴西

巴西用户最喜欢的AI网站

热门分类榜

图片生成

AI图片生成网站总访问量榜单

个人助理

AI个人助理网站总访问量榜单

角色生成网站

AI角色生成网站总访问量榜单

视频生成

AI视频生成网站总访问量榜单

热门开源数据榜单

AI项目榜单

热门AI项目总Start榜单

AI项目增速榜

热门AI项目增速榜

AI开发者排名

热门AI开发者排名

AI组织排名

热门AI组织排名榜单

热门开源分类

deepseek

热门deepseek开源项目

TTS

热门TTS开源项目

LLM

热门LLM开源项目

ChatGPT

热门ChatGPT开源项目

AI开源项目库

全景图

github热门AI开源项目总览

产品库工具导航

MIDI

通过多实例扩散模型将单张图像生成高保真度的3D场景。

普通产品图像3D建模图像处理

MIDI是一种创新的图像到3D场景生成技术，它利用多实例扩散模型，能够从单张图像中直接生成具有准确空间关系的多个3D实例。该技术的核心在于其多实例注意力机制，能够有效捕捉物体间的交互和空间一致性，无需复杂的多步骤处理。MIDI在图像到场景生成领域表现出色，适用于合成数据、真实场景数据以及由文本到图像扩散模型生成的风格化场景图像。其主要优点包括高效性、高保真度和强大的泛化能力。

MIDI

MIDI 最新流量情况

月总访问量

19460

跳出率

47.31%

平均页面访问数

2.4

平均访问时长

00:01:53

MIDI 访问量趋势

MIDI 访问地理位置分布

MIDI 流量来源

MIDI 替代品

MIDI — 通过多实例扩散模型将单张图像生成高保真度的3D场景。

•3D建模•图像处理

SF3D — 快速生成带纹理的3D模型

•3D建模•深度学习

InstantMesh — 高效3D网格生成框架

•3D建模•图像处理

Thera — 一种无混叠的任意尺度超分辨率方法。

•超分辨率•图像处理

HunyuanVideo-I2V — HunyuanVideo-I2V 是腾讯推出的基于 HunyuanVideo 的图像到视频生成框架。

•视频生成•深度学习

UniTok — UniTok是一个用于视觉生成和理解的统一视觉分词器。

•视觉生成•视觉理解

VisoMaster — 强大的视频替换与编辑软件，利用AI技术实现自然效果。

•视频编辑•替换

MatAnyone — MatAnyone 是一个支持目标指定的稳定视频抠像框架，适用于复杂背景。

•视频抠像•图像处理

leapfusion-hunyuan-image2video — 一种新颖的图像到视频采样技术，基于Hunyuan模型实现高质量视频生成。

•视频生成•深度学习

MangaNinja — MangaNinja 是一种基于参考的线稿上色方法，可实现精确匹配和细粒度交互控制。

•图像处理•线稿上色

Shapen — 将图像转换为3D模型，可用于渲染、动画或3D打印。

•3D建模•图像处理

SVFR — SVFR是一个用于视频人脸修复的统一框架。

•视频人脸修复•图像处理

STAR — STAR是一种用于真实世界视频超分辨率的时空增强框架，首次将强大的文本到视频扩散先验集成到真实世界视频超分辨率中。

•视频超分辨率•文本到视频

IC-Light V2-Vary — 灵活调整光源位置和强度的AI光照编辑工具

•图像处理•光照编辑

LLaMA-Mesh

LLaMA-Mesh — 3D网格生成与语言模型的统一

•3D建模•自然语言处理

face_anon_simple — 人脸匿名化技术，保留关键细节同时有效保护隐私。

•人脸匿名化•隐私保护

Watermark Anything — 图像水印技术，可在图片中嵌入局部化水印信息

•图像水印•版权保护

Flux.1 Lite — 8B参数变分自编码器模型，用于高效的文本到图像生成。

•文本到图像•AI生成

Long-LRM — 高效3D高斯重建模型，实现大场景快速重建

•3D重建•高斯模型

PuLID-Flux ComfyUI implementation — ComfyUI的PuLID-Flux实现

•图像处理•深度学习

A Diffusion Approach to Radiance Field Relighting using Multi-Illumination Synthesis — 使用多照明合成的扩散方法重新照明辐射场

•计算机图形学•图像处理

diffusion-e2e-ft — 图像条件扩散模型的微调工具

•图像处理•深度学习

Open-MAGVIT2 — 开源自回归视觉生成模型项目

•图像生成•自回归模型

World Labs

World Labs — 构建大型世界模型，感知、生成和与3D世界互动

•3D建模•虚拟现实

AWPortrait-FL — 基于FLUX.1-dev的高级人像生成模型

•人像生成•图像处理

Show-o — 统一多模态理解和生成的单一变换器

•多模态•深度学习

Live_Portrait_Monitor — 通过监控器让肖像动起来！

•深度学习•图像处理

CharacterGen — 从单张图片生成3D角色模型

•3D建模•动画生成

Unique3D — 从单张图片生成高质量3D网格模型

•3D建模•图像处理

CAT3D — 从多视角图像创建3D场景

•3D建模•图像处理