AI新闻资讯

AI资讯

不错过全球AI革新的每一个时刻

AI日报

每天三分钟关注AI行业趋势

AI时间线

AI行业大事记

AI变现指南

最新案例

AI变现案例分享

图片合集

AI图片制作变现案例分享

视频合集

AI视频制作变现案例分享

音频合集

AI音频制作变现案例分享

文案合集

AI内容写作变现案例分享

AI教程

最新教程

免费分享最新AI教程内容

AI产品榜

AI产品排行榜

展示AI网站的总访问量排名

AI产品流量增速榜

追踪AI网站访问量增长最快产品

AI产品流量下降榜

关注访问量下降明显的AI网站

AI产品周榜

展示AI网站的周访问量排名

热门国家排行榜

美国

美国用户最喜欢的AI网站

中国

中国用户最喜欢的AI网站

印度

印度用户最喜欢的AI网站

巴西

巴西用户最喜欢的AI网站

热门分类榜

图片生成

AI图片生成网站总访问量榜单

个人助理

AI个人助理网站总访问量榜单

角色生成网站

AI角色生成网站总访问量榜单

视频生成

AI视频生成网站总访问量榜单

热门开源数据榜单

AI项目榜单

热门AI项目总Start榜单

AI项目增速榜

热门AI项目增速榜

AI开发者排名

热门AI开发者排名

AI组织排名

热门AI组织排名榜单

热门开源分类

deepseek

热门deepseek开源项目

TTS

热门TTS开源项目

LLM

热门LLM开源项目

ChatGPT

热门ChatGPT开源项目

AI开源项目库

全景图

github热门AI开源项目总览

产品库工具导航

GLIGEN

开放式基于提示的图像生成

普通产品图像计算机视觉深度学习

GLIGEN是一个开放式的基于文本提示的图像生成模型,它可以基于文本描述和边界框等限定条件生成图像。该模型通过冻结预训练好的文本到图像Diffusion模型的参数,并在其中插入新的数据来实现。这种模块化设计可以高效地进行训练,并具有很强的推理灵活性。GLIGEN可以支持开放世界的有条件图像生成,对新出现的概念和布局也具有很强的泛化能力。

GLIGEN

GLIGEN 最新流量情况

月总访问量

422

跳出率

69.70%

平均页面访问数

1.0

平均访问时长

00:00:00

GLIGEN 访问量趋势

GLIGEN 访问地理位置分布

GLIGEN 流量来源

GLIGEN 替代品

MIDI

MIDI — 通过多实例扩散模型将单张图像生成高保真度的3D场景。

•3D建模•图像处理

GLIGEN

GLIGEN — 开放式基于提示的图像生成

•计算机视觉•深度学习

Thera

Thera — 一种无混叠的任意尺度超分辨率方法。

•超分辨率•图像处理

IMM

IMM — Inductive Moment Matching 是一种新型的生成模型，用于高质量图像生成。

•生成模型•图像生成

BioEmu

BioEmu — BioEmu 是一个用于可扩展模拟蛋白质平衡系综的生成式深度学习模型。

•生物分子模拟•深度学习

Video Depth Anything

Video Depth Anything — Video Depth Anything: Consistent Depth Estimation for Super-Long Videos

•深度学习•视频处理

TryOffAnyone

TryOffAnyone — 从穿着人身上生成平铺布料的模型

•深度学习•图像生成

StableAnimator

StableAnimator — 高质量身份保留的人像动画合成工具。

•视频合成•人像动画

LLaMA-Mesh

LLaMA-Mesh — 3D网格生成与语言模型的统一

•3D建模•自然语言处理

diffusion-e2e-ft

diffusion-e2e-ft — 图像条件扩散模型的微调工具

•图像处理•深度学习

FluxMusic

FluxMusic — 使用文本生成音乐的模型

•文本到音乐•生成模型

VGGSfM

VGGSfM — 深度学习驱动的三维重建技术

•深度学习•三维重建

MASt3R

MASt3R — 3D图像匹配的先进模型

•3D图像匹配•深度学习

GaussianCube

GaussianCube — 3D生成建模的高精度和结构化辐射表示

•3D建模•生成模型

Ai online course

Ai online course — 提供关于人工智能的最佳资源，学习机器学习、数据科学、自然语言处理等。

•机器学习•数据科学

CoreNet

CoreNet — CoreNet 是一个用于训练深度神经网络的库。

•深度学习•神经网络

DUSt3R

DUSt3R — 无需相机校准信息的密集立体3D重建

•3D重建•计算机视觉

YOLOv8

YOLOv8 — YOLOv8目标检测跟踪模型

•计算机视觉•目标检测

VisFusion

VisFusion — 基于视频的3D场景重建

•3D重建•计算机视觉

SCEPTER

SCEPTER — 开源生成模型训练、调优与推理框架

•深度学习•生成模型

Vision Mamba

Vision Mamba — 基于双向状态空间模型的高效视觉表示学习框架

•计算机视觉•深度学习

FMA-Net

FMA-Net — 用于视频超分辨率和去模糊的深度学习模型

•视频超分辨率•视频去模糊

syn-rep-learn

syn-rep-learn — 从合成数据中学习视觉表示模型

•视觉表示学习•合成数据

UniRef++

UniRef++ — 一个统一的用于图像和视频对象分割的模型

•Python•深度学习

YOLO-NAS Pose

YOLO-NAS Pose — 一款用于训练PyTorch计算机视觉模型的开源库。

•计算机视觉•深度学习

Segment Anything

Segment Anything — 在线AI抠图工具能抠任何图像中的任何对象

•深度学习•计算机视觉

QVQ-Max

QVQ-Max — 一款先进的视觉推理模型，能分析图片和视频内容。

•视觉推理•深度学习

BizGen

BizGen — 一款用于生成信息图表的视觉文本渲染工具。

•信息图表•视觉文本

Video-T1

Video-T1 — 通过测试时间缩放显著提升视频生成质量。

•视频生成•测试时间缩放