Noticias de IA

No te pierdas ningún momento de la innovación global en IA

IA Diario

Tendencias diarias de la industria de la IA en tres minutos

Cronología de la IA

Hitos de la industria de la IA

Guía de Monetización de la IA

Últimos Casos

Compartiendo casos de monetización de IA

Colección de Imágenes

Casos de monetización de creación de imágenes con IA

Colección de Videos

Casos de monetización de creación de videos con IA

Colección de Audio

Casos de monetización de creación de audio con IA

Colección de Contenido

Casos de monetización de redacción de contenido con IA

Tutoriales de IA

Últimos Tutoriales

Compartiendo gratuitamente los últimos tutoriales de IA

Rankings de Productos de IA

Ranking de Productos de IA

Muestra el ranking de visitas totales de sitios web de IA

Ranking de Crecimiento de Tráfico de IA

Rastrea los sitios web de IA de más rápido crecimiento por tráfico

Ranking de Descenso de Tráfico de IA

Se centra en los sitios web de IA con descensos de tráfico significativos

Ranking Semanal de IA

Muestra el ranking semanal de visitas de sitios web de IA

Rankings de Países Populares

Estados Unidos

Sitios web de IA más populares entre los usuarios estadounidenses

China

Sitios web de IA más populares entre los usuarios chinos

India

Sitios web de IA más populares entre los usuarios indios

Brasil

Sitios web de IA más populares entre los usuarios brasileños

Rankings de Categorías Populares

Generación de Imágenes

Ranking total de visitas de sitios web de generación de imágenes con IA

Asistente Personal

Ranking total de visitas de sitios web de asistentes personales con IA

Generación de Personajes

Ranking total de visitas de sitios web de generación de personajes con IA

Generación de Videos

Ranking total de visitas de sitios web de generación de videos con IA

Rankings de Datos de Código Abierto Populares

Ranking de Proyectos de IA

Proyectos de IA populares en GitHub por estrellas totales

Ranking de Crecimiento de Proyectos de IA

Proyectos de IA populares en GitHub por tasa de crecimiento

Ranking de Desarrolladores de IA

Ranking de desarrolladores de IA populares en GitHub

Ranking de Organizaciones de IA

Ranking de organizaciones de IA populares en GitHub

Categorías de Código Abierto Populares

Deepseek

Proyectos de código abierto de Deepseek populares en GitHub

TTS

Proyectos de código abierto de TTS populares en GitHub

LLM

Proyectos de código abierto de LLM populares en GitHub

ChatGPT

Proyectos de código abierto de ChatGPT populares en GitHub

Biblioteca de Proyectos de Código Abierto de IA

Visión General

Visión general de los proyectos de código abierto de IA populares en GitHub

Biblioteca de productos Navegación de herramientas

GLIGEN

Generación de imágenes abierta basada en indicaciones

Producto ComúnImagenVisión por computadoraAprendizaje profundo

Abrir sitio web

GLIGEN es un modelo de generación de imágenes abierto basado en indicaciones de texto. Puede generar imágenes a partir de descripciones textuales y condiciones restrictivas como cuadros delimitadores. El modelo se implementa congelando los parámetros de un modelo de difusión preentrenado de texto a imagen e insertando nuevos datos. Este diseño modular permite un entrenamiento eficiente y una gran flexibilidad en la inferencia. GLIGEN admite la generación de imágenes condicionales en un mundo abierto, mostrando una gran capacidad de generalización para conceptos y diseños novedosos.

Abrir sitio web

GLIGEN Situación del tráfico más reciente

Total de visitas mensuales

422

Tasa de rebote

69.70%

Páginas promedio por visita

1.0

Duración promedio de la visita

00:00:00

GLIGEN Tendencia de visitas

GLIGEN Distribución geográfica de las visitas

GLIGEN Fuentes de tráfico

GLIGEN Alternativas

diffusion-e2e-ft — Herramienta de ajuste fino para modelos de difusión condicional de imágenes

Programación

•Procesamiento de imágenes•Aprendizaje profundo

234

MASt3R — Modelo avanzado para la correspondencia de imágenes 3D

Imagen

•Correspondencia de imágenes 3D•Aprendizaje profundo

288

SCEPTER — Marco de entrenamiento, ajuste fino e inferencia de modelos generativos de código abierto

Programación

•Aprendizaje profundo•Modelos generativos

1146

YOLO-NAS Pose — Una biblioteca de código abierto para entrenar modelos de visión por computadora en PyTorch.

Productividad

•Visión por computadora•Aprendizaje profundo

1224

DreamActor-M1 — Marco de animación de imágenes humanas basado en DiT, que permite un control preciso y una coherencia a largo plazo.

Productividad

•Animación humana•Generación de video

QVQ-Max — Un modelo de razonamiento visual avanzado que puede analizar el contenido de imágenes y videos.

Selección Nacional

•Razonamiento visual•Aprendizaje profundo

Video-T1 — Mejora significativamente la calidad de generación de video mediante la escala de tiempo de prueba.

Productividad

•Generación de video•Escala de tiempo de prueba

108

RF-DETR — RF-DETR es un modelo de detección de objetos en tiempo real desarrollado por Roboflow.

Productividad

•Detección de objetos•Aprendizaje profundo

222

LHM — Modelo de reconstrucción humana 3D de alta fidelidad y animable, genera rápidamente personajes animados.

Productividad

•Reconstrucción 3D•Modelo humano

210

Mixun T1 — El primer modelo de inferencia Mamba híbrido a gran escala de la industria, con una potente capacidad de inferencia.

Selección Nacional

•Modelo de inferencia•Inteligencia artificial

Hun Yuan T1 — Modelo de inferencia profunda líder en la industria, optimizado para las preferencias humanas.

Selección Nacional

•Aprendizaje profundo•Modelo de inferencia

180

InfiniteYou — Lograr una generación de imágenes flexible y de alta fidelidad, manteniendo al mismo tiempo las características de identidad.

Productividad

•Generación de imágenes•Protección de identidad

204

Pruna — Pruna es un framework de optimización de modelos que ayuda a los desarrolladores a entregar modelos de forma rápida y eficiente.

Productividad

•Optimización de modelos•Aprendizaje automático

168

Optimización de Contexto Largo (OCL) — Una tecnología que mejora la capacidad de generación de videos a nivel de escena.

Productividad

•Generación de video•Aprendizaje profundo

204

IMM — Inductive Moment Matching es un nuevo tipo de modelo generativo, utilizado para la generación de imágenes de alta calidad.

Imagen

•Modelo generativo•Generación de imágenes

186

R1-Omni — R1-Omni es un modelo de reconocimiento de emociones multimodal que combina el aprendizaje por refuerzo, y se centra en mejorar la interpretabilidad del reconocimiento de emociones multimodales.

Programación

•Multimodal•Reconocimiento de emociones

348

VideoPainter — VideoPainter es una herramienta que admite la reparación y edición de vídeos de cualquier longitud, y utiliza un marco de complementos guiado por texto.

Video

•Reparación de vídeo•Guiado por texto

204

ByteDance Flux — Flux es una biblioteca de superposición de comunicación rápida para el paralelismo de tensores/expertos en GPU.

Programación

•Aprendizaje profundo•Cálculo paralelo

126

HunyuanVideo-I2V — HunyuanVideo-I2V es un framework de generación de imagen a video basado en HunyuanVideo, desarrollado por Tencent.

Video

•Generación de video•Inteligencia artificial

348

SRM — Resuelve tareas visuales en distribuciones complejas mediante el razonamiento espacial a través de modelos generativos de eliminación de ruido.

Imagen

•Razonamiento espacial•Modelos de eliminación de ruido

126

QwQ-32B — QwQ-32B es un potente modelo de inferencia, diseñado para la resolución de problemas complejos y la generación de texto, con un rendimiento excepcional.

Productividad

•Inferencia•Generación de texto

276

GaussianCity — Un marco eficiente para la generación de ciudades 3D sin límites, que utiliza la técnica de dibujo gaussiano 3D para una generación rápida.

Imagen

•Generación 3D•Dibujo Gaussiano

138

CogView4-6B — CogView4-6B es un potente modelo de generación de imágenes a partir de texto, centrado en la generación de imágenes de alta calidad.

Imagen

•Texto a imagen•Aprendizaje profundo

168

UniTok — UniTok es un tokenizador visual unificado para la generación y comprensión visual.

Imagen

•Inteligencia artificial•Generación visual

162

PhotoDoodle — PhotoDoodle es una implementación de código que aprende la edición de imágenes artísticas a partir de un pequeño conjunto de datos de pares de imágenes.

Imagen

•Edición de imágenes•Aprendizaje profundo

192

Datos de perfilado en DeepSeek Infra — Analiza las estrategias de superposición de cómputo y comunicación en V3/R1, proporcionando datos de análisis de rendimiento para frameworks de aprendizaje profundo.

Otros

•Aprendizaje profundo•Análisis de rendimiento

114

EPLB — Un algoritmo de código abierto para el balanceo de carga de paralelismo de expertos, diseñado para optimizar la asignación y el balanceo de carga de expertos en entornos multi-GPU.

Otros

•Aprendizaje profundo•Balanceo de carga

144

Noticias de IA

IA Diario

Cronología de la IA

Últimos Casos

Colección de Imágenes

Colección de Videos

Colección de Audio

Colección de Contenido

Últimos Tutoriales

Ranking de Productos de IA

Ranking de Crecimiento de Tráfico de IA

Ranking de Descenso de Tráfico de IA

Ranking Semanal de IA

Estados Unidos

China

India

Brasil

Generación de Imágenes

Asistente Personal

Generación de Personajes

Generación de Videos

Ranking de Proyectos de IA

Ranking de Crecimiento de Proyectos de IA

Ranking de Desarrolladores de IA

Ranking de Organizaciones de IA

Deepseek

TTS

LLM

ChatGPT

Visión General

GLIGEN

GLIGEN Situación del tráfico más reciente

GLIGEN Tendencia de visitas

GLIGEN Distribución geográfica de las visitas

GLIGEN Fuentes de tráfico

GLIGEN Alternativas

GLIGEN — Generación de imágenes abierta basada en indicaciones

Thera — Un método de superresolución de escala arbitraria sin aliasing.

LLaMA-Mesh — Unificación de modelos de lenguaje y generación de mallas 3D

diffusion-e2e-ft — Herramienta de ajuste fino para modelos de difusión condicional de imágenes

MASt3R — Modelo avanzado para la correspondencia de imágenes 3D

SCEPTER — Marco de entrenamiento, ajuste fino e inferencia de modelos generativos de código abierto

YOLO-NAS Pose — Una biblioteca de código abierto para entrenar modelos de visión por computadora en PyTorch.

DreamActor-M1 — Marco de animación de imágenes humanas basado en DiT, que permite un control preciso y una coherencia a largo plazo.

QVQ-Max — Un modelo de razonamiento visual avanzado que puede analizar el contenido de imágenes y videos.

Video-T1 — Mejora significativamente la calidad de generación de video mediante la escala de tiempo de prueba.

RF-DETR — RF-DETR es un modelo de detección de objetos en tiempo real desarrollado por Roboflow.

LHM — Modelo de reconstrucción humana 3D de alta fidelidad y animable, genera rápidamente personajes animados.

Mixun T1 — El primer modelo de inferencia Mamba híbrido a gran escala de la industria, con una potente capacidad de inferencia.

Hun Yuan T1 — Modelo de inferencia profunda líder en la industria, optimizado para las preferencias humanas.

InfiniteYou — Lograr una generación de imágenes flexible y de alta fidelidad, manteniendo al mismo tiempo las características de identidad.

Pruna — Pruna es un framework de optimización de modelos que ayuda a los desarrolladores a entregar modelos de forma rápida y eficiente.

Optimización de Contexto Largo (OCL) — Una tecnología que mejora la capacidad de generación de videos a nivel de escena.

IMM — Inductive Moment Matching es un nuevo tipo de modelo generativo, utilizado para la generación de imágenes de alta calidad.

R1-Omni — R1-Omni es un modelo de reconocimiento de emociones multimodal que combina el aprendizaje por refuerzo, y se centra en mejorar la interpretabilidad del reconocimiento de emociones multimodales.

VideoPainter — VideoPainter es una herramienta que admite la reparación y edición de vídeos de cualquier longitud, y utiliza un marco de complementos guiado por texto.

ByteDance Flux — Flux es una biblioteca de superposición de comunicación rápida para el paralelismo de tensores/expertos en GPU.

HunyuanVideo-I2V — HunyuanVideo-I2V es un framework de generación de imagen a video basado en HunyuanVideo, desarrollado por Tencent.

SRM — Resuelve tareas visuales en distribuciones complejas mediante el razonamiento espacial a través de modelos generativos de eliminación de ruido.

QwQ-32B — QwQ-32B es un potente modelo de inferencia, diseñado para la resolución de problemas complejos y la generación de texto, con un rendimiento excepcional.

GaussianCity — Un marco eficiente para la generación de ciudades 3D sin límites, que utiliza la técnica de dibujo gaussiano 3D para una generación rápida.

CogView4-6B — CogView4-6B es un potente modelo de generación de imágenes a partir de texto, centrado en la generación de imágenes de alta calidad.

UniTok — UniTok es un tokenizador visual unificado para la generación y comprensión visual.

PhotoDoodle — PhotoDoodle es una implementación de código que aprende la edición de imágenes artísticas a partir de un pequeño conjunto de datos de pares de imágenes.

Datos de perfilado en DeepSeek Infra — Analiza las estrategias de superposición de cómputo y comunicación en V3/R1, proporcionando datos de análisis de rendimiento para frameworks de aprendizaje profundo.

EPLB — Un algoritmo de código abierto para el balanceo de carga de paralelismo de expertos, diseñado para optimizar la asignación y el balanceo de carga de expertos en entornos multi-GPU.