Noticias de IA

No te pierdas ningún momento de la innovación global en IA

IA Diario

Tendencias diarias de la industria de la IA en tres minutos

Cronología de la IA

Hitos de la industria de la IA

Al hardware

lista todos los productos de hardware AI.

Guía de Monetización de la IA

Últimos Casos

Compartiendo casos de monetización de IA

Colección de Imágenes

Casos de monetización de creación de imágenes con IA

Colección de Videos

Casos de monetización de creación de videos con IA

Colección de Audio

Casos de monetización de creación de audio con IA

Colección de Contenido

Casos de monetización de redacción de contenido con IA

Tutoriales de IA

Últimos Tutoriales

Compartiendo gratuitamente los últimos tutoriales de IA

Rankings de Productos de IA

Ranking de Productos de IA

Muestra el ranking de visitas totales de sitios web de IA

Ranking de Crecimiento de Tráfico de IA

Rastrea los sitios web de IA de más rápido crecimiento por tráfico

Ranking de Descenso de Tráfico de IA

Se centra en los sitios web de IA con descensos de tráfico significativos

Ranking Semanal de IA

Muestra el ranking semanal de visitas de sitios web de IA

Rankings de Países Populares

Estados Unidos

Sitios web de IA más populares entre los usuarios estadounidenses

China

Sitios web de IA más populares entre los usuarios chinos

India

Sitios web de IA más populares entre los usuarios indios

Brasil

Sitios web de IA más populares entre los usuarios brasileños

Rankings de Categorías Populares

Generación de Imágenes

Ranking total de visitas de sitios web de generación de imágenes con IA

Asistente Personal

Ranking total de visitas de sitios web de asistentes personales con IA

Generación de Personajes

Ranking total de visitas de sitios web de generación de personajes con IA

Generación de Videos

Ranking total de visitas de sitios web de generación de videos con IA

Rankings de Datos de Código Abierto Populares

Ranking de Proyectos de IA

Proyectos de IA populares en GitHub por estrellas totales

Ranking de Crecimiento de Proyectos de IA

Proyectos de IA populares en GitHub por tasa de crecimiento

Ranking de Desarrolladores de IA

Ranking de desarrolladores de IA populares en GitHub

Ranking de Organizaciones de IA

Ranking de organizaciones de IA populares en GitHub

Categorías de Código Abierto Populares

Deepseek

Proyectos de código abierto de Deepseek populares en GitHub

TTS

Proyectos de código abierto de TTS populares en GitHub

LLM

Proyectos de código abierto de LLM populares en GitHub

ChatGPT

Proyectos de código abierto de ChatGPT populares en GitHub

Biblioteca de Proyectos de Código Abierto de IA

Visión General

Visión general de los proyectos de código abierto de IA populares en GitHub

Biblioteca de productos Navegación de herramientas

DeepSeek-VL2

Modelo de comprensión multimodal avanzado que integra capacidades visuales y lingüísticas.

Producto ComúnImagenModelo de lenguaje visualComprensión multimodal

Abrir sitio web

DeepSeek-VL2 es una serie de grandes modelos de lenguaje visual Mixture-of-Experts (MoE), con mejoras significativas respecto a su predecesor, DeepSeek-VL. Esta serie de modelos demuestra una capacidad excepcional en tareas como respuesta a preguntas visuales, reconocimiento óptico de caracteres (OCR), comprensión de documentos/tablas/gráficos y localización visual. DeepSeek-VL2 incluye tres variantes: DeepSeek-VL2-Tiny, DeepSeek-VL2-Small y DeepSeek-VL2, con 1.0B, 2.8B y 4.5B parámetros de activación, respectivamente. DeepSeek-VL2 alcanza un rendimiento competitivo o de vanguardia en comparación con los modelos base de MoE y densos de código abierto existentes, con un número similar o menor de parámetros de activación.

Abrir sitio web

DeepSeek-VL2 Situación del tráfico más reciente

Total de visitas mensuales

521149929

Tasa de rebote

35.96%

Páginas promedio por visita

6.1

Duración promedio de la visita

00:06:29

DeepSeek-VL2 Tendencia de visitas

DeepSeek-VL2 Distribución geográfica de las visitas

DeepSeek-VL2 Fuentes de tráfico

DeepSeek-VL2 Alternativas

DeepSeek-VL2 — Modelo de comprensión multimodal avanzado que integra capacidades visuales y lingüísticas.

Imagen

•Modelo de lenguaje visual•Comprensión multimodal

696

DeepSeek-VL2-Tiny — Modelo de lenguaje visual avanzado de gran tamaño y experto mixto

Imagen

•Modelo de lenguaje visual•Experto mixto

576

InternLM-XComposer2 — Modelo de lenguaje visual de gran formato para la síntesis e interpretación de imágenes a partir de texto de forma libre.

Diseño

•Modelo de lenguaje visual•Síntesis de imágenes a partir de texto

1998

Aya Vision 8B — Modelo de lenguaje visual multilingüe de 800 millones de parámetros, compatible con OCR, descripción de imágenes, razonamiento visual, etc.

Imagen

•Multilingüe•Modelo de lenguaje visual

222

VLM-R1 — VLM-R1 es un modelo de lenguaje visual reforzado estable y versátil, enfocado en tareas de comprensión visual.

Imagen

•Modelo de lenguaje visual•Aprendizaje por refuerzo

270

Ollama OCR para web — Un potente paquete OCR que utiliza modelos de lenguaje visual de vanguardia para extraer texto de imágenes.

Imagen

•OCR•Reconocimiento de imagen

492

Moondream AI — Modelo de lenguaje visual de código abierto que se ejecuta en varios dispositivos.

Otros

•Inteligencia Artificial•Código Abierto

342

PaliGemma2-3b-pt-224 — PaliGemma 2 es un potente modelo de lenguaje visual que admite tareas de procesamiento de imágenes y texto en varios idiomas.

Programación

•Modelo de lenguaje visual•Compatibilidad multilingüe

186

PaliGemma2-3b-pt-448 — PaliGemma 2 es un potente modelo de lenguaje visual que admite diversas tareas de lenguaje visual.

Programación

•Modelo de lenguaje visual•Compatibilidad multilingüe

180

cogagent-9b-20241220 — CogAgent-9B-20241220 es un modelo de agente GUI basado en un modelo de lenguaje visual.

Programación

•Modelo de lenguaje visual•Agente GUI

198

CogAgent — Agente GUI basado en el modelo de lenguaje visual de extremo a extremo (VLM) de código abierto

Programación

•Modelo de lenguaje visual•Agente GUI

342

Megrez-3B-Omni — Modelo de comprensión multimodal de extremo a extremo de código abierto

Productividad

•Comprensión multimodal•Reconocimiento de imágenes

258

POINTS-Yi-1.5-9B-Chat — Los últimos avances en modelos de lenguaje visual, integrando la nueva tecnología de WeChat AI.

Productividad

•Modelo de lenguaje visual•WeChat AI

156

POINTS-Qwen-2-5-7B-Chat — Los últimos avances en modelos de lenguaje visual

Productividad

•Modelo de lenguaje visual•Multimodal

180

POINTS-1-5-Qwen-2-5-7B-Chat — Modelo de lenguaje visual líder, admite bilingüismo y control de alta calidad, gratuito.

Productividad

•Modelo de lenguaje visual•Bilingüe

132

OpenGVLab InternVL — Un modelo de lenguaje visual de IA que proporciona servicios de análisis y descripción de imágenes.

Chat

•IA•Reconocimiento de imágenes

144

Florence-VL — Herramienta de mejora de modelos de lenguaje visual, que combina un codificador visual generativo y una técnica de fusión de profundidad y amplitud.

Programación

•Modelo de lenguaje visual•Aprendizaje multimodal

258

Qwen2-VL-7B — Qwen2-VL-7B es el último modelo de lenguaje visual, que admite la comprensión multimodal y la generación de texto.

Imagen

•Modelo de lenguaje visual•Multimodal

234

Qwen2-VL-2B — Modelo de lenguaje visual líder en el sector, que admite la comprensión multimodal y la generación de texto.

Imagen

•Modelo de lenguaje visual•Multimodal

192

PaliGemma 2 — PaliGemma 2 es un potente modelo de lenguaje visual, fácil de ajustar.

Productividad

•Modelo de lenguaje visual•IA

210

SmolVLM — Modelo de lenguaje visual eficiente y de código abierto

Imagen

•Modelo de lenguaje visual•IA multimodal

222

LLaVA-o1 — Modelo de lenguaje visual capaz de realizar razonamiento paso a paso.

Productividad

•Modelo de lenguaje visual•Razonamiento paso a paso

228

Aquila-VL-2B-llava-qwen — Modelo de lenguaje visual que combina información de imágenes y texto para un procesamiento inteligente.

Imagen

•Modelo de lenguaje visual•Multimodal

222

ROCKET-1 — Modelo de indicaciones visuales-temporales contextuales que domina la interacción en mundos abiertos.

Programación

•Modelo de lenguaje visual•Toma de decisiones encarnada

192

OmniParser — Analizador de interfaces de usuario basado en una interfaz gráfica de usuario puramente visual.

Productividad

•Modelo de lenguaje visual•Análisis de interfaces de usuario

690

VisRAG — Modelo de generación aumentado por recuperación basado en un modelo de lenguaje visual (VLM)

Imagen

•Modelo de lenguaje visual•Generación aumentada por recuperación

276

Helpful DoggyBot — Sistema operativo de movilidad interior para robots cuadrúpedos

Productividad

•Robot cuadrúpedo•Manipulación móvil

150

Qwen2-VL — Modelo de lenguaje visual de nueva generación, que ve el mundo con mayor claridad.

Imagen

•Modelo de lenguaje visual•Soporte multilingüe

420

InternLM-XComposer-2.5 — Un modelo de lenguaje visual grande y multifuncional

Productividad

•Modelo de lenguaje visual•Procesamiento de contexto largo

738

PixelProse — Conjunto de datos de descripción de imágenes a gran escala, que proporciona más de 16 millones de descripciones de imágenes sintéticas.

Otros

•Descripción de imágenes•Modelo de lenguaje visual

318