Noticias de IA

No te pierdas ningún momento de la innovación global en IA

IA Diario

Tendencias diarias de la industria de la IA en tres minutos

Cronología de la IA

Hitos de la industria de la IA

Al hardware

lista todos los productos de hardware AI.

Guía de Monetización de la IA

Últimos Casos

Compartiendo casos de monetización de IA

Colección de Imágenes

Casos de monetización de creación de imágenes con IA

Colección de Videos

Casos de monetización de creación de videos con IA

Colección de Audio

Casos de monetización de creación de audio con IA

Colección de Contenido

Casos de monetización de redacción de contenido con IA

Tutoriales de IA

Últimos Tutoriales

Compartiendo gratuitamente los últimos tutoriales de IA

Rankings de Productos de IA

Ranking de Productos de IA

Muestra el ranking de visitas totales de sitios web de IA

Ranking de Crecimiento de Tráfico de IA

Rastrea los sitios web de IA de más rápido crecimiento por tráfico

Ranking de Descenso de Tráfico de IA

Se centra en los sitios web de IA con descensos de tráfico significativos

Ranking Semanal de IA

Muestra el ranking semanal de visitas de sitios web de IA

Rankings de Países Populares

Estados Unidos

Sitios web de IA más populares entre los usuarios estadounidenses

China

Sitios web de IA más populares entre los usuarios chinos

India

Sitios web de IA más populares entre los usuarios indios

Brasil

Sitios web de IA más populares entre los usuarios brasileños

Rankings de Categorías Populares

Generación de Imágenes

Ranking total de visitas de sitios web de generación de imágenes con IA

Asistente Personal

Ranking total de visitas de sitios web de asistentes personales con IA

Generación de Personajes

Ranking total de visitas de sitios web de generación de personajes con IA

Generación de Videos

Ranking total de visitas de sitios web de generación de videos con IA

Rankings de Datos de Código Abierto Populares

Ranking de Proyectos de IA

Proyectos de IA populares en GitHub por estrellas totales

Ranking de Crecimiento de Proyectos de IA

Proyectos de IA populares en GitHub por tasa de crecimiento

Ranking de Desarrolladores de IA

Ranking de desarrolladores de IA populares en GitHub

Ranking de Organizaciones de IA

Ranking de organizaciones de IA populares en GitHub

Categorías de Código Abierto Populares

Deepseek

Proyectos de código abierto de Deepseek populares en GitHub

TTS

Proyectos de código abierto de TTS populares en GitHub

LLM

Proyectos de código abierto de LLM populares en GitHub

ChatGPT

Proyectos de código abierto de ChatGPT populares en GitHub

Biblioteca de Proyectos de Código Abierto de IA

Visión General

Visión general de los proyectos de código abierto de IA populares en GitHub

Biblioteca de productos Navegación de herramientas

LongVA

Modelo de transformación de contexto largo de lenguaje a visión

Producto ComúnImagenContexto largoModelo visual

Abrir sitio web

LongVA es un modelo de transformación de contexto largo capaz de procesar más de 2000 fotogramas o más de 200.000 marcas visuales. Su rendimiento en Video-MME lidera entre los modelos de 7B. El modelo se probó con CUDA 11.8 y A100-SXM-80G, y se puede iniciar y utilizar rápidamente a través de la plataforma Hugging Face.

Abrir sitio web

LongVA Situación del tráfico más reciente

Total de visitas mensuales

521149929

Tasa de rebote

35.96%

Páginas promedio por visita

6.1

Duración promedio de la visita

00:06:29

LongVA Tendencia de visitas

LongVA Distribución geográfica de las visitas

LongVA Fuentes de tráfico

LongVA Alternativas

LongVA — Modelo de transformación de contexto largo de lenguaje a visión

Imagen

•Contexto largo•Modelo visual

228

ModernBERT-large — Modelo de transformador codificador bidireccional de alto rendimiento

Programación

•BERT•Transformador

228

Incorporación de Documentos — Aprovecha la tecnología de IA compuesta para procesar documentos en línea y superar las diferencias de modalidad.

Productividad

•LLM•Modelo visual

240

DeepSeek-VL2-Small — Modelo de lenguaje visual avanzado de gran tamaño y experto mixto

Imagen

•Preguntas y respuestas visuales•Reconocimiento óptico de caracteres

270

InternViT-300M-448px-V2_5 — Versión mejorada de InternViT-300M-448px, que mejora la capacidad de extracción de características visuales.

Imagen

•Extracción de características visuales•Aprendizaje multimodal

216

Florence-VL — Herramienta de mejora de modelos de lenguaje visual, que combina un codificador visual generativo y una técnica de fusión de profundidad y amplitud.

Programación

•Modelo de lenguaje visual•Aprendizaje multimodal

258

LLaVA-o1 — Modelo de lenguaje visual capaz de realizar razonamiento paso a paso.

Productividad

•Modelo de lenguaje visual•Razonamiento paso a paso

228

Qwen2.5-Coder-1.5B-Instruct-GPTQ-Int8 — Modelo de generación de código de 1.5B parámetros de la serie Qwen2.5-Coder

Programación

•Generación de código•Inferencia de código

108

Qwen2.5-Coder-3B-Instruct-GPTQ-Int8 — Modelo de instrucción de 3B parámetros de la serie Qwen2.5-Coder

Programación

•Generación de código•Inferencia de código

150

PPLLaVA — Modelo de implementación de GPU para la comprensión de secuencias de vídeo

Video

•Comprensión de vídeo•Modelo de lenguaje grande

186

Agente S — Agente S: un marco de agente abierto que permite a las computadoras usar computadoras como humanos.

Productividad

•Inteligencia Artificial•Automatización

180

FakeShield — Detección y localización de imágenes explicables basada en modelos de lenguaje grandes multimodales

Imagen

•Detección de imágenes•Aprendizaje multimodal

198

LLaVA-Video — Investigación en ajuste fino de instrucciones de video y datos sintéticos

Video

•Comprensión de video•Aprendizaje multimodal

342

LongLLaVA — Modelo de lenguaje extenso multimodal de alta eficiencia escalable a 1000 imágenes

Imagen

•Aprendizaje multimodal•Procesamiento de imágenes

216

EAGLE — Exploración del espacio de diseño de modelos de lenguaje grandes multimodales

Programación

•Aprendizaje multimodal•Modelos de lenguaje grandes

468

SlowFast-LLaVA — Modelo de lenguaje grande sin entrenamiento para comprensión e inferencia de video.

Productividad

•Preguntas y respuestas sobre video•Aprendizaje multimodal

252

Llama3-s v0.2 — Punto de control multimodal más reciente, mejora la capacidad de comprensión del habla.

Programación

•Reconocimiento de voz•Procesamiento del lenguaje natural

300

AI21-Jamba-1.5-Large — Modelo base avanzado de instrucciones que sigue el principio de SSM-Transformer híbrido

Productividad

•Generación de texto•Contexto largo

174

llama3-s — Un modelo de lenguaje abierto de código abierto en entrenamiento, con capacidad de "audición".

Programación

•Procesamiento del lenguaje natural•Aprendizaje automático

252

MAVIS — Modelo de ajuste de instrucciones de visión matemática

Productividad

•Aprendizaje automático•Aprendizaje multimodal

270

MG-LLaVA — MLLM innovador con ajuste fino de instrucciones visuales multigranulares

Programación

•Aprendizaje automático•Procesamiento visual

138

Florence-2-base — Modelo base visual avanzado que admite diversas tareas de visión y visión-lenguaje.

Imagen

•Modelo visual•Aprendizaje multitarea

444

Florence-2-large — Modelo base visual avanzado que admite múltiples tareas de visión y visión-lenguaje.

Imagen

•Modelo visual•Aprendizaje multitarea

438

4M — Marco de entrenamiento de modelos multimodales y multitarea

Selección Internacional

•Aprendizaje multimodal•Modelo Transformer

246

Stable Diffusion 3 Gratuito Online — Modelo avanzado de generación de imágenes a partir de texto

Imagen

•Generación de imágenes con IA•Texto a imagen

816

VideoLLaMA2-7B-Base — Modelo de lenguaje de video grande que ofrece respuestas a preguntas visuales y generación de subtítulos de video.

Video

•Análisis de video•Aprendizaje multimodal

786

Samba — Implementación oficial de un modelo de lenguaje eficiente con contexto ilimitado

Programación

•Procesamiento del lenguaje natural•Aprendizaje automático

354

emo-visual-data — Conjunto de datos de anotación visual de emojis

Imagen

•Conjunto de datos•Aprendizaje multimodal

246

llama3v — Modelo de visión SOTA (Estado del Arte) basado en llama3 8B

Imagen

•Modelo de visión•Aprendizaje multimodal

642

Page Assist - Interfaz web para modelos de IA locales — Asistente de navegación web que utiliza modelos de IA locales.

Productividad

•Modelo de IA•Barra lateral

1710