Noticias de IA

No te pierdas ningún momento de la innovación global en IA

IA Diario

Tendencias diarias de la industria de la IA en tres minutos

Cronología de la IA

Hitos de la industria de la IA

Guía de Monetización de la IA

Últimos Casos

Compartiendo casos de monetización de IA

Colección de Imágenes

Casos de monetización de creación de imágenes con IA

Colección de Videos

Casos de monetización de creación de videos con IA

Colección de Audio

Casos de monetización de creación de audio con IA

Colección de Contenido

Casos de monetización de redacción de contenido con IA

Tutoriales de IA

Últimos Tutoriales

Compartiendo gratuitamente los últimos tutoriales de IA

Rankings de Productos de IA

Ranking de Productos de IA

Muestra el ranking de visitas totales de sitios web de IA

Ranking de Crecimiento de Tráfico de IA

Rastrea los sitios web de IA de más rápido crecimiento por tráfico

Ranking de Descenso de Tráfico de IA

Se centra en los sitios web de IA con descensos de tráfico significativos

Ranking Semanal de IA

Muestra el ranking semanal de visitas de sitios web de IA

Rankings de Países Populares

Estados Unidos

Sitios web de IA más populares entre los usuarios estadounidenses

China

Sitios web de IA más populares entre los usuarios chinos

India

Sitios web de IA más populares entre los usuarios indios

Brasil

Sitios web de IA más populares entre los usuarios brasileños

Rankings de Categorías Populares

Generación de Imágenes

Ranking total de visitas de sitios web de generación de imágenes con IA

Asistente Personal

Ranking total de visitas de sitios web de asistentes personales con IA

Generación de Personajes

Ranking total de visitas de sitios web de generación de personajes con IA

Generación de Videos

Ranking total de visitas de sitios web de generación de videos con IA

Rankings de Datos de Código Abierto Populares

Ranking de Proyectos de IA

Proyectos de IA populares en GitHub por estrellas totales

Ranking de Crecimiento de Proyectos de IA

Proyectos de IA populares en GitHub por tasa de crecimiento

Ranking de Desarrolladores de IA

Ranking de desarrolladores de IA populares en GitHub

Ranking de Organizaciones de IA

Ranking de organizaciones de IA populares en GitHub

Categorías de Código Abierto Populares

Deepseek

Proyectos de código abierto de Deepseek populares en GitHub

TTS

Proyectos de código abierto de TTS populares en GitHub

LLM

Proyectos de código abierto de LLM populares en GitHub

ChatGPT

Proyectos de código abierto de ChatGPT populares en GitHub

Biblioteca de Proyectos de Código Abierto de IA

Visión General

Visión general de los proyectos de código abierto de IA populares en GitHub

Biblioteca de productos Navegación de herramientas

Honeybee

Modelo de predicción de red de lenguaje multimodal

Producto ComúnProductividadMultimodalModelo de lenguaje

Abrir sitio web

Honeybee es un predictor de mejora local para modelos de lenguaje multimodales. Mejora el rendimiento de los modelos de lenguaje multimodales en diversas tareas posteriores, como la inferencia del lenguaje natural y las preguntas y respuestas visuales. La ventaja de Honeybee radica en la introducción de un mecanismo de percepción local, que permite modelar mejor las relaciones de dependencia entre las muestras de entrada, mejorando así la capacidad de inferencia y respuesta a preguntas de los modelos de lenguaje multimodales.

Abrir sitio web

Honeybee Situación del tráfico más reciente

Total de visitas mensuales

474564576

Tasa de rebote

36.20%

Páginas promedio por visita

6.1

Duración promedio de la visita

00:06:34

Honeybee Tendencia de visitas

Honeybee Distribución geográfica de las visitas

Honeybee Fuentes de tráfico

Honeybee Alternativas

Qwen-VL — Modelo de lenguaje visual de propósito general

Productividad

•Visual•Modelo de lenguaje

2646

Honeybee — Modelo de predicción de red de lenguaje multimodal

Productividad

•Multimodal•Modelo de lenguaje

426

DeepSeek Japonés — DeepSeek es un modelo de lenguaje IA avanzado, especializado en razonamiento lógico, matemáticas y tareas de programación, disponible de forma gratuita.

Productividad

•IA•Modelo de lenguaje

276

Janus-Pro-1B — Janus-Pro-1B es un marco autorregresivo unificado de comprensión y generación multimodal.

Imagen

•Multimodal•Generación de imágenes

738

MiniCPM-o-2_6 — MiniCPM-o 2.6 es un potente modelo de lenguaje multimodal de gran escala, adecuado para transmisión en vivo visual, de voz y multimodal.

Otros

•Multimodal•Modelo de lenguaje

492

MiniCPM-o — MiniCPM-o 2.6: Un MLLM de nivel GPT-4o que permite transmisión en vivo visual, de voz y multimodal en dispositivos móviles.

Otros

•Multimodal•Modelo de lenguaje

378

El Lenguaje del Movimiento — Modelo unificado de lenguaje verbal y no verbal para acciones corporales 3D

Otros

•Movimiento corporal 3D•Multimodal

144

OLMo 2 13B — Modelo de lenguaje de referencia académica en inglés de alto rendimiento

Productividad

•Modelo de lenguaje•Procesamiento del lenguaje natural

186

MobileLLM-1B — Modelo de lenguaje de Meta con menos de mil millones de parámetros, diseñado para aplicaciones en dispositivos móviles.

Programación

•Modelo de lenguaje•Transformer

204

MobileLLM-600M — Modelo de lenguaje de 600M de parámetros, eficiente y optimizado, diseñado para aplicaciones en dispositivos.

Programación

•Modelo de lenguaje•Transformer

126

MobileLLM-350M — Modelo de lenguaje de parámetros sub-mil millones eficientemente optimizado, diseñado para aplicaciones en dispositivos.

Programación

•Modelo de lenguaje•Transformer

138

Modelo Lingüístico Spirit LM — Modelo de lenguaje multimodal que integra texto y voz

Productividad

•Multimodal•Modelo de lenguaje

270

ACE: Creador y Editor Integral que Sigue Instrucciones mediante Transformador de Difusión — Creador y editor integral que sigue instrucciones mediante transformaciones de difusión.

Imagen

•Generación visual•Modelo de difusión

342

ell — Biblioteca de programación de modelos de lenguaje ligero que trata las indicaciones como funciones.

Selección Internacional

•Modelo de lenguaje•Biblioteca de programación

306

DCLM-7B — Modelo de lenguaje de 700 millones de parámetros, que demuestra la eficacia de las técnicas de organización de datos.

Programación

•Modelo de lenguaje•Transformer

366

VideoLLaMA2-7B — Modelo de lenguaje grande para video, que ofrece respuestas a preguntas visuales y generación de subtítulos de video.

Video

•Comprensión de video•Modelo de lenguaje

678

VideoLLaMA2-7B-16F-Base — Modelo de lenguaje de vídeo grande, utilizado para preguntas y respuestas visuales y generación de subtítulos de vídeo.

Video

•Preguntas y respuestas de vídeo•Subtítulos de vídeo

360

ml-ferret — Modelo de lenguaje de aprendizaje automático (MLLM) de extremo a extremo que permite la citación y localización precisas.

Programación

•Aprendizaje automático•Modelo de lenguaje

1056

Megatron-LM — Investigación continua sobre el entrenamiento a gran escala de modelos Transformer

Productividad

•Transformer•Modelo de lenguaje

288

JinaChat — Multimodalidad, memoria extendida, bajo coste

Chat

•Chat•Multimodal

288

DreamActor-M1 — Marco de animación de imágenes humanas basado en DiT, que permite un control preciso y una coherencia a largo plazo.

Productividad

•Animación humana•Generación de video

Fin-R1 — Modelo de lenguaje grande para el razonamiento financiero impulsado por el aprendizaje por refuerzo.

Productividad

•Finanzas•Inteligencia artificial

120

Mistral Small 3.1 — Modelo de código abierto que mejora la capacidad de procesamiento de tareas de texto y visión.

Productividad

•Multimodal•Procesamiento de texto

276

Gemini Robotics — Modelo robótico basado en Gemini 2.0, que lleva la IA al mundo físico, con capacidades visuales, lingüísticas y de movimiento.

Selección Internacional

•Inteligencia artificial•Robótica

168

Jamba 1.6 — Modelo Jamba 1.6 de AI21, diseñado para la implementación privada en empresas, con una capacidad excepcional de procesamiento de texto largo.

Productividad

•Modelo de lenguaje•Procesamiento de texto largo

156

R1-Omni — R1-Omni es un modelo de reconocimiento de emociones multimodal que combina el aprendizaje por refuerzo, y se centra en mejorar la interpretabilidad del reconocimiento de emociones multimodales.

Programación

•Multimodal•Reconocimiento de emociones

348

Noticias de IA

IA Diario

Cronología de la IA

Últimos Casos

Colección de Imágenes

Colección de Videos

Colección de Audio

Colección de Contenido

Últimos Tutoriales

Ranking de Productos de IA

Ranking de Crecimiento de Tráfico de IA

Ranking de Descenso de Tráfico de IA

Ranking Semanal de IA

Estados Unidos

China

India

Brasil

Generación de Imágenes

Asistente Personal

Generación de Personajes

Generación de Videos

Ranking de Proyectos de IA

Ranking de Crecimiento de Proyectos de IA

Ranking de Desarrolladores de IA

Ranking de Organizaciones de IA

Deepseek

TTS

LLM

ChatGPT

Visión General

Honeybee

Honeybee Situación del tráfico más reciente

Honeybee Tendencia de visitas

Honeybee Distribución geográfica de las visitas

Honeybee Fuentes de tráfico

Honeybee Alternativas

Qwen-VL — Modelo de lenguaje visual de propósito general

Honeybee — Modelo de predicción de red de lenguaje multimodal

DeepSeek Japonés — DeepSeek es un modelo de lenguaje IA avanzado, especializado en razonamiento lógico, matemáticas y tareas de programación, disponible de forma gratuita.

Janus-Pro-1B — Janus-Pro-1B es un marco autorregresivo unificado de comprensión y generación multimodal.

MiniCPM-o-2_6 — MiniCPM-o 2.6 es un potente modelo de lenguaje multimodal de gran escala, adecuado para transmisión en vivo visual, de voz y multimodal.

MiniCPM-o — MiniCPM-o 2.6: Un MLLM de nivel GPT-4o que permite transmisión en vivo visual, de voz y multimodal en dispositivos móviles.

El Lenguaje del Movimiento — Modelo unificado de lenguaje verbal y no verbal para acciones corporales 3D

OLMo 2 13B — Modelo de lenguaje de referencia académica en inglés de alto rendimiento

MobileLLM-1B — Modelo de lenguaje de Meta con menos de mil millones de parámetros, diseñado para aplicaciones en dispositivos móviles.

MobileLLM-600M — Modelo de lenguaje de 600M de parámetros, eficiente y optimizado, diseñado para aplicaciones en dispositivos.

MobileLLM-350M — Modelo de lenguaje de parámetros sub-mil millones eficientemente optimizado, diseñado para aplicaciones en dispositivos.

Modelo Lingüístico Spirit LM — Modelo de lenguaje multimodal que integra texto y voz

ACE: Creador y Editor Integral que Sigue Instrucciones mediante Transformador de Difusión — Creador y editor integral que sigue instrucciones mediante transformaciones de difusión.

ell — Biblioteca de programación de modelos de lenguaje ligero que trata las indicaciones como funciones.

DCLM-7B — Modelo de lenguaje de 700 millones de parámetros, que demuestra la eficacia de las técnicas de organización de datos.

VideoLLaMA2-7B — Modelo de lenguaje grande para video, que ofrece respuestas a preguntas visuales y generación de subtítulos de video.

VideoLLaMA2-7B-16F-Base — Modelo de lenguaje de vídeo grande, utilizado para preguntas y respuestas visuales y generación de subtítulos de vídeo.

imp-v1-3b — Un potente modelo de lenguaje multimodal pequeño

SpeechGPT — Modelo de lenguaje multimodal

TinyGPT-V — Modelo de lenguaje grande multimodal y eficiente

Unified-IO 2 — Modelo generativo multimodal unificado

ml-ferret — Modelo de lenguaje de aprendizaje automático (MLLM) de extremo a extremo que permite la citación y localización precisas.

Megatron-LM — Investigación continua sobre el entrenamiento a gran escala de modelos Transformer

JinaChat — Multimodalidad, memoria extendida, bajo coste

DreamActor-M1 — Marco de animación de imágenes humanas basado en DiT, que permite un control preciso y una coherencia a largo plazo.

Fin-R1 — Modelo de lenguaje grande para el razonamiento financiero impulsado por el aprendizaje por refuerzo.

Mistral Small 3.1 — Modelo de código abierto que mejora la capacidad de procesamiento de tareas de texto y visión.

Gemini Robotics — Modelo robótico basado en Gemini 2.0, que lleva la IA al mundo físico, con capacidades visuales, lingüísticas y de movimiento.

Jamba 1.6 — Modelo Jamba 1.6 de AI21, diseñado para la implementación privada en empresas, con una capacidad excepcional de procesamiento de texto largo.

R1-Omni — R1-Omni es un modelo de reconocimiento de emociones multimodal que combina el aprendizaje por refuerzo, y se centra en mejorar la interpretabilidad del reconocimiento de emociones multimodales.