Noticias de IA

No te pierdas ningún momento de la innovación global en IA

IA Diario

Tendencias diarias de la industria de la IA en tres minutos

Cronología de la IA

Hitos de la industria de la IA

Al hardware

lista todos los productos de hardware AI.

Guía de Monetización de la IA

Últimos Casos

Compartiendo casos de monetización de IA

Colección de Imágenes

Casos de monetización de creación de imágenes con IA

Colección de Videos

Casos de monetización de creación de videos con IA

Colección de Audio

Casos de monetización de creación de audio con IA

Colección de Contenido

Casos de monetización de redacción de contenido con IA

Tutoriales de IA

Últimos Tutoriales

Compartiendo gratuitamente los últimos tutoriales de IA

Rankings de Productos de IA

Ranking de Productos de IA

Muestra el ranking de visitas totales de sitios web de IA

Ranking de Crecimiento de Tráfico de IA

Rastrea los sitios web de IA de más rápido crecimiento por tráfico

Ranking de Descenso de Tráfico de IA

Se centra en los sitios web de IA con descensos de tráfico significativos

Ranking Semanal de IA

Muestra el ranking semanal de visitas de sitios web de IA

Rankings de Países Populares

Estados Unidos

Sitios web de IA más populares entre los usuarios estadounidenses

China

Sitios web de IA más populares entre los usuarios chinos

India

Sitios web de IA más populares entre los usuarios indios

Brasil

Sitios web de IA más populares entre los usuarios brasileños

Rankings de Categorías Populares

Generación de Imágenes

Ranking total de visitas de sitios web de generación de imágenes con IA

Asistente Personal

Ranking total de visitas de sitios web de asistentes personales con IA

Generación de Personajes

Ranking total de visitas de sitios web de generación de personajes con IA

Generación de Videos

Ranking total de visitas de sitios web de generación de videos con IA

Rankings de Datos de Código Abierto Populares

Ranking de Proyectos de IA

Proyectos de IA populares en GitHub por estrellas totales

Ranking de Crecimiento de Proyectos de IA

Proyectos de IA populares en GitHub por tasa de crecimiento

Ranking de Desarrolladores de IA

Ranking de desarrolladores de IA populares en GitHub

Ranking de Organizaciones de IA

Ranking de organizaciones de IA populares en GitHub

Categorías de Código Abierto Populares

Deepseek

Proyectos de código abierto de Deepseek populares en GitHub

TTS

Proyectos de código abierto de TTS populares en GitHub

LLM

Proyectos de código abierto de LLM populares en GitHub

ChatGPT

Proyectos de código abierto de ChatGPT populares en GitHub

Biblioteca de Proyectos de Código Abierto de IA

Visión General

Visión general de los proyectos de código abierto de IA populares en GitHub

Biblioteca de productos Navegación de herramientas

DeepSeek-R1-Distill-Qwen-1.5B

DeepSeek-R1-Distill-Qwen-1.5B es un modelo de lenguaje de código abierto de alta eficiencia de inferencia, adecuado para diversas tareas de procesamiento del lenguaje natural.

Producto ComúnProgramaciónProcesamiento del lenguaje naturalAprendizaje por refuerzo

Abrir sitio web

DeepSeek-R1-Distill-Qwen-1.5B es un modelo de lenguaje de código abierto desarrollado por el equipo DeepSeek, basado en la serie Qwen2.5 y optimizado mediante destilación. Este modelo, mediante aprendizaje por refuerzo a gran escala y técnicas de destilación de datos, mejora significativamente la capacidad y el rendimiento de la inferencia, manteniendo al mismo tiempo un tamaño de modelo reducido. Destaca en varias pruebas de referencia, especialmente en tareas de matemáticas, generación de código y razonamiento. Permite su uso comercial y la modificación y creación de obras derivadas, siendo adecuado para instituciones de investigación y empresas que buscan desarrollar aplicaciones de procesamiento del lenguaje natural de alto rendimiento.

Abrir sitio web

DeepSeek-R1-Distill-Qwen-1.5B Situación del tráfico más reciente

Total de visitas mensuales

27175375

Tasa de rebote

44.30%

Páginas promedio por visita

5.8

Duración promedio de la visita

00:04:57

DeepSeek-R1-Distill-Qwen-1.5B Tendencia de visitas

DeepSeek-R1-Distill-Qwen-1.5B Distribución geográfica de las visitas

DeepSeek-R1-Distill-Qwen-1.5B Fuentes de tráfico

DeepSeek-R1-Distill-Qwen-1.5B Alternativas

DeepSeek-R1-Distill-Qwen-1.5B — DeepSeek-R1-Distill-Qwen-1.5B es un modelo de lenguaje de código abierto de alta eficiencia de inferencia, adecuado para diversas tareas de procesamiento del lenguaje natural.

Programación

•Procesamiento del lenguaje natural•Aprendizaje por refuerzo

3882

DeepSeek-R1-Distill-Qwen-14B — DeepSeek-R1-Distill-Qwen-14B es un modelo de generación de texto de alto rendimiento, adecuado para diversas tareas de inferencia y generación.

Programación

•Procesamiento del Lenguaje Natural•Generación de Texto

4920

Search-R1 — Un marco de aprendizaje por refuerzo eficiente para entrenar modelos de lenguaje que realizan razonamiento y llaman a motores de búsqueda.

Productividad

•Aprendizaje por refuerzo•Procesamiento del lenguaje natural

d1 — Utilizar el aprendizaje por refuerzo para mejorar la capacidad de razonamiento de los modelos de lenguaje extenso de difusión.

Productividad

•Razonamiento•Aprendizaje por refuerzo

Hun Yuan T1 — Modelo de inferencia profunda líder en la industria, optimizado para las preferencias humanas.

Selección Nacional

•Aprendizaje profundo•Modelo de inferencia

180

Light-R1-14B-DS — Un modelo matemático de código abierto con 14 mil millones de parámetros, entrenado mediante aprendizaje por refuerzo, con un rendimiento excelente.

Productividad

•Aprendizaje por refuerzo•Modelo matemático

198

MLGym — MLGym es un nuevo marco y punto de referencia para avanzar en la investigación de agentes de IA.

Programación

•Investigación en IA•Aprendizaje por refuerzo

150

VLM-R1 — VLM-R1 es un modelo de lenguaje visual reforzado estable y versátil, enfocado en tareas de comprensión visual.

Imagen

•Modelo de lenguaje visual•Aprendizaje por refuerzo

270

NovaSky — NovaSky es una plataforma de tecnología de inteligencia artificial centrada en la generación de código y la optimización de modelos de inferencia.

Programación

•Inteligencia Artificial•Generación de Código

186

Tülu 3 405B — Tülu 3 405B es un modelo de lenguaje abierto de gran escala, cuyo rendimiento se ha mejorado mediante aprendizaje por refuerzo.

Programación

•Inteligencia Artificial•Procesamiento del Lenguaje Natural

708

DeepSeek-R1-Distill-Llama-8B — DeepSeek-R1-Distill-Llama-8B es un modelo de lenguaje de código abierto de alto rendimiento, adecuado para tareas de generación y razonamiento de texto.

Productividad

•Modelo de lenguaje•Razonamiento

2202

mwp_ReFT — Marco de ajuste fino de modelos basado en el aprendizaje por refuerzo profundo

Programación

•Procesamiento del lenguaje natural•Aprendizaje profundo

258

Describir Cualquier Cosa — Un modelo de descripción de imágenes y videos basado en aprendizaje profundo.

Productividad

•Descripción de imágenes•Procesamiento de video

GLM-4-32B — Un potente modelo de lenguaje que admite múltiples tareas de procesamiento de lenguaje natural.

Selección Nacional

•Procesamiento del lenguaje natural•Aprendizaje profundo

Amazon Nova Sonic — El nuevo modelo básico de Amazon comprende el tono, la entonación y el ritmo, mejorando la naturalidad de la conversación entre humanos y máquinas.

Productividad

•Reconocimiento de voz•Inteligencia artificial

Agno — Una biblioteca ligera para construir agentes multimodales.

Productividad

•Agente multimodal•Código abierto

DeepSeek-V3-0324 — Un potente modelo de generación de texto, adecuado para diversas aplicaciones de diálogo.

Tendencia Global

•Generación de texto•Sistemas de diálogo

138

Mixun T1 — El primer modelo de inferencia Mamba híbrido a gran escala de la industria, con una potente capacidad de inferencia.

Selección Nacional

•Modelo de inferencia•Inteligencia artificial

Reka Flash 3 — Un modelo de inferencia general de 21B parámetros, adecuado para aplicaciones de baja latencia.

Productividad

•Inteligencia Artificial•Procesamiento del Lenguaje Natural

168

o1-pro — El modelo o1-pro mejora su capacidad de inferencia compleja mediante el aprendizaje por refuerzo, proporcionando respuestas óptimas.

Tendencia Global

•Inteligencia artificial•Procesamiento del lenguaje natural

210

Light-R1 — Light-R1 es un proyecto de código abierto centrado en el razonamiento de cadenas largas (Long COT), que proporciona un método de entrenamiento desde cero mediante SFT, DPO y RL.

Programación

•Inteligencia Artificial•Razonamiento de Cadenas Largas

216

Sesame AI — Sesame AI es una plataforma de síntesis de voz avanzada que puede generar voz natural de conversación y tiene inteligencia emocional.

Otros

•Síntesis de voz•Inteligencia artificial

492

API de Respuestas — La función Respuestas de la API de OpenAI se utiliza para crear y gestionar las respuestas del modelo.

Programación

•Inteligencia artificial•Procesamiento del lenguaje natural

402

R1-Omni — R1-Omni es un modelo de reconocimiento de emociones multimodal que combina el aprendizaje por refuerzo, y se centra en mejorar la interpretabilidad del reconocimiento de emociones multimodales.

Programación

•Multimodal•Reconocimiento de emociones

348

Herramientas Integradas de OpenAI — Herramientas integradas proporcionadas por OpenAI para ampliar las capacidades del modelo, como la búsqueda web y la búsqueda de archivos.

Productividad

•Inteligencia artificial•Procesamiento del lenguaje natural

210

Awesome-LLM-Post-training — Un repositorio de recursos de tutoriales, estudios y guías sobre métodos de post-entrenamiento de modelos lingüísticos de gran tamaño (LLM).

Productividad

•LLM•Post-entrenamiento

228

Steiner-32b-preview — Steiner es un modelo de razonamiento entrenado con datos sintéticos, diseñado para explorar múltiples rutas de razonamiento y verificarlas de forma autónoma.

Productividad

•Modelo de razonamiento•Aprendizaje por refuerzo

174

Modelo de incrustación de texto Gemini Embedding — Gemini Embedding es un modelo de incrustación de texto avanzado que proporciona una potente capacidad de comprensión del lenguaje a través de la API de Gemini.

Programación

•Incrustación de texto•Procesamiento del lenguaje natural

174

NotaGen — NotaGen es un modelo para la generación de música simbólica, que adopta el paradigma de entrenamiento de modelos de lenguaje grande y se centra en la generación de partituras de música clásica de alta calidad.

Música

•Generación de música•Modelo de lenguaje grande

354

NeoBase — NeoBase es un asistente de base de datos de IA de código abierto que le permite interactuar con bases de datos utilizando lenguaje natural.

Productividad

•IA•Base de datos

144