Noticias de IA

No te pierdas ningún momento de la innovación global en IA

IA Diario

Tendencias diarias de la industria de la IA en tres minutos

Cronología de la IA

Hitos de la industria de la IA

Al hardware

lista todos los productos de hardware AI.

Guía de Monetización de la IA

Últimos Casos

Compartiendo casos de monetización de IA

Colección de Imágenes

Casos de monetización de creación de imágenes con IA

Colección de Videos

Casos de monetización de creación de videos con IA

Colección de Audio

Casos de monetización de creación de audio con IA

Colección de Contenido

Casos de monetización de redacción de contenido con IA

Tutoriales de IA

Últimos Tutoriales

Compartiendo gratuitamente los últimos tutoriales de IA

Rankings de Productos de IA

Ranking de Productos de IA

Muestra el ranking de visitas totales de sitios web de IA

Ranking de Crecimiento de Tráfico de IA

Rastrea los sitios web de IA de más rápido crecimiento por tráfico

Ranking de Descenso de Tráfico de IA

Se centra en los sitios web de IA con descensos de tráfico significativos

Ranking Semanal de IA

Muestra el ranking semanal de visitas de sitios web de IA

Rankings de Países Populares

Estados Unidos

Sitios web de IA más populares entre los usuarios estadounidenses

China

Sitios web de IA más populares entre los usuarios chinos

India

Sitios web de IA más populares entre los usuarios indios

Brasil

Sitios web de IA más populares entre los usuarios brasileños

Rankings de Categorías Populares

Generación de Imágenes

Ranking total de visitas de sitios web de generación de imágenes con IA

Asistente Personal

Ranking total de visitas de sitios web de asistentes personales con IA

Generación de Personajes

Ranking total de visitas de sitios web de generación de personajes con IA

Generación de Videos

Ranking total de visitas de sitios web de generación de videos con IA

Rankings de Datos de Código Abierto Populares

Ranking de Proyectos de IA

Proyectos de IA populares en GitHub por estrellas totales

Ranking de Crecimiento de Proyectos de IA

Proyectos de IA populares en GitHub por tasa de crecimiento

Ranking de Desarrolladores de IA

Ranking de desarrolladores de IA populares en GitHub

Ranking de Organizaciones de IA

Ranking de organizaciones de IA populares en GitHub

Categorías de Código Abierto Populares

Deepseek

Proyectos de código abierto de Deepseek populares en GitHub

TTS

Proyectos de código abierto de TTS populares en GitHub

LLM

Proyectos de código abierto de LLM populares en GitHub

ChatGPT

Proyectos de código abierto de ChatGPT populares en GitHub

Biblioteca de Proyectos de Código Abierto de IA

Visión General

Visión general de los proyectos de código abierto de IA populares en GitHub

Biblioteca de productos Navegación de herramientas

CogAgent

Agente GUI basado en el modelo de lenguaje visual de extremo a extremo (VLM) de código abierto

Producto ComúnProgramaciónModelo de lenguaje visualAgente GUI

Abrir sitio web

CogAgent es un agente GUI basado en un modelo de lenguaje visual (VLM) que permite la interacción bilingüe (chino e inglés) a través de capturas de pantalla y lenguaje natural. CogAgent ha logrado avances significativos en la percepción de la GUI, la precisión de la predicción de inferencia, la integridad del espacio de operación y la generalización de tareas. Este modelo ya se ha aplicado en el producto GLM-PC de ZhipuAI, con el objetivo de ayudar a investigadores y desarrolladores a impulsar la investigación y la aplicación de agentes GUI basados en modelos de lenguaje visual.

Abrir sitio web

CogAgent Situación del tráfico más reciente

Total de visitas mensuales

521149929

Tasa de rebote

35.96%

Páginas promedio por visita

6.1

Duración promedio de la visita

00:06:29

CogAgent Tendencia de visitas

CogAgent Distribución geográfica de las visitas

CogAgent Fuentes de tráfico

CogAgent Alternativas

CogAgent — Agente GUI basado en el modelo de lenguaje visual de extremo a extremo (VLM) de código abierto

Programación

•Modelo de lenguaje visual•Agente GUI

342

VLM-R1 — VLM-R1 es un modelo de lenguaje visual reforzado estable y versátil, enfocado en tareas de comprensión visual.

Imagen

•Modelo de lenguaje visual•Aprendizaje por refuerzo

270

cogagent-9b-20241220 — CogAgent-9B-20241220 es un modelo de agente GUI basado en un modelo de lenguaje visual.

Programación

•Modelo de lenguaje visual•Agente GUI

198

DeepSeek-VL2-Tiny — Modelo de lenguaje visual avanzado de gran tamaño y experto mixto

Imagen

•Modelo de lenguaje visual•Experto mixto

576

Florence-VL — Herramienta de mejora de modelos de lenguaje visual, que combina un codificador visual generativo y una técnica de fusión de profundidad y amplitud.

Programación

•Modelo de lenguaje visual•Aprendizaje multimodal

258

PaliGemma 2 — PaliGemma 2 es un potente modelo de lenguaje visual, fácil de ajustar.

Productividad

•Modelo de lenguaje visual•IA

210

GLM-4-32B — Un potente modelo de lenguaje que admite múltiples tareas de procesamiento de lenguaje natural.

Selección Nacional

•Procesamiento del lenguaje natural•Aprendizaje profundo

Amazon Nova Sonic — El nuevo modelo básico de Amazon comprende el tono, la entonación y el ritmo, mejorando la naturalidad de la conversación entre humanos y máquinas.

Productividad

•Reconocimiento de voz•Inteligencia artificial

Agno — Una biblioteca ligera para construir agentes multimodales.

Productividad

•Agente multimodal•Código abierto

DeepSeek-V3-0324 — Un potente modelo de generación de texto, adecuado para diversas aplicaciones de diálogo.

Tendencia Global

•Generación de texto•Sistemas de diálogo

138

Hun Yuan T1 — Modelo de inferencia profunda líder en la industria, optimizado para las preferencias humanas.

Selección Nacional

•Aprendizaje profundo•Modelo de inferencia

180

Reka Flash 3 — Un modelo de inferencia general de 21B parámetros, adecuado para aplicaciones de baja latencia.

Productividad

•Inteligencia Artificial•Procesamiento del Lenguaje Natural

168

o1-pro — El modelo o1-pro mejora su capacidad de inferencia compleja mediante el aprendizaje por refuerzo, proporcionando respuestas óptimas.

Tendencia Global

•Inteligencia artificial•Procesamiento del lenguaje natural

210

Light-R1-14B-DS — Un modelo matemático de código abierto con 14 mil millones de parámetros, entrenado mediante aprendizaje por refuerzo, con un rendimiento excelente.

Productividad

•Aprendizaje por refuerzo•Modelo matemático

198

Sesame AI — Sesame AI es una plataforma de síntesis de voz avanzada que puede generar voz natural de conversación y tiene inteligencia emocional.

Otros

•Síntesis de voz•Inteligencia artificial

492

API de Respuestas — La función Respuestas de la API de OpenAI se utiliza para crear y gestionar las respuestas del modelo.

Programación

•Inteligencia artificial•Procesamiento del lenguaje natural

402

Herramientas Integradas de OpenAI — Herramientas integradas proporcionadas por OpenAI para ampliar las capacidades del modelo, como la búsqueda web y la búsqueda de archivos.

Productividad

•Inteligencia artificial•Procesamiento del lenguaje natural

210

Awesome-LLM-Post-training — Un repositorio de recursos de tutoriales, estudios y guías sobre métodos de post-entrenamiento de modelos lingüísticos de gran tamaño (LLM).

Productividad

•LLM•Post-entrenamiento

228

Modelo de incrustación de texto Gemini Embedding — Gemini Embedding es un modelo de incrustación de texto avanzado que proporciona una potente capacidad de comprensión del lenguaje a través de la API de Gemini.

Programación

•Incrustación de texto•Procesamiento del lenguaje natural

174

NeoBase — NeoBase es un asistente de base de datos de IA de código abierto que le permite interactuar con bases de datos utilizando lenguaje natural.

Productividad

•IA•Base de datos

144

Instella — Instella es un modelo de lenguaje de código abierto de alto rendimiento desarrollado por AMD, diseñado para acelerar el desarrollo de modelos de lenguaje de código abierto.

Programación

•Código abierto•Modelo de lenguaje

246

Clon — Clon es un robot humanoide con tecnología revolucionaria de músculos artificiales Myofiber, capaz de caminar de forma natural.

Otros

•Inteligencia artificial•Robótica

168

Aya Vision 8B — Modelo de lenguaje visual multilingüe de 800 millones de parámetros, compatible con OCR, descripción de imágenes, razonamiento visual, etc.

Imagen

•Multilingüe•Modelo de lenguaje visual

222

ViDoRAG — ViDoRAG es un marco de agentes de razonamiento iterativo dinámico que combina la recuperación de documentos visuales con la generación mejorada.

Programación

•Multimodal•Generación mejorada con recuperación

126

Microsoft Dragon Copilot — Microsoft Dragon Copilot es un espacio de trabajo de IA para el sector sanitario que simplifica el flujo de trabajo de la documentación clínica y mejora la eficiencia.

Selección Internacional

•IA•Sanidad

216

Migician — Migician es un modelo de lenguaje multimodal de gran tamaño centrado en la localización de múltiples imágenes, capaz de realizar una localización precisa de múltiples imágenes de forma libre.

Imagen

•Multimodal•Localización de imágenes

174

IndexTTS — Sistema de texto a voz (TTS) de muestra cero, eficiente y controlable de grado industrial

Productividad

•Síntesis de voz•Inteligencia artificial

204

olmOCR — olmOCR es un conjunto de herramientas para linealizar PDF para el entrenamiento de conjuntos de datos LLM.

Programación

•Procesamiento de PDF•Entrenamiento de LLM

156

Extensiones de IA de Raycast — Raycast lanza las Extensiones de IA, que permiten interactuar mediante comandos de lenguaje natural con las aplicaciones de su ordenador y ejecutar tareas.

Productividad

•IA•Procesamiento del lenguaje natural

210

MLGym — MLGym es un nuevo marco y punto de referencia para avanzar en la investigación de agentes de IA.

Programación

•Investigación en IA•Aprendizaje por refuerzo

150