Noticias de IA

No te pierdas ningún momento de la innovación global en IA

IA Diario

Tendencias diarias de la industria de la IA en tres minutos

Cronología de la IA

Hitos de la industria de la IA

Al hardware

lista todos los productos de hardware AI.

Guía de Monetización de la IA

Últimos Casos

Compartiendo casos de monetización de IA

Colección de Imágenes

Casos de monetización de creación de imágenes con IA

Colección de Videos

Casos de monetización de creación de videos con IA

Colección de Audio

Casos de monetización de creación de audio con IA

Colección de Contenido

Casos de monetización de redacción de contenido con IA

Tutoriales de IA

Últimos Tutoriales

Compartiendo gratuitamente los últimos tutoriales de IA

Rankings de Productos de IA

Ranking de Productos de IA

Muestra el ranking de visitas totales de sitios web de IA

Ranking de Crecimiento de Tráfico de IA

Rastrea los sitios web de IA de más rápido crecimiento por tráfico

Ranking de Descenso de Tráfico de IA

Se centra en los sitios web de IA con descensos de tráfico significativos

Ranking Semanal de IA

Muestra el ranking semanal de visitas de sitios web de IA

Rankings de Países Populares

Estados Unidos

Sitios web de IA más populares entre los usuarios estadounidenses

China

Sitios web de IA más populares entre los usuarios chinos

India

Sitios web de IA más populares entre los usuarios indios

Brasil

Sitios web de IA más populares entre los usuarios brasileños

Rankings de Categorías Populares

Generación de Imágenes

Ranking total de visitas de sitios web de generación de imágenes con IA

Asistente Personal

Ranking total de visitas de sitios web de asistentes personales con IA

Generación de Personajes

Ranking total de visitas de sitios web de generación de personajes con IA

Generación de Videos

Ranking total de visitas de sitios web de generación de videos con IA

Rankings de Datos de Código Abierto Populares

Ranking de Proyectos de IA

Proyectos de IA populares en GitHub por estrellas totales

Ranking de Crecimiento de Proyectos de IA

Proyectos de IA populares en GitHub por tasa de crecimiento

Ranking de Desarrolladores de IA

Ranking de desarrolladores de IA populares en GitHub

Ranking de Organizaciones de IA

Ranking de organizaciones de IA populares en GitHub

Categorías de Código Abierto Populares

Deepseek

Proyectos de código abierto de Deepseek populares en GitHub

TTS

Proyectos de código abierto de TTS populares en GitHub

LLM

Proyectos de código abierto de LLM populares en GitHub

ChatGPT

Proyectos de código abierto de ChatGPT populares en GitHub

Biblioteca de Proyectos de Código Abierto de IA

Visión General

Visión general de los proyectos de código abierto de IA populares en GitHub

Biblioteca de productos Navegación de herramientas

Biblioteca de aprendizaje automático de código abierto vLLM: mejora la velocidad de inferencia de los modelos de lenguaje grandes

站长之家

Publicado elNoticias de IA · 1 minutos de lectura · Sep 18, 2023

116

En los últimos años, los grandes modelos de lenguaje (LLM) han tenido un impacto cada vez mayor en la vida y las profesiones de las personas. La biblioteca de aprendizaje automático de código abierto vLLM mejora la velocidad de inferencia de los LLM mediante el algoritmo PagedAttention, gestionando eficazmente la memoria caché de clave-valor y aumentando el rendimiento. Equipado con PagedAttention, vLLM alcanza el nivel óptimo de servicio LLM sin necesidad de modificar la arquitectura del modelo. Los investigadores descubrieron que vLLM aumenta el rendimiento de los LLM conocidos entre 2 y 4 veces en comparación con otros sistemas.

Aprendizaje automático Modelos de lenguaje grandes Velocidad de inferencia

Este artículo proviene de AIbase Daily

¡Bienvenido a la columna [AI Diario]! Aquí está tu guía diaria para explorar el mundo de la inteligencia artificial. Todos los días te presentamos el contenido más destacado en el campo de la IA, centrándonos en los desarrolladores para ayudarte a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de productos de IA.

—— Creado por el grupo AIbase Daily

Noticias de IA relacionadas recomendadas

Pusa: Modelo de video de código abierto creado con un presupuesto de 100 dólares - Replica de alta calidad a bajo coste basada en el ajuste fino de Mochi

Este artículo describe cómo se creó el modelo de video de código abierto Pusa con un presupuesto de tan solo 100 dólares. Se basa en el ajuste fino del modelo Mochi para lograr una alta calidad de resultados a un costo significativamente reducido. Descubre los pasos detallados y los resultados obtenidos en este proyecto innovador.

Apr 14, 2025

¡Revolución en las pruebas de inteligencia artificial! El nuevo benchmark GAIA supera a ARC-AGI

Un nuevo punto de referencia para la inteligencia artificial, GAIA, ha demostrado superar a ARC-AGI en las pruebas de inteligencia. Esto marca un hito significativo en el desarrollo de la IA y abre nuevas posibilidades para el futuro de la tecnología.

Apr 14, 2025

TikTok responde al lanzamiento de la tarjeta de desmentido: combina capacidades de modelos de lenguaje grandes de IA y humanos

Recientemente, el boletín de TikTok publicó un anuncio importante anunciando el lanzamiento oficial de una nueva función de "tarjeta de desmentido" para combatir la información errónea. Esta medida tiene como objetivo identificar y manejar la información errónea de manera más eficiente, y revelar a los usuarios de manera integral el origen, las causas de la propagación y la verdad de la información errónea.

Apr 9, 2025

Hugging Face añade una función práctica: comprueba con un clic qué modelos puedes ejecutar en tu ordenador

Hugging Face, la plataforma líder de la comunidad de código abierto de inteligencia artificial, ha lanzado una nueva función muy esperada: los usuarios pueden comprobar rápidamente qué modelos de aprendizaje automático pueden ejecutar en su hardware a través de la configuración de la plataforma. Según se informa, los usuarios solo necesitan agregar la información de su hardware en la página de configuración personal de Hugging Face (ruta: icono de perfil en la esquina superior derecha > Configuración > "Aplicaciones locales y hardware"), como el modelo de GPU,

Apr 3, 2025

Crisis de seguridad significativa en la cadena de suministro de software en la era de la IA: aumento del 64% en las filtraciones de información confidencial

Recientemente, JFrog publicó el informe "State of Software Supply Chain 2025", que revela los importantes desafíos de seguridad que enfrenta la cadena de suministro de software en el contexto del rápido desarrollo de la inteligencia artificial (IA). Según el informe, el equipo de investigación, a través de encuestas a más de 1400 profesionales y el análisis de datos de más de 7000 clientes, ha descrito un panorama de seguridad preocupante. El informe indica que las vulnerabilidades de seguridad en la cadena de suministro de software han aumentado drásticamente en el último año, con un aumento del 64% en los casos de exposición de información "secreta" o confidencial.

Apr 1, 2025

Los investigadores de IA de Nvidia presentan la tecnología de fusión FFN: aceleración de la inferencia de modelos de lenguaje grandes

Mar 31, 2025

IntuiCell, startup nórdica, lanza el primer sistema nervioso digital del mundo con aprendizaje automático de IA

IntuiCell, una startup de deep tech con sede en los países nórdicos, ha anunciado recientemente un avance innovador: el lanzamiento del primer sistema nervioso digital funcional del mundo, con capacidad de aprendizaje autónomo. Anunciado el 19 de marzo de 2025, la compañía ha logrado diseñar una inteligencia artificial capaz de aprender y adaptarse como un organismo biológico. Esta tecnología tiene el potencial de volver obsoletas las metodologías de IA existentes en numerosas aplicaciones. La innovación de IntuiCell supone un cambio significativo respecto a los modelos tradicionales estáticos de aprendizaje automático, imitando la biología…

Mar 21, 2025

Plataforma X5 de Tuosda: Rompiendo las barreras de datos entre robots y modelos de lenguaje grandes

En la era del rápido desarrollo de la inteligencia artificial, Tuosda reveló recientemente funciones innovadoras de su nueva generación de plataforma de control robótico, la plataforma X5, en su evento de relaciones con inversores. La plataforma X5 utiliza una arquitectura en la nube, borde y extremo, combinando cómputo de alto rendimiento con control inteligente de robots, logrando la transmisión de datos en tiempo real y la ejecución eficiente de decisiones inteligentes. El lanzamiento de esta plataforma no solo es un complemento poderoso para la tecnología robótica tradicional, sino que también construye un puente de comunicación entre la inteligencia encarnada y las aplicaciones de modelos de lenguaje grandes. En concreto, la plataforma X5...

Mar 16, 2025

Equipo de la CMU presenta Meta Reinforcement Fine-Tuning (MRT): un nuevo paradigma para mejorar la capacidad de razonamiento de los modelos de lenguaje grandes

En el campo de la inteligencia artificial, los modelos de lenguaje grandes (LLM) están en constante evolución. Recientemente, investigadores de la Universidad Carnegie Mellon (CMU) y HuggingFace presentaron un nuevo método llamado "Meta Reinforcement Fine-Tuning" (MRT). Este método busca optimizar la eficiencia computacional de los modelos de lenguaje grandes durante las pruebas, especialmente al resolver problemas complejos de razonamiento, donde muestra un rendimiento excepcional. Los estudios demuestran que los modelos de lenguaje grandes existentes tienen dificultades en el razonamiento...

Mar 13, 2025

Cerebras acelera la expansión a seis centros de datos, ¡aumentando la velocidad de inferencia hasta diez veces!

Cerebras Systems anunció recientemente la construcción de seis nuevos centros de datos en Norteamérica y Europa para mejorar sus capacidades de inferencia de inteligencia artificial (IA). Esta iniciativa aumentará significativamente la potencia de cálculo de la empresa, apoyando el desarrollo de diversas aplicaciones de IA. Según el plan, el 85% de la capacidad de computación se concentrará en Estados Unidos, con tres instalaciones ya operativas en Santa Clara y Stockton, California, y Dallas, Texas. Los nuevos centros estarán ubicados en Minneapolis (previsto para el segundo trimestre de 2025), Oklahoma City y Montreal.

Mar 12, 2025