Noticias de IA

No te pierdas ningún momento de la innovación global en IA

IA Diario

Tendencias diarias de la industria de la IA en tres minutos

Cronología de la IA

Hitos de la industria de la IA

Al hardware

lista todos los productos de hardware AI.

Guía de Monetización de la IA

Últimos Casos

Compartiendo casos de monetización de IA

Colección de Imágenes

Casos de monetización de creación de imágenes con IA

Colección de Videos

Casos de monetización de creación de videos con IA

Colección de Audio

Casos de monetización de creación de audio con IA

Colección de Contenido

Casos de monetización de redacción de contenido con IA

Tutoriales de IA

Últimos Tutoriales

Compartiendo gratuitamente los últimos tutoriales de IA

Rankings de Productos de IA

Ranking de Productos de IA

Muestra el ranking de visitas totales de sitios web de IA

Ranking de Crecimiento de Tráfico de IA

Rastrea los sitios web de IA de más rápido crecimiento por tráfico

Ranking de Descenso de Tráfico de IA

Se centra en los sitios web de IA con descensos de tráfico significativos

Ranking Semanal de IA

Muestra el ranking semanal de visitas de sitios web de IA

Rankings de Países Populares

Estados Unidos

Sitios web de IA más populares entre los usuarios estadounidenses

China

Sitios web de IA más populares entre los usuarios chinos

India

Sitios web de IA más populares entre los usuarios indios

Brasil

Sitios web de IA más populares entre los usuarios brasileños

Rankings de Categorías Populares

Generación de Imágenes

Ranking total de visitas de sitios web de generación de imágenes con IA

Asistente Personal

Ranking total de visitas de sitios web de asistentes personales con IA

Generación de Personajes

Ranking total de visitas de sitios web de generación de personajes con IA

Generación de Videos

Ranking total de visitas de sitios web de generación de videos con IA

Rankings de Datos de Código Abierto Populares

Ranking de Proyectos de IA

Proyectos de IA populares en GitHub por estrellas totales

Ranking de Crecimiento de Proyectos de IA

Proyectos de IA populares en GitHub por tasa de crecimiento

Ranking de Desarrolladores de IA

Ranking de desarrolladores de IA populares en GitHub

Ranking de Organizaciones de IA

Ranking de organizaciones de IA populares en GitHub

Categorías de Código Abierto Populares

Deepseek

Proyectos de código abierto de Deepseek populares en GitHub

TTS

Proyectos de código abierto de TTS populares en GitHub

LLM

Proyectos de código abierto de LLM populares en GitHub

ChatGPT

Proyectos de código abierto de ChatGPT populares en GitHub

Biblioteca de Proyectos de Código Abierto de IA

Visión General

Visión general de los proyectos de código abierto de IA populares en GitHub

Biblioteca de productos Navegación de herramientas

Los investigadores de IA de Nvidia presentan la tecnología de fusión FFN: aceleración de la inferencia de modelos de lenguaje grandes

AIbase基地

Publicado elNoticias de IA · 8 minutos de lectura · Mar 31, 2025

Investigadores de la empresa líder en chips de inteligencia artificial, NVIDIA, han publicado recientemente una innovadora técnica de optimización de arquitectura denominada "Fusión FFN" (FFN Fusion). Esta técnica tiene como objetivo mejorar significativamente la eficiencia de la inferencia de los modelos lingüísticos grandes (LLM) al resolver el cuello de botella de cálculo en serie inherente a la arquitectura Transformer, allanando el camino para una implementación más amplia de aplicaciones de IA de alto rendimiento.

En los últimos años, los modelos lingüísticos grandes han demostrado una gran capacidad en áreas como el procesamiento del lenguaje natural, la investigación científica y los agentes conversacionales. Sin embargo, a medida que aumenta el tamaño y la complejidad de los modelos, también lo hace la cantidad de recursos computacionales necesarios para su proceso de inferencia, lo que genera un cuello de botella en la eficiencia. La arquitectura Transformer, base de los LLM, requiere el procesamiento secuencial de la entrada debido a sus mecanismos de atención y capas de redes feed-forward (FFN) alternas. Esta estructura en serie inherente aumenta significativamente los costes de cálculo y de comunicación entre las GPU a medida que aumenta el tamaño del modelo, reduciendo la eficiencia y aumentando los costes de implementación. Este problema es especialmente evidente en escenarios que requieren la generación rápida de varios tokens (como en asistentes de IA en tiempo real).

Para abordar este desafío, los investigadores de NVIDIA propusieron la técnica de Fusión FFN. La idea principal de este método es fusionar las capas FFN consecutivas con baja dependencia mutua en un FFN más ancho. Los investigadores observaron que, después de eliminar las capas de atención, suelen existir secuencias largas de FFN consecutivas en los LLM. Al analizar estas secuencias, descubrieron que la dependencia entre estas capas FFN es mínima, por lo que se pueden ejecutar en paralelo.

La base matemática de la Fusión FFN radica en concatenar los pesos de múltiples FFN en serie para crear un único módulo equivalente que se puede calcular en paralelo. Por ejemplo, si tres FFN están apilados secuencialmente, con la salida de cada FFN como entrada del siguiente, la Fusión FFN elimina esta dependencia, permitiendo que los tres FFN procesen simultáneamente la misma entrada y luego agreguen sus salidas. El análisis teórico demuestra que el FFN fusionado mantiene la misma capacidad de representación que el FFN original.

Ultra-253B-Base: Mejora del rendimiento y la eficiencia

Los investigadores de NVIDIA aplicaron la técnica de Fusión FFN al modelo Llama-3.1-405B-Instruct de Meta, creando un nuevo modelo llamado Ultra-253B-Base mediante poda y reconstrucción. Los resultados experimentales muestran una mejora significativa en la velocidad de inferencia y la eficiencia de los recursos. Específicamente, el modelo redujo la latencia de inferencia en 1,71 veces y el coste computacional por token en 35 veces con un tamaño de lote de 32.

Más impresionante aún, esta mejora en la eficiencia no se logró a expensas de la capacidad del modelo. Ultra-253B-Base obtuvo excelentes resultados en varios puntos de referencia de evaluación autorizados, como: MMLU 85,17 %, MMLU-Pro 72,25 %, HumanEval 86,58 %, Arena Hard 84,92 %, MT-Bench 9,19 %. Estos resultados son comparables o incluso superiores a los del modelo original de 405 mil millones de parámetros, mientras que Ultra-253B-Base solo contiene 253 mil millones de parámetros. Además, el consumo de memoria se redujo a la mitad gracias a la optimización de la caché kv.

Los investigadores utilizaron el análisis de la distancia del coseno entre las salidas de las capas FFN para identificar las regiones con baja interdependencia, que son las mejores opciones para la fusión. La técnica de Fusión FFN se ha probado en modelos de diferentes tamaños (incluidos modelos de 49 mil millones, 70 mil millones y 253 mil millones de parámetros), lo que demuestra su buena generalización.

Esta investigación muestra que, mediante un análisis profundo y un diseño de arquitectura inteligente, se puede mejorar significativamente la eficiencia de los LLM. La Fusión FFN sienta las bases para el diseño de LLM más paralelizados y adaptados al hardware. Aunque la paralelización de los módulos Transformer completos presenta mayores desafíos debido a la mayor dependencia entre capas, el éxito de la Fusión FFN sin duda indica una dirección importante para la optimización de la eficiencia de los LLM en el futuro.

Artículo:https://arxiv.org/abs/2503.18908

FFNCombinación ArquitecturaTransformer Modelodelenguajegrande(LLM)Inglés

Este artículo proviene de AIbase Daily

¡Bienvenido a la columna [AI Diario]! Aquí está tu guía diaria para explorar el mundo de la inteligencia artificial. Todos los días te presentamos el contenido más destacado en el campo de la IA, centrándonos en los desarrolladores para ayudarte a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de productos de IA.

—— Creado por el grupo AIbase Daily

Noticias de IA relacionadas recomendadas

Modos de voz Grok totalmente disponibles: 11 modos lanzados, subtítulos integrados, una herramienta poderosa para aprender inglés

Mar 5, 2025

130

CogView4: Modelo de texto a imagen de código abierto de inteligencia artificial, admite indicaciones en chino e inglés

El nuevo modelo de texto a imagen de código abierto de inteligencia artificial de Zhipu AI, CogView4, hace su debut oficial. CogView4 no solo alcanza los 600 millones de parámetros, sino que también admite completamente la entrada en chino y la generación de imágenes a partir de texto chino, y se le considera el primer modelo de código abierto capaz de generar caracteres chinos en imágenes. El punto más destacado de CogView4 es su capacidad para admitir indicaciones en chino e inglés, siendo especialmente bueno para comprender y seguir instrucciones complejas en chino, lo que lo convierte en una bendición para los creadores de contenido chino. Como el primer modelo de texto a imagen de código abierto capaz de generar caracteres chinos en imágenes, llena un vacío importante en el campo del código abierto.

Mar 4, 2025

Duolingo lanza función de IA para ayudar a los estudiantes de inglés a impulsar el crecimiento del rendimiento

Feb 28, 2025

Lanzamiento impactante del modelo de generación de imágenes Ideogram 2a: el doble de velocidad, la mitad de coste, composición en inglés comparable al diseño humano

El 27 de febrero de 2025, el servicio de generación de imágenes de inteligencia artificial Ideogram recibió una esperada actualización con el lanzamiento oficial de su nuevo modelo, Ideogram 2a. Según la información publicada en Twitter por el usuario @sundyme, este nuevo modelo no solo ha mejorado significativamente la velocidad de generación, sino que también ha reducido a la mitad el coste, consolidando aún más el liderazgo de Ideogram en el campo de la generación de imágenes a partir de texto (Text-to-Image). @sundyme elogió en su tuit...

Feb 28, 2025

ElevenLabs lanza el modelo de voz a texto Scribe, con una precisión sin precedentes: 96,7% en inglés

Feb 27, 2025

¡Impresionante! NVIDIA lanza el modelo de generación de imágenes Sana de código abierto: imágenes en 1 segundo, compatible con chino, inglés y emojis

Recientemente, NVIDIA lanzó un modelo de generación de imágenes de código abierto llamado Sana. Este modelo, con solo 60 millones de parámetros, reduce drásticamente el umbral de funcionamiento. Sana puede generar imágenes con una resolución de 4096×4096 y funcionar en una tarjeta gráfica de 16 GB, generando imágenes de alta calidad con una resolución de 1024×1024 en menos de un segundo, una velocidad destacada entre modelos similares. Sana funciona con la tecnología DC-AE (autocodificador de doble canal), utilizando un espacio latente 32 veces mayor.

Jan 14, 2025

6.9k

¿Cómo se traducen AIGC y AGI al chino? Se publica una tabla de comparación chino-inglés de vocabulario relacionado con la inteligencia artificial

El Ministerio de Educación anunció recientemente que el Comité de Expertos de la Reunión Conjunta Interministerial sobre Normas de Traducción de Palabras Extranjeras al Chino aprobó 18 grupos de nombres chinos recomendados para palabras extranjeras, en su decimosexta edición. Estos nombres se refieren principalmente al campo de la inteligencia artificial y la tecnología de la información. Esta medida tiene como objetivo estandarizar los nuevos términos que aparecen con frecuencia en el campo de la IA, proporcionando al público explicaciones oficiales claras para eliminar confusiones.

Dec 11, 2024

2.2k

Lanzamiento del modelo de lenguaje Teuken-7B: Superando el dominio del inglés, admite 24 idiomas oficiales de la UE

Teuken-7B, un modelo de lenguaje con 7 mil millones de parámetros, ya está disponible en Hugging Face y admite los 24 idiomas oficiales de la Unión Europea. Desarrollado por el proyecto de investigación OpenGPT-X de la UE, el modelo está disponible como un proyecto de código abierto para su uso. A diferencia de la mayoría de los modelos de lenguaje de IA centrados en el inglés, Teuken-7B se construyó desde cero, y aproximadamente la mitad de los datos de entrenamiento provienen de idiomas europeos que no son el inglés. Nota sobre la imagen: Imagen generada por IA, imagen cedida.

Nov 29, 2024

1.5k

¡Un padre crea un unicornio AI para ayudar a su hija a aprender inglés! Buddy.ai obtiene 11 millones de dólares en financiación

Después de un fracaso en el mercado de altavoces inteligentes, el emprendedor siberiano Ivan Crewkov descubrió inesperadamente el enorme potencial de la educación con IA a través de la experiencia de su hija aprendiendo inglés. Su empresa de educación con IA para niños, Buddy.ai, recientemente obtuvo 11 millones de dólares en una ronda semilla liderada por BITKRAFT Ventures. Su tecnología de IA y modelo de negocio, centrados en resolver los problemas del aprendizaje del inglés en niños, han recibido el reconocimiento del capital. El camino emprendedor de Crewkov es bastante dramático. 2014

Nov 1, 2024

2.6k

¡Revoluciona tu aprendizaje con IA! ¡Enjoy App convierte el aprendizaje del inglés en un juego!

En la era del rápido desarrollo de la IA, dominar nuevas habilidades se vuelve crucial. La idea de Li Xiaolai de "dedicar mil horas de atención para dominar cualquier habilidad que necesites" no solo redefine la esencia del aprendizaje, sino que también ilumina el camino para la superación personal. Basado en esta filosofía, su equipo creó Enjoy App, una aplicación multiplataforma diseñada para el aprendizaje de idiomas, que utiliza la tecnología de IA para ayudar a los usuarios a aprender inglés de manera eficiente. Sus funciones destacadas incluyen conversión de voz a texto, evaluación de pronunciación, asistente inteligente, etc., y la personalización hace que el aprendizaje sea...

Oct 12, 2024

8.9k