Página de búsqueda de noticias y productos de IA

Tipo :

Información de Noticias
Aplicaciones de Productos
Casos de Monetización
Tutoriales de IA

2025-03-13 14:13:03.AIbase

Luma mejora la eficiencia de muestreo de su técnica de preentrenamiento de modelos de imagen IMM en 10 veces

La startup de inteligencia artificial Luma anunció recientemente en la plataforma X el lanzamiento de código abierto de su técnica de preentrenamiento de modelos de imagen llamada Inductive Moment Matching (IMM). Esta innovadora tecnología ha generado un gran interés por su eficiencia y estabilidad, y se considera un avance significativo en el campo de la IA generativa. Según el usuario de X linqi_zhou, IMM es un nuevo paradigma generativo capaz de entrenar de forma estable modelos únicos con un solo objetivo desde cero, superando a la vez la eficiencia de muestreo y la calidad de las muestras.

2025-03-13 11:43:55.AIbase

LuChen Technology lanza el nuevo modelo de video de código abierto Open-Sora 2.0 con proceso de entrenamiento completamente de código abierto

2025-03-12 15:16:41.AIbase

Luma AI acelera la generación de imágenes diez veces con su tecnología de preentrenamiento IMM de código abierto

¿Alguna vez has sentido que los modelos de imágenes entrenados con grandes cantidades de datos son terriblemente lentos al generar imágenes de alta calidad? No te preocupes, Luma AI recientemente ha lanzado una tecnología de preentrenamiento de modelos de imágenes llamada Inductive Moment Matching (IMM), ¡que supuestamente permite a los modelos generar imágenes de alta calidad con una velocidad increíblemente rápida! ¿Estancamiento de algoritmos? ¡Luma AI rompe el techo! En los últimos años, la comunidad de IA ha experimentado...

2025-03-12 10:23:07.AIbase

Meta empieza a probar un chip propio para entrenar IA, reduciendo la dependencia de Nvidia

Meta está probando un chip de su propia fabricación para entrenar sistemas de IA. Esta iniciativa forma parte de la estrategia de Meta para reducir su dependencia de fabricantes de hardware como Nvidia. Según Reuters, el chip, fabricado en colaboración con Taiwan Semiconductor Manufacturing Company (TSMC), está diseñado específicamente para cargas de trabajo de IA. Actualmente, Meta está realizando pruebas a pequeña escala y planea ampliar la producción si las pruebas tienen éxito. Nota de la imagen

2025-03-12 09:11:37.AIbase

Meta prueba un chip de IA de entrenamiento interno para reducir la dependencia de Nvidia

2025-03-07 16:19:22.AIbase

¡Sin entrenamiento! Q-Filters permite una compresión eficiente de la caché KV y mejora el rendimiento de la inferencia

2025-03-05 09:13:04.AIbase

Vivo reorganiza y crea nuevo departamento de IA, trasladando el entrenamiento de modelos grandes al lado del cliente

2025-02-27 10:45:10.AIbase

DeepSeek lanza la actualización de estrategia paralela en su cuarto día de código abierto: DualPipe y EPLB impulsan la revolución del entrenamiento de modelos grandes

2025-02-26 10:21:59.AIbase

Anthropic afirma que el entrenamiento del soneto Claude 3.7 costó decenas de millones de dólares, mucho menos que algunos competidores

2025-02-26 09:33:45.AIbase

DeepSeek Semana Abierta de código abierto, Día 3: Lanzamiento de DeepGEMM, biblioteca FP8 GEMM para entrenamiento e inferencia de IA

2025-02-25 09:13:07.AIbase

1000 artistas lanzan un álbum 'silencioso' para protestar contra la venta de derechos de autor a la IA por parte del Reino Unido

Más de 1000 artistas han publicado un álbum en blanco como protesta contra la decisión del gobierno británico de permitir la venta de derechos de autor musicales a empresas de inteligencia artificial.

2025-02-24 09:39:37.AIbase

OctoTools: El nuevo marco de IA de Stanford permite una inferencia compleja y eficiente sin necesidad de entrenamiento

En el campo de la Inteligencia Artificial (IA), aunque los Modelos de Lenguaje Grandes (LLM) destacan en el procesamiento del lenguaje natural, a menudo se quedan cortos cuando se enfrentan a tareas de razonamiento complejas. Estas tareas suelen requerir razonamiento de varios pasos, conocimiento específico del dominio o la integración efectiva de herramientas externas. Para superar estas limitaciones, los investigadores han estado explorando cómo mejorar las capacidades de los LLM mediante el uso de herramientas externas. Los métodos de mejora tradicionales suelen requerir el ajuste fino o entrenamiento adicional del modelo, lo que limita su adaptabilidad y flexibilidad a las tareas.

2025-02-24 09:25:15.AIbase

Moonlight y UCLA presentan un nuevo modelo Mixture-of-Expert para mejorar la eficiencia del entrenamiento de modelos de lenguaje

En el campo de la inteligencia artificial, el entrenamiento de modelos de lenguaje grandes (LLM) se ha convertido en un motor clave del progreso tecnológico. Sin embargo, a medida que aumentan el tamaño de los modelos y los conjuntos de datos, los métodos de optimización tradicionales, especialmente AdamW, muestran sus limitaciones. Los investigadores se enfrentan a una serie de desafíos, como altos costes computacionales, inestabilidad en el entrenamiento, incluyendo la desaparición o explosión de gradientes, actualizaciones inconsistentes de la matriz de parámetros y altas demandas de recursos en entornos distribuidos. Por lo tanto, se necesitan urgentemente técnicas de optimización más eficientes y estables para abordar estas complejidades. Para...

2025-02-19 08:33:46.AIbase

DeepSeek presenta la tecnología NSA: Acelera el entrenamiento y la inferencia de contextos largos

En el campo de la inteligencia artificial, el equipo de DeepSeek ha publicado recientemente sus últimos resultados de investigación, presentando un innovador mecanismo de atención dispersa llamado NSA (Native Sparse Attention). El objetivo principal de esta tecnología es mejorar la velocidad del entrenamiento y la inferencia de contextos largos, especialmente optimizada para el hardware moderno, lo que permite una mejora significativa en la eficiencia del entrenamiento y la inferencia. La introducción de la tecnología NSA ha supuesto un cambio notable en el entrenamiento de los modelos de inteligencia artificial. En primer lugar, mediante una serie de mejoras dirigidas al hardware informático moderno

2025-02-18 16:21:37.AIbase

Musk revela el costo de entrenamiento de Grok 3: 200,000 GPU de Nvidia

Recientemente, Musk presentó en una transmisión en vivo el nuevo chatbot Grok 3, y reveló el sorprendente costo de entrenamiento del modelo. Grok 3 ya está disponible para suscriptores Premium +, y ha demostrado un rendimiento excepcional en varias pruebas, incluso superando a competidores como Gemini, DeepSeek y ChatGPT. Musk mencionó en la transmisión que el entrenamiento de Grok 3 consumió un asombroso total de 200,000 GPU de Nvidia. Esto sorprendió a muchos, especialmente considerando...

2025-02-17 10:22:56.AIbase

Light-A-Video: Reiluminación de vídeo sin necesidad de entrenamiento

Recientemente, los avances en la tecnología de reiluminación de imágenes se han beneficiado de conjuntos de datos a gran escala y modelos de difusión preentrenados, haciendo que la aplicación de iluminación consistente sea más común. Sin embargo, en el campo de la reiluminación de vídeo, el progreso ha sido relativamente lento debido a los altos costes de entrenamiento y a la falta de conjuntos de datos de reiluminación de vídeo diversos y de alta calidad. La simple aplicación de modelos de reiluminación de imágenes fotograma a fotograma a los vídeos puede provocar varios problemas, como inconsistencias en las fuentes de luz y en la apariencia de la reiluminación, lo que finalmente resulta en un vídeo generado con parpadeos. Para solucionar este problema, el equipo de investigación propuso Light-A

2025-02-17 10:05:18.AIbase

Meta innova con el marco "mezcla de conceptos continuos", impulsando una nueva revolución en el preentrenamiento de transformadores

En los últimos años, el campo del procesamiento del lenguaje natural ha experimentado una transformación sin precedentes gracias al rápido desarrollo de los modelos de lenguaje grandes (LLM). Estas tecnologías se utilizan ahora ampliamente en asistentes de código, motores de búsqueda y asistentes personales de IA, mostrando una gran capacidad. Sin embargo, el paradigma tradicional de "predicción del siguiente token" tiene ciertas limitaciones, especialmente en el manejo de razonamientos complejos y tareas a largo plazo, donde los modelos requieren un entrenamiento extenso para dominar la comprensión conceptual profunda. Para abordar este problema, investigadores de Meta y otras instituciones han propuesto...

2025-02-12 08:43:18.AIbase

Li Yanhong sobre el entrenamiento de la próxima generación de grandes modelos: el enfoque actual debe estar en el progreso tecnológico y la reducción de costos

El 11 de febrero de 2025, en la Cumbre Mundial de Gobiernos celebrada en Dubái, Emiratos Árabes Unidos, el fundador de Baidu, Li Yanhong, mantuvo una conversación profunda con el Ministro de IA de los Emiratos Árabes Unidos, Omar Sultan Al Olama, para debatir las futuras tendencias del desarrollo de la infraestructura de IA. Durante la conversación, Al Olama mencionó el reciente interés mundial generado por DeepSeek, que provocó fuertes fluctuaciones en el precio de las acciones de varias empresas de chips y bolsas importantes, y preguntó a Li Yanhong sobre su opinión sobre el futuro de los centros de datos y la infraestructura de IA.

2025-02-10 11:04:17.AIbase

Meta AI presenta MILS: un sistema que permite a los LLMs procesar datos multimedia sin entrenamiento específico

Investigadores de Meta AI, junto con colaboradores académicos, han desarrollado MILS (Resolvedor Iterativo Multimodal de LLM), un sistema innovador que permite a los modelos de lenguaje grandes procesar imágenes, videos y audio sin necesidad de entrenamiento específico. MILS aprovecha la capacidad natural de resolución de problemas de los modelos de lenguaje, en lugar de depender de un entrenamiento con grandes cantidades de datos, lo que demuestra una ventaja única. MILS funciona emparejando dos modelos de IA para resolver tareas: un 'generador', que propone soluciones a la tarea, y un 'evaluador', que...

2025-02-10 10:31:26.AIbase

Tencent solicita patente para un "método de entrenamiento de modelos de lenguaje extenso", mejorando la capacidad de generalización y la precisión del modelo

La aplicación Tianyancha muestra que Tencent Technology (Shenzhen) Co., Ltd. solicitó recientemente una patente denominada "Método de entrenamiento de modelos de lenguaje extenso, dispositivo, equipo informático y medio de almacenamiento". El resumen de esta patente revela que el método proporciona más información aprendible para el modelo durante el entrenamiento introduciendo un primer texto de resumen y un segundo texto de resumen. Según la descripción de la patente, la cantidad de información contenida en el primer y segundo texto de resumen es diferente, y el primer texto de resumen también incluye oraciones correctas e incorrectas. Mediante el uso de estos dos textos para el mismo texto

Busca la dinámica global de productos de IA

Busca información global de IA y descubre nuevas oportunidades de IA

Luma mejora la eficiencia de muestreo de su técnica de preentrenamiento de modelos de imagen IMM en 10 veces

LuChen Technology lanza el nuevo modelo de video de código abierto Open-Sora 2.0 con proceso de entrenamiento completamente de código abierto

Luma AI acelera la generación de imágenes diez veces con su tecnología de preentrenamiento IMM de código abierto

Meta empieza a probar un chip propio para entrenar IA, reduciendo la dependencia de Nvidia

Meta prueba un chip de IA de entrenamiento interno para reducir la dependencia de Nvidia

¡Sin entrenamiento! Q-Filters permite una compresión eficiente de la caché KV y mejora el rendimiento de la inferencia

Vivo reorganiza y crea nuevo departamento de IA, trasladando el entrenamiento de modelos grandes al lado del cliente

DeepSeek lanza la actualización de estrategia paralela en su cuarto día de código abierto: DualPipe y EPLB impulsan la revolución del entrenamiento de modelos grandes

Anthropic afirma que el entrenamiento del soneto Claude 3.7 costó decenas de millones de dólares, mucho menos que algunos competidores

DeepSeek Semana Abierta de código abierto, Día 3: Lanzamiento de DeepGEMM, biblioteca FP8 GEMM para entrenamiento e inferencia de IA

1000 artistas lanzan un álbum 'silencioso' para protestar contra la venta de derechos de autor a la IA por parte del Reino Unido

OctoTools: El nuevo marco de IA de Stanford permite una inferencia compleja y eficiente sin necesidad de entrenamiento

Moonlight y UCLA presentan un nuevo modelo Mixture-of-Expert para mejorar la eficiencia del entrenamiento de modelos de lenguaje

DeepSeek presenta la tecnología NSA: Acelera el entrenamiento y la inferencia de contextos largos

Musk revela el costo de entrenamiento de Grok 3: 200,000 GPU de Nvidia

Light-A-Video: Reiluminación de vídeo sin necesidad de entrenamiento

Meta innova con el marco "mezcla de conceptos continuos", impulsando una nueva revolución en el preentrenamiento de transformadores

Li Yanhong sobre el entrenamiento de la próxima generación de grandes modelos: el enfoque actual debe estar en el progreso tecnológico y la reducción de costos

Meta AI presenta MILS: un sistema que permite a los LLMs procesar datos multimedia sin entrenamiento específico

Tencent solicita patente para un "método de entrenamiento de modelos de lenguaje extenso", mejorando la capacidad de generalización y la precisión del modelo