La Universidad Nacional de Singapur lanza el modelo de lenguaje multimodal de código abierto NExT-GPT para impulsar las aplicaciones de IA multimedia

站长之家

Publicado elNoticias de IA · 2 minutos de lectura · Nov 29, 2023

NExT-GPT: Un Modelo de Lenguaje Multimodal

La Universidad Nacional de Singapur ha lanzado NExT-GPT, un modelo de lenguaje multimodal que admite el procesamiento de texto, imágenes, videos y audio, impulsando el desarrollo de aplicaciones de inteligencia artificial multimedia. El modelo emplea una arquitectura de tres capas, utilizando la tecnología MosIT para el entrenamiento de la capa intermedia. Su contribución de código abierto ofrece a investigadores y desarrolladores la oportunidad de integrar múltiples entradas modales.

La singularidad de NExT-GPT radica en su capacidad para generar etiquetas de señalización modal, lo que abre perspectivas de aplicación en áreas como la generación de contenido y el análisis multimedia.

Aumento explosivo de la eficiencia de los modelos grandes: se publica el código abierto de la tecnología COMET de ByteDance, con una aceleración de 1,7 veces

El equipo de modelos Doubao de ByteDance anunció recientemente que ha superado con éxito los cuellos de botella clave de la arquitectura de modelos de expertos mixtos (MoE) y ha publicado una importante tecnología de optimización llamada COMET. Esta tecnología mejora significativamente la eficiencia del entrenamiento de los modelos grandes, logrando una mejora de hasta 1,7 veces y reduciendo en un 40% los costes de entrenamiento. Nota sobre la imagen: Imagen generada por IA, proveedor de servicios de licencias de imágenes Midjourney. Según la información facilitada, la tecnología COMET ya se ha aplicado en el entrenamiento de clústeres de miles de tarjetas gráficas de ByteDance, lo que ha supuesto un ahorro de millones de GP.

¿Navegador con IA integrada? La herramienta de código abierto Browser Use revoluciona el mundo de la tecnología ¡Los desarrolladores la llaman la mejor!

Recientemente, el mundo de la tecnología y la comunidad de desarrolladores han sido inundados por un proyecto de código abierto llamado Browser Use. Esta herramienta es como si le hubiéramos dado alas a la IA, permitiéndole controlar un navegador con la misma soltura que un humano. Con lenguaje natural, se puede dirigir a la IA para que complete automáticamente diversas tareas web. Su potente capacidad de automatización y su flexible sistema de implementación han encendido la pasión de los amantes de la tecnología de todo el mundo, generando una gran ola en la plataforma X (antes Twitter). Browser Use se está expandiendo rápidamente, impulsando el avance de la IA en el campo de la automatización de navegadores.

Huawei Ascend y Step-Video lanzan un modelo multimodal de código abierto para incursionar en nuevas áreas de la IA

Recientemente, la comunidad Modelers lanzó oficialmente Step-Video y Step-Audio, dos modelos multimodales de código abierto desarrollados por Step-Video. Estos dos modelos se utilizan para la generación de video e interacción de voz, con el objetivo de proporcionar herramientas de IA más potentes para desarrolladores y empresas. El nombre completo del modelo Step-Video es Step-Video-T2V, un modelo de generación de video de código abierto, el más grande del mundo, con una capacidad de 30 mil millones de parámetros. Este modelo puede generar directamente videos de 20 segundos...

El Departamento de Justicia de EE. UU. exige a Google que venda Chrome y relaje las restricciones a las inversiones en IA

Según documentos judiciales recientes del Departamento de Justicia de EE. UU., se sigue exigiendo a Google que venda su navegador web Chrome. Esta propuesta, inicialmente planteada por el entonces presidente Biden el año pasado, se mantiene bajo la segunda administración de Trump. Sin embargo, el Departamento de Justicia ya no exige que Google se deshaga de todas sus inversiones en inteligencia artificial, incluyendo los miles de millones de dólares invertidos en Anthropic. En los documentos judiciales, el Departamento de Justicia afirma que las prácticas ilegales de Google han creado un gigante económico que ha tenido un impacto severo en el mercado, asegurando que Google, pase lo que pase...