Laboratorio de IA de Shanghai lanza el conjunto de datos de entrenamiento de pre-entrenamiento multi-modal 'Shusheng

Laboratorio de IA de Shanghai lanza el conjunto de datos de entrenamiento de pre-entrenamiento multi-modal 'Shusheng · Wànjuǎn' 1.0 de código abierto

站长之家

Publicado elNoticias de IA · 1 minutos de lectura · Aug 15, 2023

El laboratorio de IA de Shanghai y la Liga de Datos de Corpus han publicado el corpus de entrenamiento multimodal "Shusheng · Wanjuan" 1.0, que incluye conjuntos de datos de texto, texto e imagen, y vídeo. Este corpus de código abierto tiene un tamaño total de más de 2 TB, ha sido cuidadosamente limpiado y depurado, y se caracteriza por su fusión multidimensional, procesamiento preciso y alta eficiencia.

La publicación de este corpus ayudará a impulsar la aplicación e innovación de los grandes modelos, reduciendo el umbral de acceso a esta tecnología.

¡Llega el OpenAI Operator de código abierto! El superhéroe de automatización de IA gratuita de Nanobrowser

¿Te duele el bolsillo con las tarifas de suscripción de OpenAI Operator, que pueden llegar a cientos de dólares al mes? Nanobrowser es la solución. Es una herramienta de código abierto completamente gratuita, sin necesidad de suscripciones, que te libera de las limitaciones económicas. Solo tienes que instalar esta extensión y configurar tu propia clave API de LLM para disfrutar al instante de las funciones de automatización web de primera categoría. Este método "con tu propio sustento" no solo es económico, sino que también te permite controlar tus costes, para que tengas el control total de tu IA.

Alibaba Tongyi anuncia la publicación de código abierto del modelo R1-Omni para mejorar el reconocimiento de emociones multimodales

El 11 de marzo, el equipo del laboratorio Tongyi anunció la publicación de código abierto del modelo R1-Omni, un avance significativo en el desarrollo de modelos multimodales. Este modelo combina el aprendizaje por refuerzo con el método de recompensa verificable (RLVR), centrándose en mejorar la capacidad de razonamiento y el rendimiento de generalización en tareas de reconocimiento de emociones multimodales. El entrenamiento de R1-Omni se divide en dos fases. En la fase de arranque en frío, el equipo utilizó un conjunto de datos combinado que contiene 580 videos de Explainable Multimodal Emotio para el ajuste fino.

Noticias de IA

Laboratorio de IA de Shanghai lanza el conjunto de datos de entrenamiento de pre-entrenamiento multi-modal 'Shusheng · Wànjuǎn' 1.0 de código abierto

站长之家

Noticias de IA relacionadas recomendadas

Reka AI lanza el nuevo modelo de código abierto Reka Flash 3: un modelo de inferencia general de 2100 millones de parámetros

El equipo de Alibaba Tongyi lanza código abierto de R1-Omni: un modelo multimodal que permite la transparencia de la información de audio y video

¡Llega el OpenAI Operator de código abierto! El superhéroe de automatización de IA gratuita de Nanobrowser

Alibaba Tongyi anuncia la publicación de código abierto del modelo R1-Omni para mejorar el reconocimiento de emociones multimodales