Laboratório de IA de Xangai lança o conjunto de dados de pré-treinamento multimodal "Shusheng

Laboratório de IA de Xangai lança o conjunto de dados de pré-treinamento multimodal "Shusheng · Wànjuǎn" 1.0 de código aberto

站长之家

Publicado emNotícias e Informações de IA · 1 minutos de leitura · Aug 15, 2023

O laboratório de IA de Xangai e a Liga de Dados de Corpus lançaram o corpus de pré-treinamento multimodal "Shusheng · Wanjuan" 1.0, que inclui conjuntos de dados de texto, texto e imagem e vídeo. Este corpus de código aberto tem um tamanho total superior a 2 TB, foi cuidadosamente limpo e desduplicado, e apresenta as características de fusão diversificada, processamento refinado e alta eficiência. O lançamento deste corpus ajudará a impulsionar a aplicação e a inovação de grandes modelos, reduzindo a barreira de entrada para a tecnologia de grandes modelos.

Chegou o OpenAI Operator de código aberto! O super-herói de automação de IA gratuito do navegador Nanobrowser

Está cansado de pagar centenas de dólares por mês em assinaturas do OpenAI Operator? O Nanobrowser é a solução. É uma ferramenta gratuita e de código aberto, sem custos de assinatura, que o liberta de quaisquer restrições financeiras. Basta instalar a extensão e configurar sua própria chave de API LLM para desfrutar imediatamente dos recursos de automação da web de primeira linha. Este método 'faça você mesmo' não é apenas econômico, mas também permite que você controle seus custos, dando-lhe o controle total da sua IA.

Alibaba Tongyi anuncia o lançamento de código aberto do modelo R1-Omni para aprimorar o reconhecimento de emoções multimodais

Em 11 de março, a equipe do laboratório Tongyi anunciou o lançamento de código aberto do modelo R1-Omni, representando um novo avanço no desenvolvimento de modelos multimodais. Este modelo combina aprendizado por reforço com o método de recompensa verificável (RLVR), focando em melhorar a capacidade de raciocínio e o desempenho de generalização em tarefas de reconhecimento de emoções multimodais. O treinamento do R1-Omni é dividido em duas fases. Na fase de inicialização a frio, a equipe utilizou um conjunto de dados combinado contendo 580 vídeos, provenientes do Explainable Multimodal Emotio...

Notícias e Informações de IA

Laboratório de IA de Xangai lança o conjunto de dados de pré-treinamento multimodal "Shusheng · Wànjuǎn" 1.0 de código aberto

站长之家

Notícias de IA Relacionadas Recomendadas

Reka AI lança novo modelo de código aberto Reka Flash 3: modelo de raciocínio universal com 2,1 bilhões de parâmetros

Equipe Alibaba Tongyi lança código aberto do R1-Omni: modelo multimodais que torna informações de áudio e vídeo transparentes

Chegou o OpenAI Operator de código aberto! O super-herói de automação de IA gratuito do navegador Nanobrowser

Alibaba Tongyi anuncia o lançamento de código aberto do modelo R1-Omni para aprimorar o reconhecimento de emoções multimodais