A SenseTime lançou oficialmente seu modelo de linguagem grande integrado "RiRiXin". Este modelo alcançou melhorias significativas na capacidade de processamento de informações multimodais e na capacidade de raciocínio profundo, obtendo o primeiro lugar em duas listas de classificação de avaliação de autoridade.
De acordo com o relatório de avaliação de benchmark de modelos de linguagem grandes chineses de 2024, publicado pela SuperCLUE, uma agência de avaliação autorizada na China, o modelo integrado "RiRiXin" da SenseTime ficou em primeiro lugar no país, com uma pontuação alta de 68,3, empatado com o DeepSeek V3. Além disso, em avaliações multimodais do OpenCompass, o modelo também ficou em primeiro lugar, com uma pontuação significativamente superior à do GPT-4o.
O modelo de linguagem grande integrado "RiRiXin" da SenseTime representa um avanço substancial no treinamento de modelos de modalidades integradas nativas. Isso significa que o modelo pode integrar informações de vários tipos, como texto, imagem e vídeo, abrindo novas perspectivas para o setor. Na avaliação da SuperCLUE, o modelo apresentou excelente desempenho em humanidades e ciências, obtendo o primeiro lugar mundial em humanidades com 81,8 pontos e uma medalha de ouro em ciências, com uma pontuação de 78,2 pontos em cálculo, a melhor da China.
O modelo de linguagem grande integrado "RiRiXin" se destaca por sua capacidade de processar simultaneamente várias informações complexas. Não apenas reconhece textos ambíguos, mas também analisa rapidamente gráficos de dados e fornece suporte de raciocínio aprofundado. Em cenários de aplicação reais, este modelo demonstrou vantagens únicas, especialmente em áreas como direção autônoma, interação por vídeo, educação corporativa, finanças e manufatura industrial.
Durante o desenvolvimento do produto, a SenseTime utilizou uma grande quantidade de dados interpolados de texto e imagem, construindo pontes de interação entre as modalidades por meio de tecnologias de síntese avançadas, melhorando a capacidade do modelo de compreender informações multimodais. Além disso, a SenseTime construiu tarefas multimodais abrangentes, fornecendo uma base sólida para o treinamento do modelo de linguagem grande integrado "RiRiXin". Por meio deste método de treinamento inovador, o modelo de modalidades integradas da SenseTime pode responder eficazmente às necessidades dos usuários em vários cenários de negócios, realizando um ciclo virtuoso de implementação de aplicativos e iteração de modelos básicos.
Destaques:
🌟 A SenseTime lançou o modelo de linguagem grande integrado "RiRiXin", com desempenho excepcional.
📊 O modelo apresentou excelente desempenho em humanidades e ciências, obtendo o primeiro lugar mundial em humanidades e o primeiro lugar na China em ciências.
🚀 O modelo é aplicável a várias áreas, como direção autônoma, finanças e educação online, demonstrando uma poderosa capacidade de processamento multimodal.