SenseTime lança o modelo de linguagem grande 'Rixin', comparável ao DeepSeek V3

AIbase基地

Publicado emNotícias e Informações de IA · 5 minutos de leitura · Jan 10, 2025

584

A SenseTime lançou oficialmente seu modelo de linguagem grande integrado "RiRiXin". Este modelo alcançou melhorias significativas na capacidade de processamento de informações multimodais e na capacidade de raciocínio profundo, obtendo o primeiro lugar em duas listas de classificação de avaliação de autoridade.

De acordo com o relatório de avaliação de benchmark de modelos de linguagem grandes chineses de 2024, publicado pela SuperCLUE, uma agência de avaliação autorizada na China, o modelo integrado "RiRiXin" da SenseTime ficou em primeiro lugar no país, com uma pontuação alta de 68,3, empatado com o DeepSeek V3. Além disso, em avaliações multimodais do OpenCompass, o modelo também ficou em primeiro lugar, com uma pontuação significativamente superior à do GPT-4o.

O modelo de linguagem grande integrado "RiRiXin" da SenseTime representa um avanço substancial no treinamento de modelos de modalidades integradas nativas. Isso significa que o modelo pode integrar informações de vários tipos, como texto, imagem e vídeo, abrindo novas perspectivas para o setor. Na avaliação da SuperCLUE, o modelo apresentou excelente desempenho em humanidades e ciências, obtendo o primeiro lugar mundial em humanidades com 81,8 pontos e uma medalha de ouro em ciências, com uma pontuação de 78,2 pontos em cálculo, a melhor da China.

O modelo de linguagem grande integrado "RiRiXin" se destaca por sua capacidade de processar simultaneamente várias informações complexas. Não apenas reconhece textos ambíguos, mas também analisa rapidamente gráficos de dados e fornece suporte de raciocínio aprofundado. Em cenários de aplicação reais, este modelo demonstrou vantagens únicas, especialmente em áreas como direção autônoma, interação por vídeo, educação corporativa, finanças e manufatura industrial.

Durante o desenvolvimento do produto, a SenseTime utilizou uma grande quantidade de dados interpolados de texto e imagem, construindo pontes de interação entre as modalidades por meio de tecnologias de síntese avançadas, melhorando a capacidade do modelo de compreender informações multimodais. Além disso, a SenseTime construiu tarefas multimodais abrangentes, fornecendo uma base sólida para o treinamento do modelo de linguagem grande integrado "RiRiXin". Por meio deste método de treinamento inovador, o modelo de modalidades integradas da SenseTime pode responder eficazmente às necessidades dos usuários em vários cenários de negócios, realizando um ciclo virtuoso de implementação de aplicativos e iteração de modelos básicos.

Destaques:
🌟 A SenseTime lançou o modelo de linguagem grande integrado "RiRiXin", com desempenho excepcional.
📊 O modelo apresentou excelente desempenho em humanidades e ciências, obtendo o primeiro lugar mundial em humanidades e o primeiro lugar na China em ciências.
🚀 O modelo é aplicável a várias áreas, como direção autônoma, finanças e educação online, demonstrando uma poderosa capacidade de processamento multimodal.

iFlytek anuncia atualização completa do modelo de raciocínio profundo StarFire X1

A iFlytek anunciou uma atualização completa para seu modelo de raciocínio profundo, o StarFire X1. Esta atualização visa melhorar suas capacidades de aplicação em várias áreas, como matemática, medicina e educação, trazendo uma série de destaques e inovações. A capacidade matemática do StarFire X1 foi significativamente aprimorada, especialmente no que diz respeito ao tratamento de problemas de nível de competição. Em comparação com outros modelos do setor, o StarFire X1, mesmo com uma quantidade menor de parâmetros de modelo, ainda se compara aos modelos DeepSeek R1 e OpenAI em tarefas matemáticas. Os usuários podem acessar o StarFire da iFlytek através de...

O vivo “Blue Heart Little V” lança nova versão, integrando a capacidade do modelo DeepSeek e ativando o raciocínio profundo inteligente

Recentemente, a vivo anunciou uma atualização cinza da versão 5.2.1.22 de seu assistente de voz “Blue Heart Little V”, aguardada pelos usuários. Essa atualização adiciona suporte à capacidade do modelo DeepSeek. Com essa adição, o “Little V” poderá fornecer uma capacidade de raciocínio profundo mais inteligente, ajudando os usuários a processar informações de forma mais eficiente. De acordo com o feedback do usuário, após ativar a função de raciocínio profundo (R1), o “Blue Heart Little V” pode realizar um raciocínio mais completo e aprofundado com base nas instruções de entrada do usuário.

xAI de Musk lança oficialmente o modelo de raciocínio profundo Grok 3, com encadeamento de pensamento, e planeja integrá-lo a foguetes SpaceX nos próximos dois anos

Hoje, a xAI, liderada por Elon Musk, lançou oficialmente seu mais novo modelo, o Grok3, que Musk descreve como a IA "mais inteligente do planeta". Ele competirá com modelos como ChatGPT, Gemini, DeepSeek e Claude. Durante o lançamento, a xAI apresentou diversos testes de referência, nos quais o Grok3 superou o Gemini2Pro, Claude3.5Sonnet, GPT4o e Dee em testes de matemática, ciência e codificação.

Notícias e Informações de IA

SenseTime lança o modelo de linguagem grande 'Rixin', comparável ao DeepSeek V3

AIbase基地

Notícias de IA Relacionadas Recomendadas

iFlytek anuncia atualização completa do modelo de raciocínio profundo StarFire X1

Modelo de IA Wenxin 4.5 da Baidu será lançado em 16 de março com capacidades multimodais nativas e raciocínio profundo

O vivo “Blue Heart Little V” lança nova versão, integrando a capacidade do modelo DeepSeek e ativando o raciocínio profundo inteligente

xAI de Musk lança oficialmente o modelo de raciocínio profundo Grok 3, com encadeamento de pensamento, e planeja integrá-lo a foguetes SpaceX nos próximos dois anos