A Microsoft lançou oficialmente em seu site o código aberto de uma versão modificada do DeepSeek-R1 — o MAI-DS-R1. Este novo modelo, além de manter o desempenho de inferência original, recebeu aprimoramentos significativos, especialmente na capacidade de resposta a tópicos sensíveis, obtendo um avanço considerável.

QQ_1744964448252.png

A capacidade de resposta do MAI-DS-R1 atingiu 99,3%, mais do que o dobro da versão original R1. Esse progresso oferecerá grande suporte para pesquisas em ciências políticas, questões sociais e ética. Apesar de responder a mais tópicos sensíveis, o MAI-DS-R1 reduziu em 50% o conteúdo prejudicial em termos de riscos de segurança, demonstrando um bom controle de segurança. Portanto, usuários que desejam experimentar uma versão mais "livre" podem testar este modelo e explorar novas possibilidades.

QQ_1744964462119.png

Durante o treinamento do modelo, a Microsoft coletou cerca de 350.000 exemplos de tópicos bloqueados e selecionou palavras-chave relevantes. Essas palavras-chave foram transformadas em várias perguntas e traduzidas para diferentes idiomas, melhorando ainda mais a adaptabilidade multilíngue do modelo. Além disso, a Microsoft utilizou o DeepSeek R1 e modelos internos para gerar respostas e cadeias de raciocínio para as perguntas relevantes. Os dados de treinamento também incluíram 110.000 exemplos de segurança e violações do conjunto de dados Tulu3SFT, garantindo a eficácia do modelo em várias situações.

Após uma avaliação completa, o MAI-DS-R1 apresentou um desempenho excepcional na capacidade de resposta a tópicos sensíveis, superando em muito o DeepSeek R1 e suas versões derivadas. Na avaliação de segurança, o MAI-DS-R1 teve um bom desempenho no teste HarmBench, mostrando capacidade de reduzir eficazmente o conteúdo prejudicial, garantindo um bom equilíbrio entre segurança e capacidade de resposta.

Em termos de capacidade de inferência, o MAI-DS-R1 mantém a consistência com o DeepSeek R1, apresentando desempenho excelente em testes de referência de conhecimento geral, raciocínio, matemática e programação. Simultaneamente, o modelo é mais cauteloso ao lidar com solicitações ilegais ou imorais, recusando-se a gerar qualquer conteúdo prejudicial ou inadequado.

Além disso, no treinamento subsequente, o MAI-DS-R1 teve as perguntas traduzidas para vários idiomas, permitindo que atenda melhor às necessidades de cenários multilíngues de organizações internacionais, empresas multinacionais e instituições de ensino. A Microsoft já disponibilizou o código aberto do modelo no huggingface e o lançou no Azure AI Foundry, oferecendo mais opções aos usuários.

huggingface:https://huggingface.co/microsoft/MAI-DS-R1

Azure address:https://ai.azure.com/explore/models/MAI-DS-R1/version/1/registry/azureml

Destaques:

🌟 A capacidade de resposta do MAI-DS-R1 a tópicos sensíveis foi aprimorada para 99,3%, mais do que o dobro da versão original R1.

🔒 Os riscos de segurança foram reduzidos significativamente, com uma diminuição de 50% no conteúdo prejudicial, garantindo a segurança do uso.

🌍 Forte capacidade de suporte multilíngue, mais adequado às necessidades de organizações internacionais e empresas multinacionais.