Recentemente, o campo da inteligência artificial testemunhou um grande avanço. A empresa de IA Deepseek lançou o modelo Coder v2, que apresentou desempenho excepcional em vários testes, superando o modelo Gemini do Google e tornando-se o novo líder em inteligência artificial de código aberto. De acordo com a Livebench AI (plataforma de benchmark reconhecidamente difícil de manipular), o modelo Deepseek Coder v2 ficou em segundo lugar apenas após os modelos comerciais da OpenAI e Anthropic, ocupando a terceira posição entre os modelos de código aberto. Essa conquista marca a rápida aproximação da tecnologia de inteligência artificial de código aberto em relação às grandes empresas comerciais.
O Deepseek Coder v2 demonstrou desempenho particularmente excelente em programação e raciocínio. Vale destacar que seu desempenho em matemática superou até mesmo todas as variantes do GPT-4. Embora apresente desempenho ligeiramente inferior em habilidades linguísticas, seu excelente desempenho em outras áreas compensa essa deficiência.
Ao mesmo tempo, o mais recente modelo de linguagem grande (LLM) Gemini do Google, embora tenha apresentado bom desempenho em rankings de avaliação humana, é considerado não ser um modelo verdadeiramente excelente. Em comparação, o Deepseek Coder v2 apresenta desempenho superior em casos de uso de produção real.
Especialistas da indústria preveem que, se a OpenAI e a Anthropic mudarem seu foco para recursos auxiliares em vez de tecnologia de IA central, os modelos de código aberto podem alcançar a liderança até o final do ano. Essa tendência indica que a inteligência artificial de código aberto está rapidamente reduzindo a diferença em relação às grandes empresas comerciais, com um enorme potencial de desenvolvimento futuro.
A ascensão do Deepseek Coder v2 não apenas demonstra a capacidade de inovação da comunidade de código aberto, mas também injeta nova vitalidade na democratização e diversificação do desenvolvimento da inteligência artificial. Com o avanço contínuo da tecnologia, temos motivos para esperar o surgimento de mais modelos de IA de código aberto inovadores, impulsionando o desenvolvimento de todo o setor.