SWE-Lancer

SWE-Lancer é um benchmark contendo mais de 1400 tarefas de engenharia de software freelance, com um valor total de US$ 1 milhão.

Seleção InternacionalProgramaçãoIABenchmark
SWE-Lancer é um benchmark lançado pela OpenAI, projetado para avaliar o desempenho de modelos de linguagem de ponta em tarefas de engenharia de software freelance do mundo real. O benchmark abrange uma variedade de tarefas de engenharia independentes, desde correções de bugs de US$ 50 até implementações de recursos de US$ 32.000, além de tarefas de gerenciamento, como a seleção entre soluções de implementação técnica. Ao mapear o desempenho do modelo para o valor monetário, o SWE-Lancer oferece uma nova perspectiva para a pesquisa sobre o impacto econômico do desenvolvimento de modelos de IA e impulsiona o desenvolvimento de pesquisas relacionadas.
Abrir Site

SWE-Lancer Situação do Tráfego Mais Recente

Total de Visitas Mensais

505000892

Taxa de Rejeição

59.23%

Média de Páginas por Visita

2.2

Duração Média da Visita

00:01:47

SWE-Lancer Tendência de Visitas

SWE-Lancer Distribuição Geográfica das Visitas

SWE-Lancer Fontes de Tráfego

SWE-Lancer Alternativas