SWE-Lancer

SWE-Lancer est un benchmark contenant plus de 1400 tâches d'ingénierie logicielle open source, pour une valeur totale d'un million de dollars.

Sélection InternationaleProgrammationIABenchmark
SWE-Lancer est un benchmark lancé par OpenAI, conçu pour évaluer les performances des modèles linguistiques de pointe sur des tâches d'ingénierie logicielle open source réelles. Ce benchmark couvre un large éventail de tâches d'ingénierie indépendantes, allant de la correction de bogues à 50$ à la mise en œuvre de fonctionnalités à 32 000$, ainsi que des tâches de gestion telles que la sélection de solutions techniques. En associant les performances du modèle à une valeur monétaire, SWE-Lancer offre une nouvelle perspective sur l'impact économique du développement de modèles d'IA et stimule la recherche dans ce domaine.
Ouvrir le site Web

SWE-Lancer Dernière situation du trafic

Nombre total de visites mensuelles

505000892

Taux de rebond

59.23%

Nombre moyen de pages par visite

2.2

Durée moyenne de la visite

00:01:47

SWE-Lancer Tendance des visites

SWE-Lancer Distribution géographique des visites

SWE-Lancer Sources de trafic

SWE-Lancer Alternatives