Dans le monde de la technologie, un débat animé fait rage autour de la revue de code. La perspective de passer 2 à 5 heures par semaine à examiner du code pourrait bientôt appartenir au passé, c'est l'objectif ambitieux de CodeRabbit.

La revue de code, cette étape à la fois appréciée et détestée des développeurs, est un élément essentiel pour améliorer la qualité du code. Cependant, elle est aussi connue pour être chronophage et énergivore. Selon les statistiques, la moitié des entreprises y consacrent 2 à 5 heures par semaine. Pire encore, un manque de personnel peut transformer la revue de code en un gouffre temporel et énergétique pour les développeurs.

Hacker, code, programmeur

Source : Image générée par IA, Midjourney.

C'est alors que Harjot Gill, co-fondateur et PDG de CodeRabbit, est entré en scène, affirmant que son entreprise peut automatiser considérablement le processus de revue de code grâce à l'intelligence artificielle. Gill n'est pas un novice : il a occupé le poste de directeur technique senior chez Nutanix, une société de logiciels pour centres de données, et a fondé Netsil, une startup acquise par Nutanix. Son co-fondateur, Gur Singh, est également un expert chevronné, ayant dirigé des équipes de développement chez Alegeus, une plateforme de paiement dans le secteur de la santé.

Gill affirme avec confiance que la plateforme CodeRabbit utilise un « raisonnement IA avancé » pour « comprendre l'intention du code » et fournir aux développeurs un feedback « actionnable » et « similaire à celui d'un humain ». Cela semble impressionnant ! Gill n'hésite pas à critiquer les méthodes traditionnelles : « Les outils d'analyse statique et les vérificateurs de code traditionnels sont basés sur des règles et génèrent souvent un taux élevé de faux positifs, tandis que la revue par les pairs est chronophage et subjective. En comparaison, CodeRabbit est une plateforme axée sur l'IA. »

Cependant, ces déclarations audacieuses, pleines de termes à la mode, suscitent des doutes quant à leur véracité. En effet, des preuves suggèrent que la revue de code pilotée par l'IA pourrait être moins fiable qu'une revue avec intervention humaine.

Greg Foster de Graphite a partagé dans un article de blog les résultats d'une expérience interne utilisant GPT-4 d'OpenAI pour la revue de code. Bien que le modèle d'IA ait pu détecter des éléments utiles, comme de petites erreurs logiques et des fautes d'orthographe, il a également généré un grand nombre de faux positifs. Foster indique que même après avoir essayé d'affiner le modèle, la réduction de ces faux positifs n'a pas été significative.

CodeRabbit réussira-t-il réellement à résoudre ces problèmes ? Ou s'agit-il d'un autre coup de marketing autour de l'IA ? Pour le moment, nous n'avons pas accès aux données de performance concrètes de CodeRabbit, et nous ne pouvons donc pas juger de son efficacité.

Quoi qu'il en soit, la tentative de CodeRabbit reflète la quête incessante d'efficacité dans le secteur technologique. Même si l'IA ne peut pas encore remplacer complètement la revue de code humaine, elle pourrait fournir une aide précieuse aux développeurs dans certains domaines.

À l'avenir, nous verrons probablement émerger davantage d'outils de revue de code assistés par l'IA. Ces outils pourraient aider les développeurs à identifier rapidement des erreurs courantes, leur permettant de consacrer plus d'énergie aux problèmes complexes nécessitant l'intelligence humaine.