Le modèle d'IA biologique Evo2, développé conjointement par Arc Institute et Nvidia, a été récemment lancé. Ce modèle de base s'appuie sur les données ADN de plus de 100 000 organismes vivants et vise à décoder en profondeur les phénomènes complexes de la biologie. Evo2 peut identifier dans les séquences génétiques de différents organismes des schémas que les chercheurs mettraient des années à découvrir, améliorant considérablement la capacité d'identification des mutations liées aux maladies et permettant même la conception de nouveaux génomes aussi simples que ceux des bactéries.

image.png

L'entraînement d'Evo2 a nécessité le traitement de plus de 93 000 milliards de nucléotides, dépassant largement son prédécesseur, Evo1. Son équipe de développement, composée de membres de Nvidia et de l'Arc Institute, un organisme de recherche biomédicale à but non lucratif basé à Palo Alto en Californie, a collaboré étroitement avec des chercheurs de l'Université Stanford, de l'Université de Californie à Berkeley et de l'Université de Californie à San Francisco. Evo2 possède non seulement une puissance de calcul impressionnante, mais il explore également activement la transparence et l'explicabilité. Pour favoriser une recherche scientifique plus ouverte, l'équipe a rendu publiques les données d'entraînement, le code et les poids du modèle Evo2, ce qui en fait le modèle d'IA biologique entièrement open source le plus vaste à ce jour.

image.png

Patrick Hsu, co-fondateur de l'Arc Institute et professeur adjoint à l'UC Berkeley, a déclaré que le développement d'Evo2 représente une avancée majeure dans le domaine de la biologie générative. Grâce à cette technologie, les machines peuvent « lire », « écrire » et « penser » le langage des nucléotides, faisant progresser la recherche biologique. Les capacités d'apprentissage d'Evo2 sont comparables à celles des grands modèles linguistiques, démontrant un potentiel considérable pour la prédiction des mutations liées aux maladies et la conception de formes de vie artificielles potentielles.

De plus, Evo2 pourrait offrir de nouvelles pistes pour la conception de biothérapies, telles que les thérapies géniques activant des gènes spécifiques dans des types cellulaires ciblés, afin de réduire les effets secondaires et d'améliorer la précision du traitement. Le développement d'Evo2 représente non seulement une percée technologique, mais a également un impact profond sur notre compréhension de la biologie.

Les chercheurs ont veillé à un développement responsable du modèle en excluant les données sur les agents pathogènes susceptibles d'infecter les humains et autres organismes complexes. Anthony Costa, directeur de la biologie numérique chez Nvidia, a déclaré qu'Evo2 repousse les limites des modèles biologiques de base et fournit aux scientifiques du monde entier un outil de collaboration puissant pour relever les défis majeurs de santé et de maladie auxquels l'humanité est confrontée.