Le laboratoire de recherche en intelligence artificielle EvolutionaryScale, fondé par d'anciens ingénieurs de Meta, a récemment lancé ESM3, un outil de conception de programmes biologiques doté d'un modèle linguistique génératif et multi-modal natif.
Ce modèle peut concevoir de nouvelles protéines à partir d'instructions spécifiques. Les résultats expérimentaux montrent qu'il est capable de générer une nouvelle protéine fluorescente verte (esmGFP), une prouesse qui aurait nécessité des centaines de millions d'années d'évolution naturelle.
EvolutionaryScale a bouclé un tour de table de 14,2 millions de dollars en financement de démarrage, mené par Nat Friedman, Daniel Gross et Lux Capital, avec la participation des fonds de capital-risque d'AWS et de Nvidia. ESM3 est disponible en trois versions : la plus petite est déjà publique, tandis que les versions moyennes et grandes sont commercialisées via l'API d'EvolutionaryScale.
Pourquoi EvolutionaryScale introduit-elle l'intelligence artificielle dans le domaine de la biologie ? Si les modèles d'IA génératifs ont fait des progrès significatifs dans la compréhension et le raisonnement du langage humain, beaucoup se demandent si nous pouvons entraîner ces modèles à interpréter le langage fondamental de la vie et les utiliser pour développer de nouvelles molécules. Les molécules fondamentales de la vie, notamment l'ARN, les protéines et l'ADN, ont évolué au cours des 3,5 milliards d'années passées grâce à des réactions chimiques naturelles. Par conséquent, la capacité de programmer le vivant et de concevoir de nouvelles molécules pourrait ouvrir la voie à la résolution de certains des plus grands défis de l'humanité, notamment le changement climatique, la pollution plastique et le cancer.
Dans la première boîte de Petri illustrée ci-dessous, nous avons trouvé avec intérêt B8. Bien qu'extrêmement faible, 50 fois plus sombre que la GFP naturelle, elle est très différente de toutes les GFP connues - 43 % de sa séquence diffère de celle de la protéine naturelle la plus proche. En poursuivant le raisonnement de B8 dans la deuxième boîte ci-dessous, ESM3 a découvert C10, qui présente des similitudes avec les protéines fluorescentes naturelles.
Plusieurs organisations, dont Google Deepmind et Isomorphic Labs, travaillent déjà dans ce domaine, et EvolutionaryScale est le dernier venu. Fondée en 2023, la société a développé plusieurs modèles linguistiques de protéines ces derniers mois, mais son dernier produit, ESM3, est le plus grand et possède des capacités multimodales et génératives natives.
Points clés :
💡 EvolutionaryScale, fondée par d'anciens ingénieurs de Meta, a lancé ESM3, un outil de conception de programmes biologiques doté d'un modèle linguistique génératif et multi-modal natif.
💡 Lors des tests, ESM3 a généré une nouvelle protéine fluorescente verte, simulant plus de 500 millions d'années d'évolution, ce qui représente un potentiel d'application énorme dans le domaine de la biologie.
💡 ESM3 est disponible en trois versions : la plus petite est déjà publique, tandis que les versions moyennes et grandes sont commercialisées via l'API d'EvolutionaryScale.