À la croisée de la biologie et de l'informatique, AlphaFold3 a fait sensation depuis sa sortie, attirant l'attention de nombreux chercheurs. Malheureusement, Google DeepMind n'a publié qu'un article scientifique, sans fournir de code ni de poids de modèle. C'est comme présenter un délicieux gâteau sans permettre de le goûter. Face à cette approche « fermée », de nombreuses équipes se sont lancées dans une course à la reproduction du modèle.
Dans cette effervescence, la start-up Ligo s'est distinguée en étant la première à reproduire AlphaFold3. Le plus remarquable ? Ses trois fondateurs sont des étudiants de l'université d'Oxford. En seulement quatre mois, ils ont accompli cet exploit, offrant un véritable cadeau à la communauté scientifique.
AlphaFold3 est considéré comme une avancée majeure en biologie, notamment pour la prédiction de structures protéiques. Cependant, la stratégie de DeepMind est décevante : l'accès est limité à un serveur spécifique, avec un nombre d'appels quotidiens restreint, suggérant une stratégie axée sur les futurs profits commerciaux. Malgré cela, les chercheurs restent enthousiastes, car cette technologie pourrait révolutionner la découverte de médicaments.
Alors que de nombreux scientifiques se sentaient frustrés, l'équipe Ligo a osé franchir le pas. Non seulement ils ont reproduit le modèle AlphaFold3, mais ils prévoient également de le rendre open source pour le bénéfice de tous. L'équipe Ligo affirme que leur modèle prédit efficacement les structures protéiques, et que d'autres fonctionnalités seront ajoutées prochainement.
Le processus de reproduction n'a pas été simple. L'équipe a entièrement converti l'architecture du modèle décrite dans l'article de DeepMind en code PyTorch. Au cours de ce processus, ils ont découvert des erreurs dans l'article original, comme une formule incorrecte de la fonction de perte, susceptible d'affecter l'entraînement. Ils ont également optimisé le modèle original, par exemple en introduisant des couches résiduelles pour améliorer le flux de gradient.
Il est enthousiasmant de constater que l'équipe Ligo a non seulement suivi l'approche originale, mais a également innové en cherchant des méthodes plus efficaces. Ils ont même généré le modèle en utilisant seulement 8 GPU A100, une performance remarquable.
Bien que DeepMind ait temporairement fermé l'accès à ses résultats pour des raisons commerciales, la reproduction réussie par Ligo donne de l'espoir et encourage d'autres équipes à suivre le mouvement. Outre Ligo, l'équipe OpenFold de l'université de Columbia et le développeur indépendant Phil Wang participent activement à ce mouvement open source, créant ainsi un écosystème de recherche dynamique.
Adresse du projet : https://github.com/Ligo-Biosciences/AlphaFold3