Récemment, les scientifiques de Sakana AI ont réalisé une avancée révolutionnaire dans le domaine de l'intelligence artificielle. Pour la première fois, ils ont réussi à utiliser des modèles fondamentaux vision-langage (vision-language foundation models, FM) pour effectuer une recherche automatique de simulations de vie artificielle (Artificial Life, ALife). Cette nouvelle méthode, baptisée ASAL (Automated Search for Artificial Life, recherche automatisée de vie artificielle), révolutionne la recherche dans le domaine de la vie artificielle et devrait accélérer son développement.

Traditionnellement, la recherche sur la vie artificielle reposait sur la conception manuelle et la méthode des essais et erreurs. ASAL change radicalement cette situation. Au cœur de cette méthode se trouve l'utilisation de modèles fondamentaux pour évaluer les vidéos générées par les simulations, permettant ainsi une recherche automatique de simulations ALife intéressantes. ASAL utilise principalement trois mécanismes pour découvrir des formes de vie :

image.png

Recherche ciblée supervisée : recherche de simulations produisant des phénomènes spécifiques grâce à des invites textuelles. Par exemple, les chercheurs peuvent définir des objectifs tels que « une cellule » ou « deux cellules », permettant au système de trouver automatiquement les simulations correspondantes. Recherche ouverte : recherche de simulations produisant une nouveauté infinie dans le temps. Cette approche permet de découvrir des simulations qui restent intéressantes pour l'observateur humain. Recherche heuristique : recherche d'un ensemble de simulations intéressantes et diversifiées afin de révéler des « mondes extraterrestres ».

La nature générale d'ASAL permet son application efficace à de multiples matrices ALife, notamment Boids, Particle Life, le Jeu de la vie (Game of Life), Lenias et les automates cellulaires neuronaux (Neural Cellular Automata). Les chercheurs ont découvert des formes de vie inédites dans ces matrices, telles que des schémas d'agrégation étranges dans Boids, de nouvelles cellules auto-organisées dans Lenias et des automates cellulaires ouverts similaires au Jeu de la vie de Conway.

De plus, ASAL permet d'effectuer une analyse quantitative de phénomènes qui ne pouvaient auparavant être analysés que qualitativement. Les modèles fondamentaux possèdent des capacités de représentation similaires à celles des humains, ce qui permet à ASAL de mesurer la complexité d'une manière plus conforme à la cognition humaine. Par exemple, les chercheurs peuvent quantifier les phases de plateau dans les simulations Lenias en mesurant la vitesse de changement des vecteurs CLIP au cours du processus de simulation.

image.png

L'innovation de cette recherche réside dans l'utilisation de modèles fondamentaux pré-entraînés, en particulier le modèle CLIP (Contrastive Language–Image Pre-training), pour évaluer les vidéos de simulation. Le modèle CLIP, grâce à l'apprentissage contrastif, aligne les représentations des images et du texte, lui permettant de comprendre la notion humaine de complexité. La méthode ASAL n'est pas limitée à un modèle fondamental ou une matrice de simulation spécifique, ce qui signifie qu'elle est compatible avec les modèles et les matrices futurs.

Les chercheurs ont également vérifié expérimentalement l'efficacité d'ASAL en utilisant différents modèles fondamentaux (tels que CLIP et DINOv2) et différentes matrices ALife. Les résultats montrent que CLIP est légèrement meilleur que DINOv2 pour générer une diversité conforme à la perception humaine, mais les deux sont nettement supérieurs aux représentations pixelliques de bas niveau. Cela souligne l'importance d'utiliser des représentations de modèles fondamentaux profonds pour mesurer le concept humain de diversité.

Cette recherche ouvre de nouvelles voies dans le domaine de la vie artificielle, permettant aux chercheurs de se concentrer sur des problèmes de plus haut niveau, tels que la meilleure façon de décrire les phénomènes que nous souhaitons voir émerger, puis de laisser le processus automatisé trouver ces résultats. ASAL permet non seulement aux scientifiques de découvrir de nouvelles formes de vie, mais aussi d'analyser quantitativement la complexité et l'ouverture des simulations de vie. En fin de compte, cette technologie devrait aider les humains à comprendre la nature de la vie et toutes les formes possibles de vie dans l'univers.

Code du projet : https://github.com/SakanaAI/asal/

Adresse de l'article : https://arxiv.org/pdf/2412.17799