Recentemente, os cientistas da Sakana AI fizeram um avanço revolucionário na área da inteligência artificial, conseguindo pela primeira vez usar modelos de base de linguagem visual (vision-language foundation models, FMs) para realizar uma busca automática de simulação de vida artificial (Artificial Life, ALife). Este novo método, chamado ASAL (Automated Search for Artificial Life, Busca Automatizada de Vida Artificial), revoluciona a pesquisa na área de vida artificial e promete acelerar seu desenvolvimento.
Tradicionalmente, a pesquisa em vida artificial dependia principalmente de design manual e tentativa e erro. O ASAL muda essa realidade. O cerne do método é a avaliação de vídeos gerados pela simulação através de modelos de base, permitindo a busca automática de simulações de ALife interessantes. O ASAL descobre formas de vida principalmente através de três mecanismos:
Busca com objetivo supervisionado: Busca simulações que produzem fenômenos específicos através de prompts de texto. Por exemplo, os pesquisadores podem definir objetivos como "uma célula" ou "duas células", fazendo com que o sistema encontre automaticamente simulações que atendam aos critérios. Busca aberta: Busca simulações que geram novidades infinitas no tempo. Isso ajuda a descobrir simulações que permanecem interessantes para os observadores humanos. Busca heurística: Busca um conjunto de simulações interessantes e diversas, revelando "mundos alienígenas".
A versatilidade do ASAL permite sua aplicação eficiente em diversas matrizes ALife, incluindo Boids, Vida de Partículas (Particle Life), Jogo da Vida (Game of Life), Lenia e Autômatos Celulares Neurais (Neural Cellular Automata). Os pesquisadores descobriram formas de vida nunca antes vistas nessas matrizes, como padrões de agrupamento estranhos em Boids, novas células auto-organizadas em Lenia e autômatos celulares abertos semelhantes ao Jogo da Vida de Conway.
Além disso, o ASAL permite a análise quantitativa de fenômenos que antes só podiam ser analisados qualitativamente. Os modelos de base possuem capacidade de representação semelhante à humana, permitindo que o ASAL meça a complexidade de uma forma mais alinhada com a cognição humana. Por exemplo, os pesquisadores podem quantificar a fase estacionária em simulações de Lenia medindo a velocidade de mudança dos vetores CLIP durante o processo de simulação.
A inovação da pesquisa reside no uso de modelos de base pré-treinados, especialmente o modelo CLIP (Contrastive Language-Image Pre-training), para avaliar os vídeos das simulações. O modelo CLIP, através do aprendizado contrastivo, alinha as representações de imagens e texto, permitindo-lhe entender o conceito humano de complexidade. O método ASAL não se limita a modelos de base ou matrizes de simulação específicas, podendo ser compatível com modelos e matrizes futuras.
Os pesquisadores também validaram a eficácia do ASAL experimentalmente, usando diferentes modelos de base (como CLIP e DINOv2) e diferentes matrizes ALife. Os resultados mostraram que o CLIP é ligeiramente superior ao DINOv2 na geração de diversidade alinhada com a cognição humana, mas ambos são claramente superiores às representações de pixels de baixo nível. Isso destaca a importância do uso de representações de modelos de base profundos para medir o conceito humano de diversidade.
Esta pesquisa abre novos caminhos para a área de vida artificial, permitindo que os pesquisadores se concentrem em questões de nível superior, como como descrever melhor os fenômenos que desejamos que apareçam e, em seguida, deixar o processo automatizado encontrar esses resultados. O surgimento do ASAL não apenas ajuda os cientistas a descobrir novas formas de vida, mas também permite a análise quantitativa da complexidade e abertura em simulações de vida. Em última análise, esta tecnologia pode ajudar as pessoas a entender a essência da vida e todas as suas possíveis formas no universo.
Código do projeto: https://github.com/SakanaAI/asal/
Endereço do artigo: https://arxiv.org/pdf/2412.17799