Recentemente, a equipe Verses desenvolveu o agente inteligente Genius, que alcançou resultados surpreendentes no clássico jogo Pong. Utilizando apenas 10% dos dados e 2 horas de treinamento, superou jogadores humanos de elite e outros modelos de IA. Este avanço inovador representa um novo marco na tecnologia de IA e indica a direção futura do desenvolvimento de agentes inteligentes.

O sucesso do agente inteligente Genius se deve ao seu design único. Em comparação com os grandes modelos tradicionais, o Genius tem apenas 4% do tamanho do modelo IRIS SOTA e pode ser executado em um MacBook com chip M1 comum. A inspiração dos pesquisadores veio de um experimento realizado há quatro anos, onde cientistas descobriram que um "cérebro em um prato" cultivado conseguia aprender o jogo Pong em apenas 5 minutos, o que os levou a refletir sobre a imitação do funcionamento do cérebro humano.

Robô Inteligência Artificial IA

Nota da imagem: Imagem gerada por IA, provedor de serviços de licenciamento de imagens Midjourney

A equipe Verses acredita que os agentes de IA tradicionais baseados em grandes modelos apresentam sérias deficiências em termos de raciocínio lógico. Os modelos existentes dependem mais da memorização das etapas de raciocínio nos dados de treinamento, faltando verdadeira proatividade e curiosidade. O agente inteligente Genius utiliza o conceito de motor cognitivo, possuindo não apenas capacidades de cognição, raciocínio e tomada de decisão, mas também a capacidade de aprendizagem ativa.

Em testes comparativos com o IRIS e outros modelos de IA, o Genius demonstrou uma poderosa capacidade de aprendizagem. Os pesquisadores treinaram o Genius com 10.000 etapas de dados do jogo em 2 horas, e os resultados mostraram que seu desempenho superou o do IRIS, que foi treinado por dois dias. O sucesso do Genius reside não apenas em sua rápida capacidade de aprendizagem, mas também em seu desempenho proativo no jogo. Por exemplo, em partidas de Pong, o Genius conseguiu reverter o placar e vencer mesmo estando em desvantagem, um fenômeno não observado no treinamento do IRIS.

No entanto, os pesquisadores também alertam que, embora o desempenho do Genius seja animador, ainda faltam padrões unificados para avaliar completamente o desempenho da IAG (Inteligência Artificial Geral), sendo necessário realizar testes diversificados para verificar sua adaptabilidade e confiabilidade em diferentes áreas.

Este resultado de pesquisa não apenas impulsiona o desenvolvimento de agentes de IA, mas também fornece novas ideias e métodos para a exploração futura da inteligência artificial.

Endereço do artigo: https://arxiv.org/pdf/2410.05229