A reportagem descreve um experimento bem-sucedido que treinou Kanzi, um bonobo de 42 anos, a jogar Minecraft. Descobriu-se que seus métodos de aprendizagem são semelhantes aos usados para treinar agentes de IA como o GPT-4. Usando técnicas como aprendizado por reforço com contexto, RLHF (Aprendizado por Reforço a partir de Feedback Humano), aprendizado por imitação e aprendizado por etapas, Kanzi aprendeu habilidades como se mover, coletar recompensas e quebrar obstáculos. O experimento demonstra as vantagens que os animais possuem em relação aos agentes de IA em termos de percepção e adaptação a novos ambientes.