Am 26. Februar veröffentlichte das Google DeepMind-Team Genie, ein grundlegendes Weltmodell – eine interaktive, virtuell generierte Umgebung mit 11 Milliarden Parametern. Es wurde mit Videodaten trainiert und kann Fotos, Skizzen und sogar steuerbare virtuelle Welten generieren. Im Gegensatz zu traditionellen KI-Systemen, die mit manuell beschrifteten Bildern trainiert werden, wurde Genie ohne jegliche Aktionsmarkierungen trainiert. Das bedeutet, Genie musste die Merkmale und Muster verschiedener Aktionen selbstständig aus den Videos extrahieren. Die von Genie generierten Videos sind cartoonartig und können Roboterbewegungen und sich verformende Objekte simulieren. Im Vergleich zu Sora konzentriert sich Genie eher auf animierte Grafiken. Google beschreibt Genie als herausforderndes Projekt, das feinkörnige Steuerung erlernen und aus Internetvideos lernen kann. Genie kann außerdem verschiedene potenzielle Aktionen simulieren und basierend auf der generierten Umgebung verschiedene Aktionen vorhersagen.