OK-Robot ist ein offenes, modulares Framework, das die Durchführung von Null-Schuss-Gegenstandsbewegungsaufgaben in beliebigen häuslichen Umgebungen anhand von Sprachbefehlen ermöglicht. Das Framework verwendet ein modulares Design, 3D VoxelMap für die Navigation mit offenem Vokabular, AnyGrasp und LangSam für das Greifen mit offenem Vokabular sowie Prädikate zum Ablegen von Gegenständen. Das Framework benötigt kein Vortraining und ermöglicht eine Null-Schuss-Verallgemeinerung von Sprachbefehlen.