O OK-Robot é um framework modular e aberto que permite a execução de tarefas de transporte de objetos em qualquer ambiente doméstico, com base em comandos de linguagem e sem exemplos prévios. O framework utiliza um design modular, com navegação de vocabulário aberto por meio de 3D VoxelMap, captação de vocabulário aberto com AnyGrasp e LangSam, e primitivas de colocação para posicionar objetos. Não requer treinamento prévio e permite a generalização de comandos de linguagem sem exemplos prévios.