La empresa emergente noruega 1X Technologies ha anunciado recientemente un gran avance en el desarrollo de modelos mundiales basados en inteligencia artificial para robots. En pocas palabras, estos modelos actúan como campos de pruebas virtuales para robots, permitiendo que se prueben y mejoren en diversas situaciones sin necesidad de pruebas físicas reales.
1X considera que esta es la clave para resolver el "problema de los robots": cómo evaluar de forma fiable robots entrenados para múltiples tareas en entornos cambiantes. Por ejemplo, un robot capaz de doblar camisetas puede tener un rendimiento inconsistente a lo largo de 50 días, con momentos de éxito efímeros.
1X afirma que incluso con el mismo modelo de robot, se producen grandes fluctuaciones en el rendimiento cuando cambia el entorno, lo que dificulta enormemente las evaluaciones reales rigurosas.
Para entrenar sus modelos mundiales, 1X recopiló miles de horas de material de vídeo que registraba a su robot humanoide EVE realizando diversas tareas en entornos domésticos y de oficina. Gracias al aprendizaje automático, el modelo ahora puede predecir razonablemente cómo reaccionarán los objetos y el entorno a las acciones del robot. Incluso para acciones no programadas explícitamente, el modelo puede generar una salida de imagen creíble, como aprender a evitar el contacto con humanos y objetos.
Actualmente, el modelo de 1X puede gestionar interacciones físicas complejas, como agarrar y levantar objetos, abrir puertas y cajones, y manipular materiales deformables como la ropa, incluso doblar camisetas.
El valor central de sus modelos mundiales radica en la simulación de la interacción de los objetos. Por ejemplo, en las próximas generaciones, el modelo recibirá la misma imagen inicial y tres conjuntos diferentes de acciones para agarrar una caja. En cada caso, la caja agarrada se elevará y moverá con el movimiento del brazo robótico, mientras que las demás cajas permanecerán en su sitio.
Sin embargo, 1X reconoce algunas limitaciones. Por ejemplo, el modelo a veces tiene dificultades para mantener la coherencia del color y la forma de los objetos, o para simular con precisión los fenómenos físicos. La capacidad de autorreconocimiento en un espejo sigue siendo poco fiable.
A pesar de los retos, 1X considera estos modelos mundiales un hito en el desarrollo y entrenamiento de robots de propósito general. Para acelerar el progreso, la empresa también ofrece conjuntos de datos, modelos preentrenados y premios a través del "1X World Model Challenge".
El objetivo a largo plazo de 1X es utilizar directamente los modelos mundiales para entrenar robots, lo que supondrá una enorme mejora de la eficiencia en comparación con las pruebas reales. Para lograr este objetivo, están reclutando activamente expertos en inteligencia artificial. A principios de este año, 1X también recaudó 100 millones de dólares para impulsar el lanzamiento al mercado de su robot humanoide doméstico Neo, con el apoyo de líderes de la industria como OpenAI, lo que demuestra las altas expectativas sobre la tecnología de 1X.
Además de 1X, Nvidia también está invirtiendo mucho en robots humanoides. La empresa ha lanzado recientemente un método de entrenamiento que utiliza Apple Vision Pro, y el investigador de Nvidia, Jim Fan, cree que la robótica experimentará un "momento GPT-3" en los próximos años.