En el campo de la robótica, la empresa estadounidense Figure AI ha lanzado recientemente Helix, un modelo de lenguaje grande (LLM) para dispositivos perimetrales, que representa un gran avance en el control de robots humanoides. Helix es el primer modelo de visión-lenguaje-acción (VLA) capaz de controlar de forma continua y a alta frecuencia todo el torso superior de un robot humanoide (incluida la cabeza, el tronco, las muñecas y los dedos). Esto significa que el robot puede ejecutar tareas directamente a partir de instrucciones en lenguaje natural sin necesidad de un extenso entrenamiento.
Figure AI ha resuelto la contradicción entre la generalidad y la velocidad de los modelos de visión-lenguaje mediante la creación de dos sistemas complementarios. El sistema uno es un modelo de estrategia de movimiento visual de respuesta rápida, capaz de ejecutar 200 acciones precisas por segundo, mientras que el sistema dos es un modelo de visión-lenguaje de código abierto que comprende escenas complejas y lenguaje natural. Estos dos sistemas se comunican de forma eficiente mediante un entrenamiento de extremo a extremo, superando así las limitaciones que antes tenían los robots humanoides a la hora de realizar tareas diversas.
Más emocionante aún, Helix no solo puede funcionar en un solo robot, sino que es el primer modelo de IA capaz de lograr la colaboración entre dos robots. En una serie de demostraciones, dos robots equipados con Helix lograron clasificar con éxito un montón de objetos desconocidos trabajando en conjunto. Para completar la tarea, los robots necesitaron una "confirmación" visual, mirándose mutuamente para asegurar la correcta transmisión de información. Esta forma de colaboración robótica no solo muestra la potencia de Helix, sino que también sugiere que la interacción futura entre robots humanoides y humanos será más natural y eficiente.
Con solo 500 horas de datos de supervisión de alta calidad, Helix puede identificar y manipular fácilmente miles de pequeños artículos domésticos. Bajo instrucciones sencillas, el robot puede realizar tareas que nunca antes se le habían enseñado, mostrando una asombrosa flexibilidad e inteligencia.
Con el lanzamiento de Helix, Figure AI también está buscando activamente financiación, con un objetivo de 1500 millones de dólares y una valoración prevista de 39 500 millones de dólares. Esta cifra, casi 14 veces superior a la del año pasado, refleja el enorme interés y potencial del mercado en la robótica.