La innovación en la robótica: enseñando a los robots sus límites
En el ámbito de la robótica, conocer los límites de un dispositivo es fundamental para que pueda realizar tareas de manera segura y eficiente. Investigadores del Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT (CSAIL) han desarrollado una estrategia denominada «PRoC3S» que combina modelos de visión y modelos de lenguaje para ayudar a los robots a ejecutar tareas abiertas, garantizando que respeten las limitaciones de su entorno. Esta metodología permite que un robot, al enfrentarse a una tarea compleja, como limpiar una cocina, pueda generar un plan de acción que considere las restricciones físicas de su entorno, como obstáculos o la distancia que puede alcanzar.
El enfoque PRoC3S consiste en que un modelo de lenguaje grande (LLM) es capaz de bosquejar un plan de acción que luego se verifica en un simulador. Si el plan inicial no es viable, el LLM genera nuevas propuestas hasta encontrar una solución ejecutable. Esta técnica de ensayo y error no solo permite que los robots realicen tareas sencillas, como dibujar o clasificar objetos, sino que también abre la puerta a la realización de tareas más complejas en entornos dinámicos, como el hogar, donde se requiere que el robot ejecute múltiples pasos para completar un trabajo.
Los resultados de esta investigación, presentada en la Conferencia sobre Aprendizaje de Robots en Múnich, muestran que PRoC3S ha tenido éxito en simulaciones, donde logró realizar tareas como dibujar estrellas y letras con una alta tasa de éxito. Además, la técnica ha sido probada en un brazo robótico, demostrando su capacidad para llevar a cabo acciones precisas en el mundo real, como organizar bloques de colores. Los investigadores destacan que este nuevo enfoque no solo mejora la seguridad de las acciones de los robots, sino que también permite que los usuarios confíen en que estas máquinas podrán cumplir con tareas más complejas y variadas en el futuro.