Robots aprenden a caminar por el método de ensayo y error

Michiel van de Panne / YouTube

Investigadores de Canadá y Singapur han desarrollado un algoritmo que permite a los robots virtuales con dos pies aprender a caminar y correr a través del ensayo y error, de manera parecida a como lo hacen los humanos.

Los científicos creen que este algoritmo se podrá usar en el entrenamiento a robots reales, así como en la creación de animación computarizada en juegos y películas. El algoritmo fue presentado en una conferencia sobre gráfica computarizada SIGGRAPH 2017, y su descripción detallada está disponible en la página web de la Universidad de Columbia Británica.

Anteriormente, durante el entrenamiento a robots, los ingenieros debían prescribir manualmente en los códigos de los programas, la conducta y la reacción en diferentes condiciones.

En las últimas décadas, cada vez se aplica más el otro enfoque - el aprendizaje automático. Ello permite a los algoritmos aprendices, no sólo seguir un algoritmo asignado previamente, sino también buscar el método más adecuado para resolver un problema de manera independiente.

Los ingenieros canadienses decidieron aplicar esta estrategia para crear personajes y robots digitales, que de modo efectivo y realista caminan sobre sus dos piernas. Para ello, utilizaron el aprendizaje por refuerzo. Este tipo de entrenamiento de máquinas implica que el algoritmo aprendiz recibe una respuesta en la interacción con el medio ambiente - una recompensa o sanción. La implementación del algoritmo, presentada por los investigadores, consta de dos componentes principales: controladores-planificadores de alto y de bajo nivel. El componente de bajo nivel es responsable de la planificación de pasos concretos, estilo de caminar, considerar los parámetros del terreno cercano. El controlador de alto nivel es responsable de la planificación a largo plazo -por ejemplo, permite al robot planificar su ruta en función de los obstáculos.

El aprendizaje tuvo lugar en un entorno virtual con parámetros variables. Por lo tanto, el robot podía encontrarse en un camino estrecho, en las montañas, o en el hielo. Además, el entorno cambiaba dinámicamente. Por ejemplo, la superficie fija plana alternaba con una superficie móvil parecida al pasillo móvil. También,  periódicamente, caían sobre el robot bloques cúbicos de diferentes tamaños.

Gracias al aprendizaje automático, el robot aprendió a moverse con agilidad y rapidez en diferentes condiciones, e incluso a lanzar la pelota a la meta. Los investigadores creen que en el futuro, el algoritmo se podrá adaptar a diferentes tareas, no sólo las relacionados con la robótica. Por ejemplo, con su ayuda se podrá crear animaciones anatómicas precisas del movimiento humano en juegos y películas, usando gráficos computarizados para reemplazar las cámaras y sensores de captura de movimiento que se usan hoy.

A pesar de que existen otros algoritmos para el aprendizaje en espacios virtuales, la transferencia de habilidades al mundo real o entre los robots de diferentes diseños podría representar un problema grave, especialmente para los más temerosos de que algún día los robots dejen de obedecer a los humanos: recientemente, un equipo de investigadores del laboratorio CSAIL del Instituto Tecnológico de Massachusetts (MIT, por sus siglas en inglés) desarrolló un sistema que permitirá a los androides compartir habilidades y conocimientos entre ellos.

 

Gregory Kopiev
Si te gustó esta noticia, entérate de más a través de nuestros canales de Facebook y Twitter

 

 

Suscríbete

Déjanos tu mail para recibir nuestro boletín de noticias

La confirmación ha sido enviada a tu correo.