La inteligencia artificial pasa el juego más difícil de Atari

Christopher Sauer / YouTube

Con tan solo unos comandos en inglés básico, un equipo de estudiantes de la Universidad de Stanford enseñó a una red neuronal a pasar el juego más difícil de Atari 2600. Una versión preliminar de la investigación ha sido publicada en la web de trabajos pre-impresos arXiv.org.

Los estudiantes decidieron utilizar el juego “La venganza de Moctezuma” como ambiente de entrenamiento de una red neuronal. Este juego, en particular, no resulta fácil de comprender para la inteligencia artificial (IA) debido a que casi no tiene “recompensas” que indiquen cómo salir de una habitación para pasar a otra, encontrar el tesoro o resolver rompecabezas. 

Ejemplo de secuencias de comando para obtener la llave: 1. Bajar las escaleras. 2. Saltar a la soga. 3. Saltar hacia el lado derecho de la habitación. 4. Bajar las escaleras. 5. Tomar el lado izquierdo. 6. Subir las escaleras. 7. Coger la llave. 
Russell Kaplan et al. / arXiv.org, 2017

Los desarrolladores idearon una salida a este problema. Para acelerar el proceso de aprendizaje del juego de la red neuronal, decidieron enseñar objetivos básicos escritos en un lenguaje natural en forma de comandos de pantalla que indicaban las acciones del personaje del juego (por ejemplo, tomar una llave o subir las escaleras). Esto fue acompañado de capturas de pantalla para que la IA “observara”  y asociara las acciones específicas con los comandos. El método, una vez puesto a prueba, resultó siendo un éxito.

Para probar que la IA realmente comprendió las órdenes, los autores la hicieron jugar por primera vez en una habitación del juego con los comandos programados. Inicialmente, la IA interpretó los comandos de manera correcta, pero lo mejor vino después:  la máquina desestimó los comandos sugeridos al encontrar estrategias más óptimas para seguir avanzando. 

Los estudiantes evaluaron la efectividad de su método con ayuda de OpenAI Gym, una plataforma para desarrollar y comparar algoritmos de aprendizaje profundo. Su algoritmo alcanzó un puntaje de 3500 vs. los 2500 del competidor más exitoso. En la actualidad, solo el algoritmo Google DeepMind ha alcanzado más de 6600 puntos, aunque su entrenamiento toma el doble de tiempo. En el futuro, los estudiantes de ingeniería del presente proyecto tienen planificado disminuir la cantidad de instrucciones para darle mayor independencia al algoritmo. 

Previamente, un equipo del Instituto de Tecnología de Massachusetts entrenó a un programa de inteligencia artificial con algoritmos de aprendizaje profundo para ganar en el videojuego Super Smash Bros. Por otro lado, el popular videojuego StarCraft II también ha sido puesto a prueba por los investigadores de la compañía británica Deep Mind para ser jugado por la IA.  

Gregory Kopiev

Si te gustó esta noticia, entérate de más a través de nuestros canales de Facebook y Twitter.

Suscríbete

Déjanos tu mail para recibir nuestro boletín de noticias

La confirmación ha sido enviada a tu correo.

Leer también

Desde que Pokémon Go salió al mercado a inicios de julio de 2016, la pregunta que todos los analistas y consumidores se han hecho es, ¿hasta cuándo durará el interés por el juego? En la industria de juegos móviles, esta pregunta se puede contestar utilizando las herramientas de análisis para medir la adquisición, retención y monetización del juego a lo largo del tiempo. Los números indican que, si bien se ha alejado notablemente de los picos de su mejor momento, Pokémon Go aún sigue vigente como uno de los juegos más importantes del momento.

¿Se acabó el auge de Pokémon Go?

El pasado 8 de septiembre la NASA lanzó desde Cabo Cañaveral la sonda OSIRIS-REx, con el objetivo de estudiar in situ al asteroide Bennu. Se trata de una misión crucial que traerá por primera vez muestras no contaminadas de un asteroide de tipo primitivo que podremos estudiar en detalle, con los mejores instrumentos de laboratorio que existen. Allí estuvo el Dr. Javier Licandro, Investigador Titular del Instituto de Astrofísica de Canarias (IAC) y colaborador en la referida misión de la agencia espacial estadounidense.

¿Estamos preparados ante el impacto de un mortal meteorito?