La inteligencia artificial logró el puntaje perfecto en este juego de Pac-Man y tú no

(Foto: Microsoft Research)

Que la inteligencia artificial (IA) nos superará algún día en todo ámbito intelectual a nosotros, sus propios creadores, es algo que hay que asumir ya mismo. Incluso en los pasatiempos más nimios, incluso en una partida de Ms. Pac Man, uno de los videojuegos más populares de la historia, desde su lanzamiento hace 35 años.

Se trata de la variación oficial de Pac-Man, la misma protagonizada por la señora Pac-Man, con algunas mejoras al juego original. Hasta hace poco, el máximo puntaje obtenido por un jugador humano había sido el de 266.330, para la versión de Atari 2600. No obstante, no había registro de puntuación perfecta (999.900) lograda por jugadores de carne y hueso, a menos que hubieran recurrido, claro, a alguna modificación del juego. Los movimientos de los fantasmas enemigos y las bonificaciones en el juego son aleatorios, complicando ello la juagada fácil.

Maluuba, un equipo de aprendizaje profundo adquirido por Microsoft en enero, es el creador de un sistema de IA que ha aprendido a alcanzar los ansiados 999.900 en la referida consola, empleando una combinación única de aprendizaje de refuerzo con un método de dividir y conquistar.

Maluuba lo logró gracias a que su arquitectura le permitió asignar responsabilidades a más de 150 agentes, dedicados a tareas individuales. La IA aprendió de sus creadores usando lo que ellos llaman Arquitectura de Recompensa Híbrida, mediante el cual los agentes individuales cumplían con tareas poco sistemáticas -como encontrar una pastilla específica- que trabajaban en tándem con otros agentes para lograr mayores objetivos. Pero estos agentes necesitaban a su vez algunos de mayor jerarquía —análogos a, según Microsoft, a un gerente senior en una empresa— que reunió las sugerencias de todos los agentes para decidir a dónde mover a la Sra. Pac-Man.

Los mejores resultados vinieron cuando los agentes individuales "actuaron muy egoístamente" y el agente principal se centró en lo que era mejor para el equipo en general, teniendo en cuenta no solo cuántos agentes querían ir en una dirección particular, sino la importancia de esa dirección (menos agentes que quieren evitar un fantasma tienen prioridad sobre una mayor cantidad de agentes que quieren perseguir una píldora que da puntaje, pues chocar con un fantasma te hace perder la vida y acaba con la perfección del puntaje). De acuerdo con los diseñadores del método de aprendizaje, este puede ser empleado para predecir oportunidades de ventas de una empresa o completar avances en el procesamiento del lenguaje natural.

Las plataformas de IA son usualmente puestas a prueba frente a videojuegos, por la complejidad de las acciones que suponen el éxito en ellos (aprendizaje complejo, toma de decisiones, etc.). En 2015, DeepMind AI de Google fue capaz de aprender a dominar 49 juegos Atari usando el aprendizaje de refuerzo, que proporciona retroalimentación positiva o negativa cada vez que la IA intenta resolver un problema.

Mientras, estas tecnologías siguen floreciendo y tomarán nuestros trabajos por completo en un futuro cercano. De acuerdo con una encuesta a especialistas del sector, hay un 50% de probabilidades de que la IA supere a los humanos en todas las tareas en 45 años y de automatizar todos los trabajos humanos en 120 años, siendo Asia el primer continente en ver estos cambios, de acuerdo a las estimaciones.

Hans Huerto

Si te gustó esta noticia, entérate de más a través de nuestros canales de Facebook y Twitter.

Suscríbete

Déjanos tu mail para recibir nuestro boletín de noticias

La confirmación ha sido enviada a tu correo.