Una máquina que aprende a jugar videojuegos por si misma, gracias a una red neuronal

Space Invaders- Taito Corporation.jpg

El 25 de febrero de 2015 se publica en la revista Nature el articulo «Human-level control through deep reinforcement learning«, el cual muestra un algoritmo que permite a una computadora aprender por sí sola a jugar videojuegos, sin apenas información previa.

Para los seres humanos es fácil aprender a controlar un videojuego. La experiencia anterior con la máquina o en la propia vida sirve de ayuda para superar pantallas. ¿Pero una computadora puede hacer lo mismo? Demis Hassabis y su equipo de investigadores en Inteligencia Artificial de la empresa Deep Mind, de Google, se propusieron el reto de crear un algoritmo que le permitiera hacer esto a una computadora

Hasta ahora, el método que habían empleado los ingenieros computacionales era el aprendizaje por refuerzo, basado en el estímulo y la recompensa pero que, según los investigadores, “es limitado en situaciones complejas y su aplicación se limita a los entornos controlables”.

La novedad que aportan los investigadores de Deep Mind es la combinación de este tipo de aprendizaje con una red neuronal artificial a imagen y semejanza de las biológicas. El resultado, publicado en la revista Nature, es un algortimo denominado deep Q-network (DQN) surgido a partir de un aprendizaje por refuerzo ‘profundo’.

El estudio muestra que este agente artificial ha aprendido por sí mismo a jugar a 49 videojuegos clásicos de la videoconsola Atari 2600, entre los que se encuentran Pacman o Space Invaders, partiendo de información sobre los píxeles y el número de acciones posibles en cada juego.

“Usamos los mismos datos iniciales para todos los juegos, lo que demuestra que el agente aprende con éxito los procedimientos de cada uno basándose únicamente en las entradas sensoriales”, explicaron los investigadores al presentar su invento.

Capaz de vencer a seres humanos

La máquina superó las puntuaciones de sus predecesoras en 43 de los 49 videojuegos. Pero sus logros no se quedan ahí, según los autores: “Su rendimiento se puede comparar con el de un probador profesional humano de videojuegos. Logró más del 75% de la puntuación humana en más de la mitad de los juegos”.

El método destacó en actividades de índole muy variada, desde los juegos de boxeo a los de carreras de coches en 3D, “lo que demuestra que utilizando la misma arquitectura, la máquina puede aprender a optimizar estrategias en diferentes ambientes”.

Para los investigadores, este algoritmo también puede ayudar a los científicos a entender el proceso de aprendizaje de las personas. Asimismo, esperan que ayude crear productos más útiles, como “mejorar el motor de búsqueda de Google para completar tareas complejas como, por ejemplo, planear un viaje”.

Referencia bibliográfica:

Demis Hassabis et al. «Human-level control through deep reinforcement learning«. Nature (25 de febrero de 2015)