En el área de la inteligencia artificial, en la cual se diseñan día a día robots más independientes y que pueden resolver problemas, existe una técnica relativamente sencilla para programarlos, basada en una serie de opciones multifactoriales apoyadas en lo que se conoce como utilidades o beneficios, dicha técnica se conoce como Markov Decision Process o MDP.
En la Maestría de Inteligencia Artificial se presentó la conferencia “Planificación con teoría de decisiones y sus aplicaciones”, impartida por Alberto Reyes Ballesteros, doctor en Ciencias Computacionales por el ITESM de Cuernavaca.
En palabras del doctor “los MDP son una técnica para hacer planificación con una computadora, la cual está sustentada por los científicos de inteligencia artificial, investigación de control automático y que es bien conocida, esta herramienta te permite construir sistemas computacionales y resolver problemas, como en el control de robots, para que estos tomen decisiones independientes, basadas en una serie de variables y los más altos porcentajes de beneficio o utilidad”.
En la programación de un robot o un sistema computacional, la técnica de los MDP plantea que primero el diseñador debe plantar un entorno, un problema, una función o un objetivo, después debe trazar el camino o proceso a seguir para cumplir con ese objetivo, pero también debe incluir una serie de variables a las que puede enfrentarse el robot o sistema y sus posibles soluciones, a estas soluciones se les llaman valores de utilidad, es decir, que el sistema o robot, al enfrentarse a una variable o encrucijada buscará las valores más altos de utilidades y optará por uno de ellos. Todo esto codificado en un lenguaje matemático de asignación de índices numéricos. Es como se si planteara un una serie de caminos con obstáculos a seguir, el robot o programa buscará el mejor camino de acuerdo a su objetivo, gracias a los valores numéricos que le indican qué camino le ofrece los mayores beneficios.
“Es una técnica relativamente antigua (en los 50), pero que estuvo guardada en el closet porque no se tenía el equipo de computo que se tiene ahora, actualmente lo que se hizo fue desempolvarla y echarla a correr en computadoras más potentes para sacar sus beneficios, ahora se hace investigación en esto, en cómo podemos resolver problemas más completos, de la mano a que el sistema sea autónomo, proactivos, de acuerdo a los valores de utilidad. Así se determina el comportamiento de los robots o programas, los cuales optarán por el mejor camino de acuerdo a sus valores de utilidad y según el estado del agente robótico”.
Sin embargo, y a pesar del desarrollo de la inteligencia artificial, aún hay un factor muy importante, el humano, ya que el diseñador tiene el importante papel de prever y estar al tanto del proceso que debe realizar el robot o sistema, si existe un error al asignar el valor numérico a las variables o a las utilidades, podría no cumplir con su programación principal.
Un ejemplo claro sobre la aplicación de estos MDP se encuentra en la industria, el doctor explicó que en una sistema computacional de una generador eléctrico, el MDP puede ofrecer recomendaciones a los ingenieros o trabajadores sobre lo que deben hacer para solucionar un problema, incluso permite dar tutoriales y un mapeo de los errores y aciertos de los usuarios, asimismo, en el caso de los robots que deben localizar un punto o seguir una trayectoria, los MAP les dice cómo rodear un obstáculo y retomar un camino, todo gracias a la información numérica basada en valores altos y bajos de utilidad.