Show simple item record

Professor Advisordc.contributor.advisorRuiz del Solar, Javier es_CL
Authordc.contributor.authorRecabal Guiraldes, Pablo es_CL
Staff editordc.contributor.editorFacultad de Ciencias Físicas y Matemáticases_CL
Staff editordc.contributor.editorDepartamento de Ingeniería Eléctricaes_CL
Associate professordc.contributor.otherAgusto Alegría, Héctor
Associate professordc.contributor.otherGuerrero Pérez, Pablo
Admission datedc.date.accessioned2012-09-12T18:17:31Z
Available datedc.date.available2012-09-12T18:17:31Z
Publication datedc.date.issued2009es_CL
Identifierdc.identifier.urihttps://repositorio.uchile.cl/handle/2250/103319
Abstractdc.description.abstractEn el contexto del futbol robótico la toma de decisiones es un problema interesante y complejo de resolver. El objetivo del presente trabajo es desarrollar un algoritmo que permita al robot tomar la decisión de qué hacer cuando está en posesión de la pelota, de modo de mejorar los resultados finales de cada partido. Para esto, se propone un algoritmo de aprendizaje reforzado, el cual mediante la experimentación del mundo, representado por estados, ajuste los parámetros del sistema de modo de maximizar cierta entrada o recompensa. El problema se modela con un espacio de estados reducido de modo de conseguir una generalización más amplia. Se implementa un algoritmo basado en Q-Learning y otro basado en SARSA, acercamientos levemente distintos de aprendizaje reforzado. Los experimentos consisten en partidos de diez minutos con cuatro jugadores por lado en donde uno de los dos equipos juega utilizando el algoritmo propuesto y el otro utiliza una estrategia estándar. Tanto para Q-Learning como para SARSA se alternan períodos en los que se juega utilizando el algoritmo “puro”, con otros en donde se eligen algunas acciones al azar. Analizando la diferencia de goles correspondiente a cada período y a cada algoritmo, se puede observar en ambos casos una leve tendencia creciente en la diferencia de goles, sin embargo, esta no es categórica debido a la alta dispersión de los datos. Además, es posible observar como SARSA presenta mejores resultados si se considera los resultados globales, mientras que Q-Learning presenta una tendencia creciente más pronunciada para las pruebas que involucran al algoritmo puro. Los objetivos no se satisfacen completamente, pues después de más de 90 horas de entrenamiento ninguno de los dos algoritmos es capaz de superar a la estrategia estándar.
Lenguagedc.language.isoeses_CL
Publisherdc.publisherUniversidad de Chilees_CL
Publisherdc.publisherPrograma Cybertesises_CL
Type of licensedc.rightsRecabal Guiraldes, Pabloes_CL
Keywordsdc.subjectElectricidades_CL
Keywordsdc.subjectRobóticaes_CL
Keywordsdc.subjectAprendizaje de máquinaes_CL
Keywordsdc.subjectToma de decisioneses_CL
Keywordsdc.subjectFútbol robóticoes_CL
Títulodc.titleAprendizaje Reforzado Orientado a la Toma de Decisiones en el Fútbol Robóticoes_CL
Document typedc.typeTesis


Files in this item

Icon

This item appears in the following Collection(s)

Show simple item record