Aplicación de un modelo de aprendizaje basado en la experiencia a juegos de clasificación de adversarios
Professor Advisor
dc.contributor.advisor
Weber Haas, Richard
Author
dc.contributor.author
Muñoz Oliveros, Juan Andrés
Associate professor
dc.contributor.other
Figueroa González, Nicolás
Associate professor
dc.contributor.other
Escobar Castro, Juan
Admission date
dc.date.accessioned
2019-05-29T16:41:00Z
Available date
dc.date.available
2019-05-29T16:41:00Z
Publication date
dc.date.issued
2018
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/169226
General note
dc.description
Tesis para optar al grado de magíster en economía Aplicada
es_ES
General note
dc.description
Memoria para optar al título de Ingeniero Civil Industrial
Abstract
dc.description.abstract
Un juego de clasificación de adversarios típico considera un clasificador y un adversario, que
puede ser de tipo regular o malicioso. El clasificador debe intentar clasificar bien al adversario,
sin conocer su tipo; mientras que el adversario conoce las preferencias del clasificador, y puede
adaptar sus jugadas (tipo de mensaje enviado) para burlar la clasificación.
La literatura se ha centrado en modelar este juego desde distintos enfoques, siempre bus-
cando encontrar la estrategia óptima del adversario. Luego, con ella, se deduce la estrategia
óptima que debe seguir el clasificador. Las pruebas con datos reales han arrojado resultados
muy superiores a los algoritmos típicos de clasificación, que no incorporan técnicas de la
teoría de juegos.
En esta investigación se plantea un modelo basado en la estructura de los juegos de
señalización, que deja completamente de lado los supuestos de información pública sobre el
clasificador, y la capacidad de los jugadores de observar las acciones del otro.
Para ello, se introduce un algoritmo de aprendizaje mediante la regla de elección aleatoria
Logit, que los induce a adaptarse desde el ensayo y error. De esta manera los jugadores
son capaces de adaptar sus estrategias turno a turno, observando únicamente sus propias
estrategias y las utilidades obtenidas en el pasado.
Utilizando este modelo, los jugadores son capaces de converger rápidamente al equilibrio
bayesiano perfecto del juego, de manera mixta: los adversarios de tipo regular juegan estra-
tegias puras sobre su mensaje preferido, mientras que los de tipo malicioso juegan estrategias
mixtas entre los distintos mensajes disponibles. Por su parte, en el equilibrio las estrategias
del clasificador se han ajustado a la proporción de adversarios maliciosos que envía cada
mensaje en el equilibrio.
En el equilibrio de este juego, los adversarios maliciosos se mueven dinámicamente entre
los mensajes que escogen enviar, buscando burlar la clasificación. El error de clasificación
asociado a ellos oscila constantemente, incluso en el equilibrio; lo que demuestra un compor-
tamiento de gato y ratón constante entre el clasificador y los adversarios maliciosos.
La mayor contribución del modelo, es que logra capturar la evolución hacia el equilibrio,
las estrategias, el dinamismo del juego y la persecución constante entre los jugadores; sin que
estos se puedan observar directa o indirectamente en todo el juego.