Aplicación de un modelo de aprendizaje basado en la experiencia a juegos de clasificación de adversarios
Tesis
Publication date
2018Metadata
Show full item record
Cómo citar
Weber Haas, Richard
Cómo citar
Aplicación de un modelo de aprendizaje basado en la experiencia a juegos de clasificación de adversarios
Author
Professor Advisor
Abstract
Un juego de clasificación de adversarios típico considera un clasificador y un adversario, que
puede ser de tipo regular o malicioso. El clasificador debe intentar clasificar bien al adversario,
sin conocer su tipo; mientras que el adversario conoce las preferencias del clasificador, y puede
adaptar sus jugadas (tipo de mensaje enviado) para burlar la clasificación.
La literatura se ha centrado en modelar este juego desde distintos enfoques, siempre bus-
cando encontrar la estrategia óptima del adversario. Luego, con ella, se deduce la estrategia
óptima que debe seguir el clasificador. Las pruebas con datos reales han arrojado resultados
muy superiores a los algoritmos típicos de clasificación, que no incorporan técnicas de la
teoría de juegos.
En esta investigación se plantea un modelo basado en la estructura de los juegos de
señalización, que deja completamente de lado los supuestos de información pública sobre el
clasificador, y la capacidad de los jugadores de observar las acciones del otro.
Para ello, se introduce un algoritmo de aprendizaje mediante la regla de elección aleatoria
Logit, que los induce a adaptarse desde el ensayo y error. De esta manera los jugadores
son capaces de adaptar sus estrategias turno a turno, observando únicamente sus propias
estrategias y las utilidades obtenidas en el pasado.
Utilizando este modelo, los jugadores son capaces de converger rápidamente al equilibrio
bayesiano perfecto del juego, de manera mixta: los adversarios de tipo regular juegan estra-
tegias puras sobre su mensaje preferido, mientras que los de tipo malicioso juegan estrategias
mixtas entre los distintos mensajes disponibles. Por su parte, en el equilibrio las estrategias
del clasificador se han ajustado a la proporción de adversarios maliciosos que envía cada
mensaje en el equilibrio.
En el equilibrio de este juego, los adversarios maliciosos se mueven dinámicamente entre
los mensajes que escogen enviar, buscando burlar la clasificación. El error de clasificación
asociado a ellos oscila constantemente, incluso en el equilibrio; lo que demuestra un compor-
tamiento de gato y ratón constante entre el clasificador y los adversarios maliciosos.
La mayor contribución del modelo, es que logra capturar la evolución hacia el equilibrio,
las estrategias, el dinamismo del juego y la persecución constante entre los jugadores; sin que
estos se puedan observar directa o indirectamente en todo el juego.
General note
Tesis para optar al grado de magíster en economía Aplicada Memoria para optar al título de Ingeniero Civil Industrial
Identifier
URI: https://repositorio.uchile.cl/handle/2250/169226
Collections
The following license files are associated with this item: