Aplicación de un modelo de aprendizaje basado en la experiencia a juegos de clasificación de adversarios

Un juego de clasificación de adversarios típico considera un clasificador y un adversario, que puede ser de tipo regular o malicioso. El clasificador debe intentar clasificar bien al adversario, sin conocer su tipo; mientras que el adversario conoce las preferencias del clasificador, y puede adaptar sus jugadas (tipo de mensaje enviado) para burlar la clasificación. La literatura se ha centrado en modelar este juego desde distintos enfoques, siempre bus- cando encontrar la estrategia óptima del adversario. Luego, con ella, se deduce la estrategia óptima que debe seguir el clasificador. Las pruebas con datos reales han arrojado resultados muy superiores a los algoritmos típicos de clasificación, que no incorporan técnicas de la teoría de juegos. En esta investigación se plantea un modelo basado en la estructura de los juegos de señalización, que deja completamente de lado los supuestos de información pública sobre el clasificador, y la capacidad de los jugadores de observar las acciones del otro. Para ello, se introduce un algoritmo de aprendizaje mediante la regla de elección aleatoria Logit, que los induce a adaptarse desde el ensayo y error. De esta manera los jugadores son capaces de adaptar sus estrategias turno a turno, observando únicamente sus propias estrategias y las utilidades obtenidas en el pasado. Utilizando este modelo, los jugadores son capaces de converger rápidamente al equilibrio bayesiano perfecto del juego, de manera mixta: los adversarios de tipo regular juegan estra- tegias puras sobre su mensaje preferido, mientras que los de tipo malicioso juegan estrategias mixtas entre los distintos mensajes disponibles. Por su parte, en el equilibrio las estrategias del clasificador se han ajustado a la proporción de adversarios maliciosos que envía cada mensaje en el equilibrio. En el equilibrio de este juego, los adversarios maliciosos se mueven dinámicamente entre los mensajes que escogen enviar, buscando burlar la clasificación. El error de clasificación asociado a ellos oscila constantemente, incluso en el equilibrio; lo que demuestra un compor- tamiento de gato y ratón constante entre el clasificador y los adversarios maliciosos. La mayor contribución del modelo, es que logra capturar la evolución hacia el equilibrio, las estrategias, el dinamismo del juego y la persecución constante entre los jugadores; sin que estos se puedan observar directa o indirectamente en todo el juego.

General note

Tesis para optar al grado de magíster en economía Aplicada

Memoria para optar al título de Ingeniero Civil Industrial

Identifier

URI: https://repositorio.uchile.cl/handle/2250/169226

Collections