Estudio de una dinámica adaptativa para juegos repetidos y su aplicación a un juego de congestión

El propósito de esta memoria es estudiar un modelo de aprendizaje en juegos repetidos. A diferencia de otros esquemas estudiados en la literatura, en este caso se estudia una situación en que los jugadores disponen de muy poca información, pudiendo observar solamente el pago recibido en cada etapa pero sin observar las estrategias usadas por los demá́s jugadores ni sus correspondientes pagos. En base a la información individual recolectada a medida que se desarrolla el juego, cada jugador genera una percepción del pago esperado de las distintas estrategias puras, y en base a estas percepciones adapta su comportamiento para las siguientes etapas del juego. En el capítulo 1 se presentan los modelos de las principales referencias bibliográficas, junto a los resultados mas relevantes que allí se obtienen. Se definen además las instancias y variantes a los modelos anteriores con las que se trabajará a lo largo de esta memoria. El capítulo 2 contiene todas las herramientas técnicas y conocimientos previos que fueron necesarias para desarrollar los resultados obtenidos. Se comienza con una sección de introducción a la topología diferencial, cuya principal referencia es el texto Topology from the differentiable viewpoint de Milnor, donde el resultado de mayor interés es el conocido Teorema de Poincaré-Hopf. En la siguiente sección se describen resultados referentes a martingalas, diferencias de martingalas y algunos teoremas de convergencia. La última sección está dedicada a estudiar los algoritmos de aproximación estocástica, basado en trabajos de las principales referencias en el tema, como Benaïm, Chen y Kushner. El capítulo 3 está dedicado a estudiar el proceso de aprendizaje propuesto, que consiste en una regla de actualización de las percepciones de los jugadores sobre su espacio de estrategias puras al enfrentarse a un juego repetido, los resultados asintóticos (cuando la iteración n tiende a ∞) guarda estrecha relación con una dinámica continua asociada, cuyos puntos estacionarios corresponden a los equilibrios de Nash de un juego potencial subyacente. Bajo la regla de decisión Logit y algunas condiciones sobre los parámetros del modelo, se obtienen interesantes resultados de convergencia casi segura y con probabilidad positiva a atractores de la dinámica continua. Finalmente en el capítulo 4 se estudia el modelo de Cominetti et al. [7], para unas instancias específicas (caso de 2 y 3 jugadores con 2 rutas) con el objetivo de contar a cantidad de equilibrios del sistema.

General note

Ingeniero Civil Matemático

Identifier

URI: https://repositorio.uchile.cl/handle/2250/112377

Collections

Tesis Pregrado