Optimización de estrategias de carrera con competencia en un juego suma-cero feedback stackelberg
Professor Advisor
dc.contributor.advisor
Thraves Cortés-Monroy, Charles
Author
dc.contributor.author
Aguad Castoldi, Felipe
Associate professor
dc.contributor.other
Sauré Valenzuela, Denis
Associate professor
dc.contributor.other
Ordóñez Pizarro, Fernando
Admission date
dc.date.accessioned
2023-10-24T14:43:09Z
Available date
dc.date.available
2023-10-24T14:43:09Z
Publication date
dc.date.issued
2023
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/196182
Abstract
dc.description.abstract
Optimizar las estrategias de paradas en pits en los deportes de motor no es trivial. La mayoría de los trabajos existentes descuidan la competencia o la consideran utilizando simulaciones o datos históricos, sin utilizar la teoría de juegos de manera completa. En este trabajo, presentamos un modelo basado en la Fórmula 1 en el que dos pilotos optimizan su estrategia de paradas en pits. Cada automóvil decide en cada vuelta si continuar en pista o hacer una parada en pits para cambiar los neumáticos a uno de los tres compuestos disponibles. Dado que las decisiones de los pilotos se afectan mutuamente debido a interacciones, tales como los adelantamientos; el problema se formula como un juego de Stackelberg de retroalimentación de suma-cero utilizando Programación Dinámica, donde en cada vuelta el piloto líder decide primero y el seguidor decide segundo. Además, los pilotos deciden simultáneamente los compuestos de neumáticos con los que comenzarán la carrera. La formulación permite la inclusión de eventos inciertos como banderas amarillas o aleatoriedad en los tiempos de vuelta.
Definimos y mostramos la existencia del equilibrio tanto del juego durante la carrera como del juego simultáneo antes de comenzar, y proporcionamos un algoritmo para encontrarlo en cada caso. Luego, resolvemos instancias numéricas del problema con cientos de millones de estados. Observamos cómo diferentes funciones objetivo de los pilotos inducen diferentes estrategias de carrera. En particular, cuando los jugadores maximizan la probabilidad de ganar en lugar de la diferencia de tiempo con respecto a su oponente, tienden a asumir acciones más riesgosas.
Nuestras instancias muestran que un piloto estratégico enfrentando a uno miope aumenta las probabilidades de ganar en más del 15 % en comparación con el caso en que ambos son estratégicos. Por último, carreras donde es más probable encontrarse con banderas amarillas tienden a aumentar las posibilidades de ganar del piloto con peor rendimiento.
es_ES
Lenguage
dc.language.iso
es
es_ES
Publisher
dc.publisher
Universidad de Chile
es_ES
Type of license
dc.rights
Attribution-NonCommercial-NoDerivs 3.0 United States