Sesgos de información al aprendizaje del consumidor mediante la planificación de surtido de productos
Professor Advisor
dc.contributor.advisor
Sauré Valenzuela, Denis
Author
dc.contributor.author
Solar Ituarte, Felipe del
Associate professor
dc.contributor.other
Modaresi, Sajad
Associate professor
dc.contributor.other
Thraves Cortés-Monroy, Charles
Associate professor
dc.contributor.other
Musalem Said, Andrés
Admission date
dc.date.accessioned
2025-05-14T21:31:08Z
Available date
dc.date.available
2025-05-14T21:31:08Z
Publication date
dc.date.issued
2024
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/204889
Abstract
dc.description.abstract
Esta tesis se enfoca en la planificación dinámica del surtido de productos, donde los consumidores toman decisiones de compra basadas en sus preferencias para maximizar su utilidad. Sin embargo, a diferencia de contextos tradicionales, este trabajo se adentra en un escenario donde tanto el minorista como los consumidores desconocen las calidades reales de los productos. Dónde estos últimos basan su decisión, o mejor dicho estiman la calidad de los productos, usando las opiniones de consumidores anteriores reflejadas en reseñas, un mecanismo que los lleva a caer en sesgos de información.
El proceso de elección sigue un modelo logit multinomial (MNL), donde los consumidores ajustan sus preferencias con estimaciones que dependen de las opiniones previas. Esto da a lugar a un proceso de aprendizaje por parte de los consumidores que permite al minorista a inferir la calidad observada de los productos a largo plazo.
Por otro lado, se aborda la optimización del surtido, comenzando por encontrar el mejor subconjunto de productos una vez que el proceso de aprendizaje sobre las calidades se estabiliza. Luego, para optimizar sobre todo el periodo se muestra el problema como una configuración de Multi-Armed Bandit en el que se busca una política dinámica de surtido. Dónde se define la pérdida de una política para el minorista como la diferencia acumulada entre su acción y la de un oráculo que sigue un modelo fluido con conocimiento previo de las calidades reales de los productos. Así, se encuentra una cota inferior para la pérdida de cualquier política consistente, la cual se debe principalmente a gastar tiempo (que se traduce en clientes o ingreso) en aprender las calidades de los productos. A partir de ello se logran diseñar políticas óptimas para el minorista basadas en explorar explotar de forma que consiga el mayor margen posible y aprendiendo eficientemente las calidades de los productos.
es_ES
Patrocinador
dc.description.sponsorship
Este trabajo ha sido parcialmente financiado por:
Asociación Nacional de Investigación y Desarrollo (ANID)
es_ES
Lenguage
dc.language.iso
es
es_ES
Publisher
dc.publisher
Universidad de Chile
es_ES
Type of license
dc.rights
Attribution-NonCommercial-NoDerivs 3.0 United States