Predicción de visitas a centros comerciales utilizando reseñas en línea y datos de movilidad
Tesis

Access note
Acceso abierto
Publication date
2025Metadata
Show full item record
Cómo citar
Goic Figueroa, Marcel
Cómo citar
Predicción de visitas a centros comerciales utilizando reseñas en línea y datos de movilidad
Author
Professor Advisor
Abstract
Los centros comerciales son espacios clave para la actividad económica, social y cultural. Conocer quiénes los visitan y por qué permite generar propuestas más adecuadas a sus necesidades. Tradicionalmente, se recurre a encuestas y reportes empresariales para obtener esta información, pero estas fuentes presentan limitaciones en alcance y profundidad. Para superar estas limitaciones, los datos de movilidad y las reseñas en línea emergen como herramientas innovadoras. Los datos de movilidad ofrecen un seguimiento dinámico de los desplazamientos, mientras que las reseñas capturan las percepciones y experiencias de los usuarios. Al integrar estas fuentes, se obtiene una visión más completa sobre la elección de un centro comercial.
Con el objetivo de profundizar en el análisis de las reseñas en línea, en esta investigación se utilizaron diversas metodologías para clasificarlas, incluyendo técnicas de machine learning, análisis semántico y GPT-4. Entre estas, GPT-4 demostró ser la más efectiva, permitiendo categorizar las reseñas en positivas y negativas según criterios clave como Acceso, Entretenimiento, Variedad, Limpieza, Seguridad y Precios. Este enfoque facilitó la evaluación del desempeño de cada centro comercial en estos aspectos.
Posteriormente, se desarrollaron dos enfoques de modelos: uno que predice la probabilidad de visita y luego estima las visitas mediante regresión, y otro que predice directamente las visitas. Ambos enfoques utilizaron algoritmos como Random Forest y XGBoost, incorporando variables sociodemográficas, de transporte, de movilidad, de infraestructura y la clasificación de reseñas realizada con GPT-4. Los resultados mostraron que el enfoque que predice directamente las visitas es superior, con un error porcentual del total de visitas promedio del 4\% en comparación con el 27\% del otro enfoque. Además, aunque la inclusión de reseñas no generó diferencias significativas en la precisión, el modelo híbrido (que combina variables tradicionales y de reseñas) mostró un mejor rendimiento. Entre las variables de reseñas más importantes del modelo híbrido, destacaron las relacionadas a la limpieza y precios, lo que indica que estos factores subjetivos complementan a las variables tradicionales.
Finalmente, se realizaron simulaciones con el modelo híbrido, las cuales revelaron que trabajar con variables derivadas de reseñas es más complejo, ya que estas no son tan directas ni manipulables como las características físicas. Aunque las reseñas reflejan percepciones influenciadas por cambios en la infraestructura, no pueden tratarse como independientes sin riesgo de supuestos inexactos. Por ello, los modelos basados en características físicas son más prácticos para simulaciones, mientras que las reseñas se recomiendan como una herramienta complementaria para comprender mejor la experiencia de los usuarios y enriquecer la toma de decisiones.
xmlui.dri2xhtml.METS-1.0.item-notadetesis.item
Tesis para optar al grado de Magíster en Ciencia de Datos
Identifier
URI: https://repositorio.uchile.cl/handle/2250/208161
Collections
The following license files are associated with this item:
prediccion-de-visitas-a-centros-comerciales-utilizando-resenas-en-linea-y-datos-de-movilidad.pdf (5.588Mb)