Selección de covariables e hiperparámetros con Causal Random Forests: aplicaciones en experimentos aleatorios en salud
Tesis

Access note
Acceso abierto
Publication date
2025Metadata
Show full item record
Cómo citar
Schwartz Perlroth, Daniel
Cómo citar
Selección de covariables e hiperparámetros con Causal Random Forests: aplicaciones en experimentos aleatorios en salud
Professor Advisor
Abstract
Los algoritmos de Causal Random Forests (CRF) son una herramienta que permite esti-
mar efectos heterogéneos de tratamientos en experimentos aleatorios, permitiendo identificar
subgrupos de respuesta diferencial mediante modelos de aprendizaje automático. Sin em-
bargo, su fiabilidad puede depender críticamente de la calibración de hiperparámetros, la
selección de covariables y la evaluación rigurosa de robustez.
Esta tesis utiliza datos de dos experimentos de campo realizados en Chile, enfocados en
reducir la inasistencia a citas médicas y aumentar la participación en exámenes de mamogra-
fías mediante intervenciones de economía conductual con múltiples tratamientos aleatorios,
para evaluar la consistencia de los modelos CRF bajo múltiples especificaciones. Se imple-
menta una metodología sistemática que analiza cómo la calibración de hiperparámetros y la
selección de covariables pudiesen afectar la estimación de efectos causales heterogéneos, la
consistencia en la caracterización de subgrupos y la robustez de los hallazgos.
Los resultados revelan que, si bien la estimación del efecto promedio del tratamiento es
robusta a las especificaciones del modelo en ambos contextos, la capacidad para detectar
y caracterizar heterogeneidad varía sustancialmente según el experimento y la comparación
de tratamientos específicas de cada uno. En mamografías, donde se observó heterogeneidad
sustancial y sistemática entre tratamientos, el algoritmo logró identificar de forma estable y
consistente subgrupos de pacientes. En contraste, en citas médicas, donde la heterogeneidad
es débil o inexistente entre algunos tratamientos, las estimaciones mostraron baja consisten-
cia. Además, la reducción drástica de covariables incrementa sustancialmente el riesgo de
inestabilidad numérica, produciendo valores extremos en estimadores e hiperparámetros que
contradicen los resultados de especificaciones más completas.
Estos hallazgos concluyen que la aplicación de CRF exige análisis de sensibilidad exhausti-
vos a través de múltiples especificaciones de covariables, estrategias de calibración, y métricas
de evaluación. La metodología propuesta en esta tesis permite abordar este desafío, validan-
do la robustez de los hallazgos para cada contexto particular y estableciendo criterios claros
para determinar cuándo las estimaciones son suficientemente confiables para informar de-
cisiones de política. Más allá de las consideraciones metodológicas, este trabajo reafirma el
valor de las intervenciones conductuales en salud, identificando efectos promedio positivos y
significativos en ambos experimentos con beneficios clínicos y operacionales relevantes. De
esta forma, este estudio no solo contribuye al desarrollo metodológico de CRF en contextos
aplicados, sino que entrega un marco riguroso para su uso responsable en combinación con
experimentos aleatorios cuando existen oportunidades de análisis con grandes volúmenes de
datos.
xmlui.dri2xhtml.METS-1.0.item-notadetesis.item
Tesis para optar al grado de Magíster en Gestión de Operaciones Memoria para optar al título de Ingeniero Civil Industrial
Identifier
URI: https://repositorio.uchile.cl/handle/2250/209497
Collections
seleccion-de-covariables-e-hiperparametros-con-causal-random-forests.pdf (3.442Mb)