Implementación de sistema de visualización de estabilidad de datos para verificar calidad de modelos predictivos de riesgo de impago en Entel
Professor Advisor
dc.contributor.advisor
Romero Godoy, Juan Pablo
Author
dc.contributor.author
Saavedra Torres, Francisca Carolina
Associate professor
dc.contributor.other
Nalda Reyes, José
Associate professor
dc.contributor.other
Segovia Riquelme, Carolina
Admission date
dc.date.accessioned
2025-07-08T21:20:33Z
Available date
dc.date.available
2025-07-08T21:20:33Z
Publication date
dc.date.issued
2025
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/205679
Abstract
dc.description.abstract
El presente proyecto tiene como objetivo asegurar la estabilidad de los datos que alimentan
los modelos de clasificación de clientes en el área de Analytics de Entel. En este contexto, la
estabilidad de los datos se entiende como la consistencia en la distribución estadística de las
variables a lo largo del tiempo. La estabilidad de estos datos es crucial, ya que los resultados
de la clasificación son utilizados por el área de Riesgo para estimar el nivel de provisión nece-
sario por temas de impago. Una variación del 1 % en la provisión puede impactar un 0.98 %
del EBITDA de Entel.
El sistema se implementó a través del Dashboard DataQuality en Variables, desarrollado
en Power BI, que automatiza el cálculo del Characteristic Stability Index (CSI). A dife-
rencia del sistema anterior, que no realizaba tratamientos específicos en la data, este nuevo
enfoque permite una evaluación más precisa del CSI al agregar tratamientos variable-modelo.
El proyecto siguió la metodología CRISP-DM debido a su enfoque sistemático y flexible,
ideal para la mejora continua de modelos predictivos. Esta metodología se adapta bien a en-
tornos complejos como el de Entel, ya que permite iterar sobre las distintas fases del proceso
analítico.
La implementación de filtros y tratamientos de datos permitió el cálculo desagregado del
CSI. Esta mejora redujo el tiempo promedio de revisión por variable de 4 horas a 30 minutos.
Esto se debe a que, cuando una variable presenta un CSI en rojo —cambio significativo en
su distribución entre dos periodos—, solo es necesario revisar los modelos en los que dicha
variable genera un CSI crítico, y no todos los modelos que la contienen.
Aunque se logró un cálculo CSI preciso, se identificaron áreas de oportunidad relacionadas
con la falta de estandarización de los datos. Estos factores provocaron retrasos en el tiem-
po de desarrollo. Como medida correctiva, se recomienda implementar inteligencia artificial
generativa para estandarizar los tratamientos de datos, lo que reduciría significativamente el
tiempo de preparación de la data.
El proyecto cumplió con los objetivos establecidos, destacando la creación de un sistema
de monitoreo de estabilidad de los datos que alimentan los modelos de scoreo de clientes
elaborados por Analytics Entel. Aunque el impacto económico directo es limitado, con ahorros
de aproximadamente 17 millones de CLP mensuales, su impacto estratégico es relevante al
permitir una respuesta ágil ante cambios en el comportamiento de los clientes.
es_ES
Lenguage
dc.language.iso
es
es_ES
Publisher
dc.publisher
Universidad de Chile
es_ES
Type of license
dc.rights
Attribution-NonCommercial-NoDerivs 3.0 United States