Sistema de análisis de tópicos para interacciones cliente-call center
Tesis
Publication date
2019Metadata
Show full item record
Cómo citar
Garretón Vénder, Claudio
Cómo citar
Sistema de análisis de tópicos para interacciones cliente-call center
Professor Advisor
Abstract
Actualmente vivimos en una era digital donde tanto la generación de datos como las capacidades computacionales evolucionan exponencialmente. Consecuentemente, muchos servicios nuevos surgen mientras que otros ven redefinida la forma en que se entregan. Un caso específico de ello son los call center, donde potenciales automatizaciones no solo representan reducción de costos para empresas, sino que también un mejor desempeño en su quehacer.
Con el objetivo de identificar de mejor forma la razón de llamada de los clientes al call center de los servicios móviles de Entel, se construye un sistema capaz de recibir breves transcripciones de las llamadas para determinar el motivo de las mismas. Dicho sistema se divide en dos componentes, una dedicada a clientes con suscripción y otra dedicada a clientes de prepago.
Para ello, se estudiaron diversas técnicas y formas de preprocesar los datos de entrada, optando finalmente por una configuración con remoción de caracteres inválidos, corrección de ortografía, uso de listas de stopwords, generación de n-gramas, lematización y stemming.
En primera instancia, el sistema propuesto consistió en el desarrollo de un clasificador basado en el modelo Latent Dirichlet Allocation. A pesar de que dicho esquema presentó resultados positivos en desempeño. El desarrollo y uso de este se mostró difícil de sostener en el tiempo puesto que el ejercicio de traducir la salida del modelo LDA a una etiqueta legible es poco estable.
En consecuencia, se propuso e implementó un nuevo sistema con un modelo supervisado que recibe como entrada el vector entero que el modelo LDA anteriormente ajustado retornaba. Con esta implementación y gracias a la adición de datos categóricos asociados a la acción a realizar para solucionar el problema por el cual llaman los clientes, se obtuvieron fuertes mejorías en el desempeño global del sistema.
Finalmente, el sistema desarrollado tuvo un desempeño en Fscore ponderado de 0,78 para la base de clientes suscritos y de 0,88 para la base de clientes de prepago. La principal causa tras el menor desempeño en suscritos corresponde al fuerte desbalance que hay entre los motivos de llamada. Dicho desbalance provocó capacidades de predicción dispares entre las clases beneficiando aquellas de mayor frecuencia en la base.
El sistema creado fue desarrollado completamente a través del software Python apoyado en la librería Gensim para el desarrollo del modelo LDA y la librería Scikit-learn para los algoritmos de aprendizaje supervisado. Gracias a esta forma de desarrollo, la componente predictora del sistema queda preparada para predecir como para actualizarse en futuro con nuevos requerimientos al call center.
General note
Memoria para optar al título de Ingeniero Civil Eléctrico
Patrocinador
Entel S.A.
Identifier
URI: https://repositorio.uchile.cl/handle/2250/174906
Collections
The following license files are associated with this item: