Sistema de análisis de tópicos para interacciones cliente-call center
Professor Advisor
dc.contributor.advisor
Garretón Vénder, Claudio
Author
dc.contributor.author
Nicolai Manaut, Francisco Ignacio
Associate professor
dc.contributor.other
Orchard Concha, Marcos
Associate professor
dc.contributor.other
Weber Haas, Richard
Admission date
dc.date.accessioned
2020-05-23T01:34:13Z
Available date
dc.date.available
2020-05-23T01:34:13Z
Publication date
dc.date.issued
2019
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/174906
General note
dc.description
Memoria para optar al título de Ingeniero Civil Eléctrico
es_ES
Abstract
dc.description.abstract
Actualmente vivimos en una era digital donde tanto la generación de datos como las capacidades computacionales evolucionan exponencialmente. Consecuentemente, muchos servicios nuevos surgen mientras que otros ven redefinida la forma en que se entregan. Un caso específico de ello son los call center, donde potenciales automatizaciones no solo representan reducción de costos para empresas, sino que también un mejor desempeño en su quehacer.
Con el objetivo de identificar de mejor forma la razón de llamada de los clientes al call center de los servicios móviles de Entel, se construye un sistema capaz de recibir breves transcripciones de las llamadas para determinar el motivo de las mismas. Dicho sistema se divide en dos componentes, una dedicada a clientes con suscripción y otra dedicada a clientes de prepago.
Para ello, se estudiaron diversas técnicas y formas de preprocesar los datos de entrada, optando finalmente por una configuración con remoción de caracteres inválidos, corrección de ortografía, uso de listas de stopwords, generación de n-gramas, lematización y stemming.
En primera instancia, el sistema propuesto consistió en el desarrollo de un clasificador basado en el modelo Latent Dirichlet Allocation. A pesar de que dicho esquema presentó resultados positivos en desempeño. El desarrollo y uso de este se mostró difícil de sostener en el tiempo puesto que el ejercicio de traducir la salida del modelo LDA a una etiqueta legible es poco estable.
En consecuencia, se propuso e implementó un nuevo sistema con un modelo supervisado que recibe como entrada el vector entero que el modelo LDA anteriormente ajustado retornaba. Con esta implementación y gracias a la adición de datos categóricos asociados a la acción a realizar para solucionar el problema por el cual llaman los clientes, se obtuvieron fuertes mejorías en el desempeño global del sistema.
Finalmente, el sistema desarrollado tuvo un desempeño en Fscore ponderado de 0,78 para la base de clientes suscritos y de 0,88 para la base de clientes de prepago. La principal causa tras el menor desempeño en suscritos corresponde al fuerte desbalance que hay entre los motivos de llamada. Dicho desbalance provocó capacidades de predicción dispares entre las clases beneficiando aquellas de mayor frecuencia en la base.
El sistema creado fue desarrollado completamente a través del software Python apoyado en la librería Gensim para el desarrollo del modelo LDA y la librería Scikit-learn para los algoritmos de aprendizaje supervisado. Gracias a esta forma de desarrollo, la componente predictora del sistema queda preparada para predecir como para actualizarse en futuro con nuevos requerimientos al call center.