Diseño y desarrollo de un prototipo de analítica de texto para los clientes de retail de un helpdesk especializado en servicio al cliente
Tesis
![Thumbnail](/themes/Mirage2/images/cubierta.jpg)
Access note
Acceso abierto
Publication date
2024Metadata
Show full item record
Cómo citar
Segovia Riquelme, Carolina
Cómo citar
Diseño y desarrollo de un prototipo de analítica de texto para los clientes de retail de un helpdesk especializado en servicio al cliente
Author
Professor Advisor
Abstract
En el contexto de un mundo globalizado y saturado de información, las Tecnologías de la Información (TIC) desempeñan un papel crucial para la inserción efectiva de un Estado. Estas herramientas son fundamentales para potenciar el desarrollo económico y social al simplificar procesos y mejorar el acceso a la información. En este contexto, surge la iniciativa de ``Adereso'', una startup chilena establecida en 2014 que se autodenomina como proveedor de Software como Servicio (SaaS), operando en el sector de las TIC, específicamente en la subindustria de ``Application Software''. La cual tiene entre sus productos, Adereso Desk, un helpdesk que omnicanaliza los canales de atención al cliente digital de sus empresas usuarias.
Este proyecto tiene como objetivo crear un prototipo de Analítica de Texto mediante técnicas de Procesamiento del Lenguaje Natural. Se enfoca en analizar las interacciones cliente-agente de las empresas usuarias en el sector del retail de Adereso, abordando tres dimensiones clave: conteo de unigramas, bigramas y trigramas frecuentes, tipificación y análisis del Sentimiento de los Tickets. Para guiar el desarrollo, se adoptó la metodología CRISP-DM Lite, prescindiendo de un despliegue de la analítica. Se empleará un modelado descriptivo para la dimensión de conteo, mientras que para las otras dimensiones se implementarán modelos predictivos.
Para la dimensión de conteo de unigramas, bigramas y trigramas frecuentes, se desarrollaron 3 modelamientos para extraer los 20 unigramas, bigramas y trigramas más frecuentes. Los cuales fueron graficados y revelan los valiosos insights que se pueden obtener a través de este análisis.
En el caso de la dimensión de tipificación de tickets, se empleó un modelo bifásico. En la primera fase, se utilizó un modelo no supervisado, LDA, para determinar el número óptimo de tópicos en función del corpus, caracterizando y asignando cada uno de ellos a las conversaciones procesadas del helpdesk. La segunda fase consistió en la construcción de dos clasificadores: uno basado en una red neuronal recurrente LSTM y otro en el modelo transformer distilBERT. Este último demostró un rendimiento óptimo al equilibrar las clases, alcanzando un accuracy del 95.16\%, precision del 95.00\%, recall del 95.00\%, y f1-score del 95.00\%. Finalmente, en la dimensión de Análisis de Sentimiento, se empleó el modelo GPT-3.5 Turbo a través de su API. Comparando sus predicciones con un etiquetamiento manual realizado por el estudiante, se observó un rendimiento destacado con un 95.00\% de accuracy, 96.00\% de precision, 73.00\% de recall y 80.00\% de f1-score.
Por último, se ha dejado una propuesta de visualizaciones para integrar en un futuro en la plataforma, con el objetivo de que esto tenga un real impacto en los clientes de retail de Adereso. Junto con ello, se proponen mejoras y expansiones del análisis propuesto en el actual proyecto.
xmlui.dri2xhtml.METS-1.0.item-notadetesis.item
Memoria para optar al título de Ingeniero Civil Industrial
Collections
The following license files are associated with this item: