Categorización de tickets de mesa de ayuda para una empresa de servicios informáticos a través de procesamiento de lenguaje natural
Tesis
Open/ Download
Access note
Acceso abierto
Publication date
2023Metadata
Show full item record
Cómo citar
Marín Vicuña, Pablo
Cómo citar
Categorización de tickets de mesa de ayuda para una empresa de servicios informáticos a través de procesamiento de lenguaje natural
Professor Advisor
Abstract
El trabajo descrito en el presente informe fue realizado en una empresa
chilena de servicios informáticos a estudios de abogados llamada Tecnolex.
Tecnolex hoy en día se encuentra en una situación en la que la información
que poseen algunas de sus áreas no está siendo de confianza. Una de estas
áreas corresponde al área de Helpdesk en la cual se realizó el trabajo.
Este correspondía a entregar un sistema que recomendara como
categorizar los tickets de soporte técnico que fueran generados por el área.
Un ticket cuenta con 2 formas de ser clasificados, por su atributo Tipo
Requerimiento y su atributo Categoría, los cuales cuentan con 3 y 14 clases
respectivamente. Para visualizar esta situación se tomó un subset de 10.000
tickets, en donde se descubrió que cerca del 40% de estos estaban mal
clasificados. También se descubrió que existe una tendencia a clasificar los
tickets con un cierto valor, en donde la clase Requerimiento corresponde a
aproximadamente el 85% de los tickets existentes. Esto supone un problema
para la empresa ya que se basan en esta información para la toma de
decisiones del área.
Para lograr clasificar los tickets se hizo uso de tres modelos de machine
learning: Regresión Logística, Support Vector Machine y un árbol de
clasificación. De los resultados obtenidos, se ha podido concluir que, si existe
un gran porcentaje de tickets que actualmente se encuentran mal clasificados,
que los modelos de clasificación serían una buena herramienta para clasificar
los tickets, y que el modelo que presenta mejores resultados corresponde a la
Regresión Logística, el cual permite clasificar los datos de forma correcta un
70% para tanto Tipo Requerimiento como la Categoría de los tickets.
También se logró descubrir que un mayor desbalance en la distribución de los
tickets produce peores resultados a la hora de querer clasificar los tickets, en
el caso del atributo Tipo Requerimiento mejoro las métricas de las clases con
menor cantidad de tickets en cerca de un 30%
xmlui.dri2xhtml.METS-1.0.item-notadetesis.item
Memoria para optar al título de Ingeniero Civil Industrial
Identifier
URI: https://repositorio.uchile.cl/handle/2250/198846
Collections
The following license files are associated with this item: