Categorización de tickets de mesa de ayuda para una empresa de servicios informáticos a través de procesamiento de lenguaje natural
Professor Advisor
dc.contributor.advisor
Marín Vicuña, Pablo
Author
dc.contributor.author
Magnolfi Sanhueza, Franco Roberto
Associate professor
dc.contributor.other
Segovia Riquelme, Carolina
Associate professor
dc.contributor.other
Duarte Alleuy, Blas
Admission date
dc.date.accessioned
2024-05-30T22:42:49Z
Available date
dc.date.available
2024-05-30T22:42:49Z
Publication date
dc.date.issued
2023
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/198846
Abstract
dc.description.abstract
El trabajo descrito en el presente informe fue realizado en una empresa
chilena de servicios informáticos a estudios de abogados llamada Tecnolex.
Tecnolex hoy en día se encuentra en una situación en la que la información
que poseen algunas de sus áreas no está siendo de confianza. Una de estas
áreas corresponde al área de Helpdesk en la cual se realizó el trabajo.
Este correspondía a entregar un sistema que recomendara como
categorizar los tickets de soporte técnico que fueran generados por el área.
Un ticket cuenta con 2 formas de ser clasificados, por su atributo Tipo
Requerimiento y su atributo Categoría, los cuales cuentan con 3 y 14 clases
respectivamente. Para visualizar esta situación se tomó un subset de 10.000
tickets, en donde se descubrió que cerca del 40% de estos estaban mal
clasificados. También se descubrió que existe una tendencia a clasificar los
tickets con un cierto valor, en donde la clase Requerimiento corresponde a
aproximadamente el 85% de los tickets existentes. Esto supone un problema
para la empresa ya que se basan en esta información para la toma de
decisiones del área.
Para lograr clasificar los tickets se hizo uso de tres modelos de machine
learning: Regresión Logística, Support Vector Machine y un árbol de
clasificación. De los resultados obtenidos, se ha podido concluir que, si existe
un gran porcentaje de tickets que actualmente se encuentran mal clasificados,
que los modelos de clasificación serían una buena herramienta para clasificar
los tickets, y que el modelo que presenta mejores resultados corresponde a la
Regresión Logística, el cual permite clasificar los datos de forma correcta un
70% para tanto Tipo Requerimiento como la Categoría de los tickets.
También se logró descubrir que un mayor desbalance en la distribución de los
tickets produce peores resultados a la hora de querer clasificar los tickets, en
el caso del atributo Tipo Requerimiento mejoro las métricas de las clases con
menor cantidad de tickets en cerca de un 30%
es_ES
Lenguage
dc.language.iso
es
es_ES
Publisher
dc.publisher
Universidad de Chile
es_ES
Type of license
dc.rights
Attribution-NonCommercial-NoDerivs 3.0 United States