Generación de un modelo de clasificación de Lead Scoring para una empresa SAAS
Tesis
Access note
Acceso abierto
Publication date
2023Metadata
Show full item record
Cómo citar
Segovia Riquelme, Carolina
Cómo citar
Generación de un modelo de clasificación de Lead Scoring para una empresa SAAS
Author
Professor Advisor
Abstract
Talana es una startup chilena líder dentro del mercado de software de recursos humanos la
cual ofrece 8 diferentes soluciones que ayudan a facilitar los procesos de recursos humanos de
cualquier organización, las cuales son: Gestión de Personas, Remuneraciones, Firma Digital,
Asistencia y Turnos, Desarrollo Organizacional, Centro de Requerimientos , Comunicaciones
y,Reclutamiento y Selección
Durante los últimos años, Talana ha experimentado un explosivo crecimiento lo cual ha
llevado a que la organización no disponga de capacidad y tiempo para realizar análisis en
profundidad, por lo que se continua trabajando de la misma manera. Esta situación ha im-
plicado que durante el último periodo no se ha superado la tasa de conversión histórica del
32 %, siendo que en periodos anteriores han logrado estar entre el 35 % y 40 %. Sumado a lo
anterior, también existe una tasa de clientes no-show cercana al 18 %, lo que se ve reflejado
en la pérdida de 88 horas de trabajo mensual, lo que equivale a $5.940.000 anuales. Es por
ello que en el proyecto se propone diseñar y generar un modelo de clasificación para predecir
la probabilidad de que un negocio se cierre en base a las características del lead.
Para llevar a cabo este proyecto se trabaja en base a la metodología Cross Industry Stan-
dard Process for Data Mining (CRISP - DM), esta comienza por el levantamiento de infor-
mación para comprender los objetivos y requisitos de la organización, luego se prepara la
data, para finalmente, construir los modelos, evaluarlos y seleccionar el idóneo. Cabe desta-
car que para efectos de esta memoria, sólo se llegará a la fase de evaluación de los modelos
predictivos. Y en cuanto a las técnicas de machine learning se aplicarán 4: regresión logística,
árboles de decisión, random forest y gradient boosting machine.
Como resultado de la construcción de los modelos se destaca el desempeño entregado por
los modelos gradient boosting machine y regresión logística entrenado con data balanceada
mediante la técnica de oversampling, debido a que estos predicen el estado final del negocio
con una exactitud del 73 % y 74 %, respectivamente, lo cual indica que son modelos con
un alto nivel de ajuste. Finalmente, se recomienda incorporar nuevas estrategias en el área
de ventas en base a la información extraída, además de fortalecer los modelos mediante la
incorporación de nuevas variables y datos de entrenamiento.
xmlui.dri2xhtml.METS-1.0.item-notadetesis.item
Memoria para optar al título de Ingeniera Civil Industrial
Identifier
URI: https://repositorio.uchile.cl/handle/2250/194914
Collections
The following license files are associated with this item: