Sistema de búsqueda inteligente de direcciones para empresa de Distribución Postal
Tesis
Publication date
2021Metadata
Show full item record
Cómo citar
Puente Chandía, Alejandra
Cómo citar
Sistema de búsqueda inteligente de direcciones para empresa de Distribución Postal
Author
Professor Advisor
Abstract
El rubro postal es una de las actividades más antiguas del mundo, su primer uso documentado se encuentra en Egipto en el 2400 a.C. cuando los faraones utilizaban mensajeros para enviar decretos por todos los territorios del Estado. Actualmente, el mercado postal experimenta variaciones a medida que las exigencias de los clientes van cambiando. A nivel mundial, el mercado crece alrededor de un 4% anual y Chile no se ha quedado atrás. Según datos del INE 2018 el segmento de paquetería (paquetes y encomiendas) en Chile crece a un 8,1% anual, mientras que el segmento postal (cartas y documentos) se contrae a un 7,5% anual. Esto revela que los clientes están cambiando el uso de los servicios de correo, dejando de enviar cartas y documentos y aumentando el envío de encomiendas.
El aumento en el flujo de correos, la competencia creciente y los clientes cada vez más exigentes han demandado a las empresas optimizar sus procesos para asegurar un buen nivel de servicio. Por esta razón, los servicios de correos han implementado el código postal para optimizar el proceso de clasificación y distribución, el cual disminuye el tiempo y la posibilidad de cometer errores en el destino de los envíos. El proceso de asignación de un código postal a una dirección es llamado normalización. Sin embargo, en empresas que no poseen un sistema automático de normalización, la asignación de códigos la realizan operadores manualmente, lo que conlleva un costo mensual de más de $26 millones de pesos. Este costo puede ser mayor si se considera el mayor tiempo del envío en el sistema y el reproceso en caso de la corrección de un envío erróneo.
En esta memoria, se propone como solución un sistema de búsqueda inteligente de direcciones postales que permita normalizar automáticamente grandes volúmenes de direcciones utilizando modelos de procesamiento del lenguaje natural.
La solución propuesta plantea un clasificador de direcciones para segmentar y etiquetar sus atributos (nombre de calle, número principal e información adicional). El clasificador, además, verifica si posee un número principal bien definido, si no lo posee la dirección se identifica como inválida y no se normaliza, debido que el código postal requiere reconocer un frente de cuadra para poder ser asignado. Con las direcciones etiquetadas, se aplica un modelo coincidencia de texto utilizando la distancia de Levenshtein y el ratio de similitud de Levenshtein, generando un ranking con las tres direcciones más similares en base al puntaje ranking, para luego calcular el puntaje de selección. Finalmente, la dirección es normalizada si se cumplen los criterios de asignación. El modelo de coincidencia de texto con mejor rendimiento elimina abreviaturas que enuncian un tipo de calle (por ejemplo: PSJE o AVDA), calcula el puntaje ranking utilizando el ratio de similitud de Levenshtein y busca la coincidencia comparando la cadena completa de texto. Finalmente, se genera categorías de confiabilidad según el puntaje de selección para disminuir el error de la normalización
Al normalizar envíos de Quilicura a través de coincidencia directa, se logra un 20% de normalización. Al aplicar la solución propuesta, se alcanza sobre un 90% de normalización con un error asociado menor a 5%. Al utilizar las categorías de confiabilidad, se alcanza sobre 80% de normalización con un error asociado menor a 1%.
Esta memoria se limita a normalizar las direcciones a nivel de comuna y en zonas urbanas. Además, se entrenan los modelos utilizando solo direcciones de la comuna de Quilicura y Santiago.
General note
Memoria para optar al título de Ingeniero Civil Industrial
Identifier
URI: https://repositorio.uchile.cl/handle/2250/181650
Collections
The following license files are associated with this item: