Análisis y automatización del procesamiento de requerimientos de la Ley de Transparencia en el Ministerio de Salud utilizando técnicas de procesamiento del lenguaje natural
Professor Advisor
dc.contributor.advisor
Ríos Pérez, Sebastián
Author
dc.contributor.author
Figueroa Guevara, Luis Hernán
Associate professor
dc.contributor.other
Contreras Piña, Constanza
Associate professor
dc.contributor.other
Wolff Rojas, Patricio
Admission date
dc.date.accessioned
2025-06-04T17:24:26Z
Available date
dc.date.available
2025-06-04T17:24:26Z
Publication date
dc.date.issued
2025
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/205291
Abstract
dc.description.abstract
La presente investigación se centra en la optimización del procesamiento de solicitudes de información recibidas por el Ministerio de Salud en el marco de la Ley de Transparencia, empleando técnicas avanzadas de Procesamiento del Lenguaje Natural. Mediante el desarrollo de modelos centrados en el reconocimiento de entidades nombradas y en la clasificación de solicitudes según el área de derivación, se buscó agilizar la respuesta institucional y aprovechar de manera más eficiente los recursos ministeriales.
Los resultados muestran que las arquitecturas basadas en XLM-RoBERTa, con atención bidireccional, superan de manera consistente a modelos masivos tipo Large Language Models (LLM) entrenados con QLoRA, tanto en la tarea de clasificación como en la de reconocimiento de entidades. En la clasificación de áreas de derivación, la variante XLM-RoBERTa-Large sin distinción entre mayúsculas y minúsculas (uncased) alcanzó un F1-Score cercano a un 75%, lo que representa una mejora sustancial en comparación con los LLM que no superaron el 52%. En el reconocimiento de entidades nombradas, las diferencias fueron aún más marcadas, ya que la misma variante obtuvo cerca de un 83,5% de F1-Score, mientras que las soluciones basadas en LLM lograron resultados apenas superiores al 40%.
La investigación demuestra, además, que las versiones uncased generan mayor estabilidad y robustez en los desempeños, reduciendo la complejidad en el espacio de representación lingüística. Aunque se observó cierto grado de sobreajuste, el modelo XLM-RoBERTa-Large uncased mantuvo una alta capacidad de generalización en las pruebas, evidenciando su aptitud para adaptarse al dominio específico con datos limitados. Estos hallazgos sientan las bases para extender el enfoque en el futuro, aumentando el volumen de información disponible, mejorando el etiquetado de datos y explorando arquitecturas sin atención causal, con el propósito de reforzar la precisión y la eficacia en el tratamiento automatizado de la información pública. De este modo, se espera contribuir a la eficiencia, transparencia y calidad del servicio que el Estado ofrece a la ciudadanía.
es_ES
Lenguage
dc.language.iso
es
es_ES
Publisher
dc.publisher
Universidad de Chile
es_ES
Type of license
dc.rights
Attribution-NonCommercial-NoDerivs 3.0 United States
Análisis y automatización del procesamiento de requerimientos de la Ley de Transparencia en el Ministerio de Salud utilizando técnicas de procesamiento del lenguaje natural
es_ES
Document type
dc.type
Tesis
es_ES
dc.description.version
dc.description.version
Versión original del autor
es_ES
dcterms.accessRights
dcterms.accessRights
Acceso abierto
es_ES
Cataloguer
uchile.catalogador
chb
es_ES
Department
uchile.departamento
Escuela de Postgrado y Educación Continua
es_ES
Department
uchile.departamento
Departamento de Ingeniería Industrial
Faculty
uchile.facultad
Facultad de Ciencias Físicas y Matemáticas
es_ES
uchile.titulacion
uchile.titulacion
Doble Titulación
es_ES
uchile.gradoacademico
uchile.gradoacademico
Magister
es_ES
uchile.notadetesis
uchile.notadetesis
Tesis para optar al grado de Magíster en Ciencia de Datos
es_ES
uchile.notadetesis
uchile.notadetesis
Memoria para optar al título de Ingeniero Civil Industrial