Análisis y automatización del procesamiento de requerimientos de la Ley de Transparencia en el Ministerio de Salud utilizando técnicas de procesamiento del lenguaje natural

Figueroa Guevara, Luis Hernán

Professor Advisor	dc.contributor.advisor	Ríos Pérez, Sebastián
Author	dc.contributor.author	Figueroa Guevara, Luis Hernán
Associate professor	dc.contributor.other	Contreras Piña, Constanza
Associate professor	dc.contributor.other	Wolff Rojas, Patricio
Admission date	dc.date.accessioned	2025-06-04T17:24:26Z
Available date	dc.date.available	2025-06-04T17:24:26Z
Publication date	dc.date.issued	2025
Identifier	dc.identifier.other	10.58011/pq88-qb09
Identifier	dc.identifier.uri	https://repositorio.uchile.cl/handle/2250/205291
Abstract	dc.description.abstract	La presente investigación se centra en la optimización del procesamiento de solicitudes de información recibidas por el Ministerio de Salud en el marco de la Ley de Transparencia, empleando técnicas avanzadas de Procesamiento del Lenguaje Natural. Mediante el desarrollo de modelos centrados en el reconocimiento de entidades nombradas y en la clasificación de solicitudes según el área de derivación, se buscó agilizar la respuesta institucional y aprovechar de manera más eficiente los recursos ministeriales. Los resultados muestran que las arquitecturas basadas en XLM-RoBERTa, con atención bidireccional, superan de manera consistente a modelos masivos tipo Large Language Models (LLM) entrenados con QLoRA, tanto en la tarea de clasificación como en la de reconocimiento de entidades. En la clasificación de áreas de derivación, la variante XLM-RoBERTa-Large sin distinción entre mayúsculas y minúsculas (uncased) alcanzó un F1-Score cercano a un 75%, lo que representa una mejora sustancial en comparación con los LLM que no superaron el 52%. En el reconocimiento de entidades nombradas, las diferencias fueron aún más marcadas, ya que la misma variante obtuvo cerca de un 83,5% de F1-Score, mientras que las soluciones basadas en LLM lograron resultados apenas superiores al 40%. La investigación demuestra, además, que las versiones uncased generan mayor estabilidad y robustez en los desempeños, reduciendo la complejidad en el espacio de representación lingüística. Aunque se observó cierto grado de sobreajuste, el modelo XLM-RoBERTa-Large uncased mantuvo una alta capacidad de generalización en las pruebas, evidenciando su aptitud para adaptarse al dominio específico con datos limitados. Estos hallazgos sientan las bases para extender el enfoque en el futuro, aumentando el volumen de información disponible, mejorando el etiquetado de datos y explorando arquitecturas sin atención causal, con el propósito de reforzar la precisión y la eficacia en el tratamiento automatizado de la información pública. De este modo, se espera contribuir a la eficiencia, transparencia y calidad del servicio que el Estado ofrece a la ciudadanía.	es_ES
Lenguage	dc.language.iso	es	es_ES
Publisher	dc.publisher	Universidad de Chile	es_ES
Type of license	dc.rights	Attribution-NonCommercial-NoDerivs 3.0 United States	*
Link to License	dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/us/	*
Título	dc.title	Análisis y automatización del procesamiento de requerimientos de la Ley de Transparencia en el Ministerio de Salud utilizando técnicas de procesamiento del lenguaje natural	es_ES
Document type	dc.type	Tesis	es_ES
dc.description.version	dc.description.version	Versión original del autor	es_ES
dcterms.accessRights	dcterms.accessRights	Acceso abierto	es_ES
Cataloguer	uchile.catalogador	chb	es_ES
Department	uchile.departamento	Escuela de Postgrado y Educación Continua	es_ES
Department	uchile.departamento	Departamento de Ingeniería Industrial
Faculty	uchile.facultad	Facultad de Ciencias Físicas y Matemáticas	es_ES
uchile.titulacion	uchile.titulacion	Doble Titulación	es_ES
uchile.gradoacademico	uchile.gradoacademico	Magister	es_ES
uchile.notadetesis	uchile.notadetesis	Tesis para optar al grado de Magíster en Ciencia de Datos	es_ES
uchile.notadetesis	uchile.notadetesis	Memoria para optar al título de Ingeniero Civil Industrial

Files in this item

Name:: Analisis-y-automatizacion-del- ...
Size:: 3.975Mb
Format:: PDF

This item appears in the following Collection(s)

Tesis Postgrado
Tesis Postgrado

Show simple item record

Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States