Show simple item record

Professor Advisordc.contributor.advisorRíos Pérez, Sebastián
Authordc.contributor.authorFigueroa Guevara, Luis Hernán
Associate professordc.contributor.otherContreras Piña, Constanza
Associate professordc.contributor.otherWolff Rojas, Patricio
Admission datedc.date.accessioned2025-06-04T17:24:26Z
Available datedc.date.available2025-06-04T17:24:26Z
Publication datedc.date.issued2025
Identifierdc.identifier.urihttps://repositorio.uchile.cl/handle/2250/205291
Abstractdc.description.abstractLa presente investigación se centra en la optimización del procesamiento de solicitudes de información recibidas por el Ministerio de Salud en el marco de la Ley de Transparencia, empleando técnicas avanzadas de Procesamiento del Lenguaje Natural. Mediante el desarrollo de modelos centrados en el reconocimiento de entidades nombradas y en la clasificación de solicitudes según el área de derivación, se buscó agilizar la respuesta institucional y aprovechar de manera más eficiente los recursos ministeriales. Los resultados muestran que las arquitecturas basadas en XLM-RoBERTa, con atención bidireccional, superan de manera consistente a modelos masivos tipo Large Language Models (LLM) entrenados con QLoRA, tanto en la tarea de clasificación como en la de reconocimiento de entidades. En la clasificación de áreas de derivación, la variante XLM-RoBERTa-Large sin distinción entre mayúsculas y minúsculas (uncased) alcanzó un F1-Score cercano a un 75%, lo que representa una mejora sustancial en comparación con los LLM que no superaron el 52%. En el reconocimiento de entidades nombradas, las diferencias fueron aún más marcadas, ya que la misma variante obtuvo cerca de un 83,5% de F1-Score, mientras que las soluciones basadas en LLM lograron resultados apenas superiores al 40%. La investigación demuestra, además, que las versiones uncased generan mayor estabilidad y robustez en los desempeños, reduciendo la complejidad en el espacio de representación lingüística. Aunque se observó cierto grado de sobreajuste, el modelo XLM-RoBERTa-Large uncased mantuvo una alta capacidad de generalización en las pruebas, evidenciando su aptitud para adaptarse al dominio específico con datos limitados. Estos hallazgos sientan las bases para extender el enfoque en el futuro, aumentando el volumen de información disponible, mejorando el etiquetado de datos y explorando arquitecturas sin atención causal, con el propósito de reforzar la precisión y la eficacia en el tratamiento automatizado de la información pública. De este modo, se espera contribuir a la eficiencia, transparencia y calidad del servicio que el Estado ofrece a la ciudadanía.es_ES
Lenguagedc.language.isoeses_ES
Publisherdc.publisherUniversidad de Chilees_ES
Type of licensedc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
Link to Licensedc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
Títulodc.titleAnálisis y automatización del procesamiento de requerimientos de la Ley de Transparencia en el Ministerio de Salud utilizando técnicas de procesamiento del lenguaje naturales_ES
Document typedc.typeTesises_ES
dc.description.versiondc.description.versionVersión original del autores_ES
dcterms.accessRightsdcterms.accessRightsAcceso abiertoes_ES
Catalogueruchile.catalogadorchbes_ES
Departmentuchile.departamentoEscuela de Postgrado y Educación Continuaes_ES
Departmentuchile.departamentoDepartamento de Ingeniería Industrial
Facultyuchile.facultadFacultad de Ciencias Físicas y Matemáticases_ES
uchile.titulacionuchile.titulacionDoble Titulaciónes_ES
uchile.gradoacademicouchile.gradoacademicoMagisteres_ES
uchile.notadetesisuchile.notadetesisTesis para optar al grado de Magíster en Ciencia de Datoses_ES
uchile.notadetesisuchile.notadetesisMemoria para optar al título de Ingeniero Civil Industrial


Files in this item

Icon

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 United States
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States