Show simple item record

Professor Advisordc.contributor.advisorCerda Villablanca, Mauricio
Authordc.contributor.authorUrbina Lara, Claudio Isaías
Associate professordc.contributor.otherBravo Márquez, Felipe
Admission datedc.date.accessioned2026-01-12T16:01:40Z
Available datedc.date.available2026-01-12T16:01:40Z
Publication datedc.date.issued2025
Identifierdc.identifier.urihttps://repositorio.uchile.cl/handle/2250/208305
Abstractdc.description.abstractEsta tesis propone una estrategia flexible para automatizar la identificación de publicaciones científicas que emplean datos obtenidos mediante instrumentos o telescopios de la ESO en el ámbito de descubrimientos astrofísicos. Mediante el uso de modelos basados en transformers, se abordan los desafíos clave que enfrentan las instituciones de investigación al rastrear el impacto científico de sus observatorios astronómicos. En este contexto, se desarrollaron y evaluaron dos modelos complementarios: el Usage Model, diseñado para detectar publicaciones que utilizan datos de ESO, y el Purpose Model, enfocado en clasificar si una publicación está orientada principalmente a descubrimientos astrofísicos. El Usage Model implementa un enfoque de clasificación de texto condicional basado en entradas estructuradas, logrando una puntuación F1 de 0.93. Su capacidad de adaptarse a telescopios e instrumentos no vistos previamente demuestra su escalabilidad para futuras aplicaciones. Por su parte, el Purpose Model alcanza un rendimiento sobresaliente con una puntuación F1 de 0.95, diferenciando con alta precisión investigaciones destinadas a descubrimientos astrofísicos. Al combinar ambos modelos, se logra un 90% de precisión en la clasificación, procesando publicaciones entre 300 y 600 veces más rápido que el actual proceso manual no automatizado. Además, el método propuesto supera al estado del arte vigente, el cual alcanzó un 72% en precisión, evidenciando una mejora significativa en el rendimiento. Entre las principales innovaciones de esta investigación se incluye una estrategia de clasificación de texto condicional adaptada a escenarios con etiquetado suave, teniendo en cuenta las limitaciones inherentes a las anotaciones en entornos del mundo real. Los resultados confirman la hipótesis de que los modelos basados en transformers, ajustados a conjuntos de datos específicos del dominio, pueden proporcionar mejoras sustanciales en la eficiencia del análisis de publicaciones científicas, tanto en términos de rendimiento como de velocidad. En conclusión, esta tesis optimiza los flujos de trabajo para instituciones como la ESO y propone una estrategia extensible a otros dominios que requieren la clasificación del uso de instrumentos diversos. Al automatizar la identificación del uso de datos y el propósito investigativo, esta investigación contribuye significativamente al avance de la toma de decisiones basada en datos y al fomento del descubrimiento científico.es_ES
Lenguagedc.language.isoenes_ES
Publisherdc.publisherUniversidad de Chilees_ES
Type of licensedc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
Link to Licensedc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
Keywordsdc.subjectObservatorios astronómicoses_ES
Keywordsdc.subjectPublicaciones científicases_ES
Keywordsdc.subjectProcesamiento de lenguaje natural (Ciencia de la computación)es_ES
Títulodc.titleIdentifying ESO data usage in scientific publications for astrophysical discoveries through Natural Language Processinges_ES
Document typedc.typeTesises_ES
dc.description.versiondc.description.versionVersión original del autores_ES
dcterms.accessRightsdcterms.accessRightsAcceso abiertoes_ES
Catalogueruchile.catalogadorchbes_ES
Facultyuchile.facultadFacultad de Ciencias Físicas y Matemáticases_ES
uchile.gradoacademicouchile.gradoacademicoMagisteres_ES
uchile.notadetesisuchile.notadetesisTesis para optar al grado de Magíster en Ciencia de los datoses_ES


Files in this item

Icon

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 United States
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States