Evaluación de métodos para clasificación y búsqueda de textos jurídicos
Tesis

Access note
Acceso solo a metadatos
Publication date
2024Metadata
Show full item record
Cómo citar
Bustos Cárdenas, Benjamín
Cómo citar
Evaluación de métodos para clasificación y búsqueda de textos jurídicos
Professor Advisor
Abstract
El Consejo de Defensa del Estado (CDE) es un servicio público que tiene como misión
asesorar y defender los intereses del Estado de Chile y sus organismos. Cada caso en
el que el CDE participa se registra en un sistema de información, y los abogados deben
buscar demandas similares en este sistema, lo que puede ser laborioso debido a
clasificaciones erróneas y la poca frecuencia de ocurrencia de algunas demandas. Con
el creciente número de casos y sin un aumento en el número de abogados, es vital
mejorar los métodos de clasificación y búsqueda de documentos.
Este trabajo presenta la evaluación de diversos métodos de clasificación, desde los
tradicionales hasta los basados en aprendizaje automático y arquitecturas Transformer,
con el fin de clasificar eficazmente los documentos de demanda. Además, se evaluaron
distintos modelos, incluyendo modelos vectoriales y redes neuronales, para identificar
aquellos que mejoran la búsqueda de demandas similares en una base de datos.
Para alcanzar los objetivos, primero se revisó la literatura existente sobre clasificación y
búsqueda de documentos legales. Luego, se recolectaron los documentos necesarios
para probar los modelos. También se abordaron problemas adicionales, como la
extracción de texto de documentos que no siempre están bien digitalizados debido a
limitaciones técnicas o la antigüedad de los documentos. Posteriormente, se realizó la
codificación y preprocesamiento de los documentos, y se desarrollaron algoritmos para
entrenar y probar los modelos de clasificación y búsqueda.
Como resultado de la evaluación de los modelos de clasificación, se identificó que BETO
fue el modelo con el que se obtuvieron excelentes resultados, aunque se detectaron
algunas clasificaciones incorrectas en casos de documentos muy similares a una
demanda. En cuanto a los modelos de búsqueda, se encontraron dos modelos con
resultados que superan a los de los demás modelos y muy similares entre sí, sin
diferencias categóricas que permitieran declarar uno como mejor que el otro.
Utilizando estos resultados, se creó un producto mínimo viable que permite extraer texto
de documentos digitalizados, clasificar documentos en una base de datos y realizar
búsquedas de documentos similares a un texto proporcionado.
xmlui.dri2xhtml.METS-1.0.item-notadetesis.item
Tesis para optar al grado de Magíster en Tecnologías de la Computación
Collections
Evaluacion-de-metodos-para-clasificacion-y-busqueda-de-textos-juridicos.pdf (2.025Mb)