Prototipo de clasificador multiclase para relatos médicos
Tesis
Publication date
2021Metadata
Show full item record
Cómo citar
Pérez Rojas, Jorge
Cómo citar
Prototipo de clasificador multiclase para relatos médicos
Author
Professor Advisor
Abstract
En Chile, todas las entidades empleadoras del país deben estar afiliadas a un organismo administrador del Seguro Social contra Riesgos de Accidentes del Trabajo y Enfermedades Profesionales. La ACHS es uno de estos organismos.
Cuando un trabajador de una entidad afiliada a la ACHS sufre un accidente laboral, recurre a una de las sedes de la ACHS donde recibe atención médica. En este proceso, se generan relatos y textos escritos por distintos trabajadores de la ACHS. Además, el siniestro ocurrido al trabajador debe ser clasificado en distintas categorías.
Actualmente, la clasificación de los textos es realizada manualmente por trabajadores de la ACHS. Debido a que existen alrededor de 3000 categorías, existe un porcentaje no menor de textos que son clasificados erróneamente.
En este proyecto implementamos un prototipo de clasificador de textos médicos que esperamos en el futuro sirva como una ayuda a la toma de decisiones para los trabajadores de la ACHS que deben clasificar estos textos. Esperamos que el prototipo implementado sirva como una base para implementar un clasificador que disminuya el porcentaje de errores cometidos, además de unificar los criterios de las personas encargadas de clasificar los textos.
En los últimos años se han realizado grandes avances en el campo del procesamiento de lenguaje natural (PLN). En este proyecto utilizamos dos arquitecturas de Deep Learning para implementar clasificadores de relatos médicos. La primera es BiLSTM, que utilizamos como un baseline para nuestro modelo final basado en BERT. También implementamos otro baseline basado en un modelo más simple llamado Naive Bayes.
De los resultados concluimos que BERT es la mejor alternativa para realizar esta tarea, obteniendo los resultados más equilibrados. También observamos que al disminuir el tamaño del universo de categorías en las que puede ser clasificado un relato, las métricas reportadas aumentan su valor significativamente. Debido a esto, un trabajo importante a realizar en el futuro es disminuir la cantidad de categorías en las que un relato puede ser clasificado. Una forma de llevar esto a cabo es ordenarlas jerárquicamente, y utilizar los clasificadores implementados en este proyecto para obtener una clasificación general de los relatos.
General note
Memoria para optar al título de Ingeniero Civil en Computación
Identifier
URI: https://repositorio.uchile.cl/handle/2250/181636
Collections
The following license files are associated with this item: