Embedded regression method based on dempster-shafer theory
Tesis
Publication date
2020Metadata
Show full item record
Cómo citar
Baloian Tataryan, Nelson
Cómo citar
Embedded regression method based on dempster-shafer theory
Author
Professor Advisor
Abstract
Los métodos de aprendizaje supervisado son cada vez más complejos y han ganado popularidad en variadas áreas de estudio. Métodos como las redes neuronales comúnmente son tratados como cajas negras, esto significa que se desconoce su funcionamiento interno por lo que se les trata como máquinas de entrada y salida. Estos métodos son preferidos por sobre métodos más simples debido a su fácil uso y buen rendimiento. Sin embargo, debido a su complejidad se desconocen las razones que determinan los resultados obtenidos. Esto ha generado problemas en áreas como la medicina, justicia y finanzas, donde vidas humanas se han visto perjudicadas. Aunque se ha dejado de lado el uso de métodos más simples por métodos más complejos, aún se requiere de éstos para aplicaciones de alto impacto.
Por esta razón, en este trabajo se desarrolla un método de regresión transparente basado en la teoría de Dempster-Shafer. Esta fue utilizada debido a su desempeño y simplicidad, donde una predicción puede ser explicada debido a la importancia o peso que tienen los casos que constituyen el conjunto de entrenamiento. El método computa una función de similitud de los vectores observados para producir una salida usando una distancia ponderada. La importancia de cada una de las dimensiones de la entrada es aprendida durante la fase de entrenamiento usando descenso de gradiente.
El método inicialmente fue puesto a prueba con datos sintéticos y conjuntos de datos conocidos, en donde se comparó su desempeño en tareas de selección de características y predicción. Los resultados obtenidos fueron comparables a los métodos de regresión más conocidos. Posteriormente, se utilizaron dos casos de estudio, en los cuales el método fue comparado con métodos del estado del arte. El primer caso fue el pronóstico de entradas de clientes en tiendas de retail. En éste se predijo un mes de entradas esperadas de clientes con resultados muy similares a los métodos aplicados comúnmente. El segundo caso estudiado en esta tesis fue la predicción de gastos médicos de pacientes en un hospital japonés. Para esto se utilizaron registros de pacientes en períodos anteriores. El método pudo detectar que para poder predecir los costos médicos es suficiente con solo usar los gastos anteriores de un paciente, como ha sido insinuado con anterioridad en la literatura.
Finalmente, se concluye la validez del método propuesto, aún siendo éste un método transparente. Esto debido a que una predicción puede ser seguida fácilmente mediante la importancia de las dimensiones de la entrada junto con la importancia o masa de cada uno de los elementos en el conjunto de entrenamiento. Los resultados presentados demuestran la capacidad del modelo, obteniendo desempeños comparables a los métodos usados en la literatura para los problemas estudiados.
General note
Tesis para optar al grado de Magíster en Ciencias, Mención Computación Memoria para optar al título de Ingeniero Civil en Computación
Identifier
URI: https://repositorio.uchile.cl/handle/2250/179881
Collections
The following license files are associated with this item: