Análisis del Covid-19 y sus correlaciones a nivel internacional
Professor Advisor
dc.contributor.advisor
Hogan, Aidan
Author
dc.contributor.author
Novoa Rodríguez, Tamara Paulina
Associate professor
dc.contributor.other
Rivera Serrano, Francisco
Associate professor
dc.contributor.other
Vera Sobrino, Eduardo
Admission date
dc.date.accessioned
2021-09-02T16:15:54Z
Available date
dc.date.available
2021-09-02T16:15:54Z
Publication date
dc.date.issued
2021
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/181745
General note
dc.description
Memoria para optar al título de Ingeniera Civil Eléctrica
es_ES
Abstract
dc.description.abstract
El COVID-19 (Coronavirus disease 2019) es una enfermedad infecciosa causada por el SARSCoV-2. En diciembre de 2019 fue detectado por primera vez un brote en Wuhan, China y en cuestión de semanas, el virus se expandió a nivel mundial causando la pandemia que hoy se conoce. Debido a que esta es una situación sin precedentes, no hay un escenario claro sobre la relación entre esta enfermedad y otros factores. Por ejemplo, qué enfermedades de base influencian la propagación o si los países más populosos son aquellos más vulnerables frente al virus.
En este trabajo se propuso estudiar las correlaciones estadísticas que pueden tener variables referentes y no referentes al COVID-19. Para ello primero se hizo una investigación sobre las hipótesis que ya estaban planteadas en la Academia; luego se reunieron datasets que buscaran responder estas hipótesis, además de otras que se consideraron interesantes de estudiar. Se limpiaron y se pre-procesaron los datos para que fueran legibles para ser modelados como RDF Data Cube Vocabulary y fueron subidos al servidor Apache Jena Fuseki. Ya con los datos integrados, se calcularon sus correlaciones bajo dos coeficientes: Pearson y Spearman, obteniendo tanto su coeficiente como su valor p. Finalmente, se implementó una plataforma de visualización de estas correlaciones a través de Flask, con un Heat Map que mostraba lo fuerte que eran las correlaciones según la intensidad del color. Esta interfaz quedó disponible a través de un dominio web, pudiendo ser accesible desde cualquier lugar con internet.
Los resultados más destacados fueron 168 variables modeladas y 250 correlaciones significativas (valor p menor o igual a 0,05). El top 10 de correlaciones en valor absoluto ordenadas según Spearman y con un coeficiente mayor a 0,5, contiene 5 determinantes de salud: obesidad, cáncer, edad, tipo de sangre y enfermedades respiratorias. Otras variables del top son redes sociales y el ranking FIFA, las cuales se cree que están influenciadas por una variable confusa. La única variable relacionada al clima es la contaminación del aire, particularmente PM2.5, que puede ser transportador del virus en el aire, favoreciendo una transmisión indirecta. Si bien se encontraron varias correlaciones interesantes, es importante resaltar que estas relaciones no implican necesariamente causalidad.