González Ibáñez, Álvaro
Plataforma de monitoreo y pronóstico de impacto de enfermedades infecciosas en la sociedad
Las enfermedades infecciosas (E.I.) suponen un riesgo sanitario latente y creciente
para los pr oximos a~nos, debido a los factores socioambientales actuales. Sin
embargo, ante la emergencia de un nuevo agente infeccioso como SARS-CoV-2, la
implementaci on de medidas preventivas y la generaci on de soluciones m edicas y biotecnol
ogicas est a supeditada a la observaci on y el reconocimiento del impacto de
esta E.I. emergente en la sociedad. Actualmente, se han desarrollado modelos de
predicci on de la prevalencia de distintas E.I., pero su modo de utilizaci on reduce su
practicidad dentro de la industria biom edica e instituciones p ublicas.
Bajo este contexto, este seminario de t tulo tiene como objetivo crear una herramienta
computacional m nima capaz de monitorear, analizar y pronosticar tendencias
de aparici on de informaci on de E.I. en internet como un indicador de impacto de estas
enfermedades, con la intenci on de apoyar en la toma de decisiones en la industria
biom edica e instituciones de salud p ublica. Para crear esta herramienta se plantearon
tres objetivos espec cos: (i) desarrollar un m odulo de miner a y almacenamiento
de datos, (ii) implementar una estrategia de modelamiento estad stico para realizar
an alisis y pron osticos de tendencias de impacto en el tiempo, y (iii) desarrollar una
interfaz gr a ca para permitir un uso intuitivo de la herramienta con los usuarios.
Debido a la envergadura del proyecto y que debi o ser completado en 10 meses, el
presente trabajo est a acotado a la formulaci on de un producto m nimo viable (PMV)
que cuente con caracter sticas m nimas para evaluar la viabilidad y escalamiento del
proyecto, priorizando un desarrollo r apido y pr actico de los m odulos que lo componen
que permitan una mantenci on y mejora posterior e ciente.
Para probar la plataforma, se recolect o informaci on de enfermedades como: tu-
berculosis, in
uenza, c olera, gonorrea, zika, dengue, ebola, malaria e infecciones por
el virus de la inmunode ciencia humana, el virus del papiloma humano y el hongo
Candida auris. Con relaci on al primer objetivo, se logr o desarrollar un m odulo capaz
de recolectar informaci on de estas enfermedades. Adem as, se cre o una base de datos
para alojar la informaci on recuperada desde estas fuentes, con un total de 3.983.453
publicaciones hasta diciembre 2019. Respecto al segundo objetivo, se utiliz o el modelo
autorregresivo integrado de media m ovil para realizar pron osticos de sobre las
frecuencias de publicaci on y b usqueda en las fuentes mencionadas, permitiendo una
evaluaci on del impacto acad emico y social, actual y futuro de las enfermedades analizadas.
Finalmente, respecto al tercer objetivo, se gener o una interfaz gr a ca que
permite la utilizaci on de esta herramienta por un p ublico t ecnico y no t ecnico en el
area de biomedicina y ciencias computacionales bajo consentimiento de la empresa
Esta informaci on puede ser utilizada para la toma de decisiones relacionadas con
la prevenci on de problemas de salud p ublica y privada como tambi en la anticipaci on
de posibles escenarios cr ticos en t erminos recursos en investigaci on y desarrollo Infectious diseases (I.E.) present a latent and growing health risk for the coming
years, due to current socio-environmental factors. However, in the face of the
emergence of a new infectious agent such as SARS-CoV-2, the implementation of
preventive measures and the generation of medical and biotechnological solutions is
subject to observation and recognition of the impact of this I.E. emerging in society.
Currently, models for predicting the prevalence of di erent I.E. have been developed,
but their mode of use reduces their practicality within the biomedical industry and
public institutions.
In this context, this work aims to create a computational tool capable of monitoring,
analyzing, and forecasting trends in the emergence of I.E. information on the
internet as an indicator of the impact of these diseases, seeking to help in decisionmaking
in the biomedical industry and public health institutions. To create this tool,
three speci c objectives were proposed: (i) develop a data mining module, (ii) implement
a statistical modeling strategy to carry out analyzes and forecasts of impact
trends over time, and (iii) develop a graphical interface that allows intuitive use of
the tool by users.
Due to the size of the project and that it had to be done in 10 months, this work is
limited to the formulation of a minimum viable product (MVP) that has minimum
characteristics to evaluate the viability and scaling of the project, prioritizing a
rapid and practical development of the modules that compose it that allow e cient
maintenance and subsequent improvement.
To test the platform, information was collected on diseases such as: tuberculosis,
uenza, cholera, gonorrhea, zika, dengue, ebola, malaria, and infections with the
human immunode ciency virus, the human papillomavirus, and the fungus Candida
auris. Regarding the rst objective, it was possible to develop a module capable
of collecting information on these diseases from two academic repositories (Scopus
and Pubmed), Twitter, and Google Trends. Also, a database was created to manage
the information retrieved from these sources, with a total of 3,983,453 publications
until December 2019. Regarding the second objective, the integrated moving average
autoregressive model was used to make forecasts of the publication and search rates
on the mentioned sources, thus allowing an evaluation of the academic and social
impact, current and future of the diseases analyzed. Finally, regarding the third
objective, a graphic interface was generated that allows the use of this tool by a
technical and non-technical audience in the area of biomedicine and computer science,
with the consent of the Cellter company.
This information can be used for decision-making on the prevention of public and
private health problems as well as the anticipation of possible critical scenarios in
terms of resources in research and development
Seminario de Título para optar a
Ingeniero en Biotecnología Molecular