Aplicación de Machine Learning para un sistema generador de modelos diferenciales de sistemas biológicos
Professor Advisor
dc.contributor.advisor
Salgado Herrera, José
Author
dc.contributor.author
Oyarce Andrade, Raimundo Tomás
Associate professor
dc.contributor.other
Olivera Nappa, Álvaro
Associate professor
dc.contributor.other
Gerdtzen Hakim, Ziomara
Admission date
dc.date.accessioned
2021-10-21T14:27:39Z
Available date
dc.date.available
2021-10-21T14:27:39Z
Publication date
dc.date.issued
2021
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/182349
Abstract
dc.description.abstract
En ingeniería de procesos, la formulación de modelos matemáticos es de gran utilidad para diversas aplicaciones, entre las que se encuentran el diseño, el control y/o la optimización de un proceso. La construcción de estos modelos se facilita con Machine Learning debido a su capacidad de identificar fácilmente patrones a partir de los datos, no necesitar intervención humana en el proceso y poder manejar una gran cantidad de datos simultáneamente. Específicamente, los algoritmos de regresión simbólica permiten identificar modelos matemáticos a partir de datos experimentales.
El objetivo de este trabajo es desarrollar y evaluar una metodología que permita proponer funciones o bloques faltantes en modelos matemáticos diferenciales de sistemas biológicos o biotecnológicos mediante regresión simbólica. Esta metodología es evaluada en dos casos de estudio sintéticos: crecimiento de microorganismos en reactor batch y producción simultánea de bioetanol y fructosa a partir de sacarosa. Para la regresión simbólica se utilizó el algoritmo de programación genética (GP).
La metodología diseñada consiste en obtener los datos experimentales, ejecutar el algoritmo GP para identificar la estructura matemática del bloque faltante, ajustar los parámetros de la expresión propuesta por GP y finalmente validar el modelo para medir su capacidad de generalización.
Para la implementación del algoritmo GP se diseñó una función de evaluación que forma un sistema de ecuaciones a partir de las ecuaciones conocidas y la expresión matemática propuesta por cada individuo para el bloque faltante. Dicho sistema es resuelto para luego calcular el fitness del individuo.
La metodología propuesta permite obtener modelos matemáticos con buena capacidad de generalización en ambos casos de estudio, siendo la etapa de validación fundamental para descartar los casos de sobreajuste. Sin embargo, tiene la limitación de necesitar conocer todas las ecuaciones del sistema y su relación con el bloque faltante que se desea identificar. Además, se necesitan dos conjuntos de datos obtenidos en distintas condiciones, uno para el entrenamiento y el otro para la validación.
es_ES
Lenguage
dc.language.iso
es
es_ES
Publisher
dc.publisher
Universidad de Chile
es_ES
Type of license
dc.rights
Attribution-NonCommercial-NoDerivs 3.0 United States