Aplicación de Machine Learning para un sistema generador de modelos diferenciales de sistemas biológicos
Tesis
![Thumbnail](/themes/Mirage2/images/cubierta.jpg)
Access note
Acceso abierto
Publication date
2021Metadata
Show full item record
Cómo citar
Salgado Herrera, José
Cómo citar
Aplicación de Machine Learning para un sistema generador de modelos diferenciales de sistemas biológicos
Author
Professor Advisor
Abstract
En ingeniería de procesos, la formulación de modelos matemáticos es de gran utilidad para diversas aplicaciones, entre las que se encuentran el diseño, el control y/o la optimización de un proceso. La construcción de estos modelos se facilita con Machine Learning debido a su capacidad de identificar fácilmente patrones a partir de los datos, no necesitar intervención humana en el proceso y poder manejar una gran cantidad de datos simultáneamente. Específicamente, los algoritmos de regresión simbólica permiten identificar modelos matemáticos a partir de datos experimentales.
El objetivo de este trabajo es desarrollar y evaluar una metodología que permita proponer funciones o bloques faltantes en modelos matemáticos diferenciales de sistemas biológicos o biotecnológicos mediante regresión simbólica. Esta metodología es evaluada en dos casos de estudio sintéticos: crecimiento de microorganismos en reactor batch y producción simultánea de bioetanol y fructosa a partir de sacarosa. Para la regresión simbólica se utilizó el algoritmo de programación genética (GP).
La metodología diseñada consiste en obtener los datos experimentales, ejecutar el algoritmo GP para identificar la estructura matemática del bloque faltante, ajustar los parámetros de la expresión propuesta por GP y finalmente validar el modelo para medir su capacidad de generalización.
Para la implementación del algoritmo GP se diseñó una función de evaluación que forma un sistema de ecuaciones a partir de las ecuaciones conocidas y la expresión matemática propuesta por cada individuo para el bloque faltante. Dicho sistema es resuelto para luego calcular el fitness del individuo.
La metodología propuesta permite obtener modelos matemáticos con buena capacidad de generalización en ambos casos de estudio, siendo la etapa de validación fundamental para descartar los casos de sobreajuste. Sin embargo, tiene la limitación de necesitar conocer todas las ecuaciones del sistema y su relación con el bloque faltante que se desea identificar. Además, se necesitan dos conjuntos de datos obtenidos en distintas condiciones, uno para el entrenamiento y el otro para la validación.
xmlui.dri2xhtml.METS-1.0.item-notadetesis.item
Memoria para optar al título de Ingeniero Civil en Biotecnología Memoria para optar al título de Ingeniero Civil Químico
Identifier
URI: https://repositorio.uchile.cl/handle/2250/182349
Collections
The following license files are associated with this item: