Show simple item record

Professor Advisordc.contributor.advisorOlivera Nappa, Álvaro
Professor Advisordc.contributor.advisorAsenjo de Leuze, Juan
Authordc.contributor.authorMedina Ortiz, David Alfredo
Associate professordc.contributor.otherNavarro Badino, Gonzalo
Associate professordc.contributor.otherAndrews Farrow, Bárbara
Associate professordc.contributor.otherMarín Caihuán, Mauricio
Admission datedc.date.accessioned2022-07-12T23:24:05Z
Available datedc.date.available2022-07-12T23:24:05Z
Publication datedc.date.issued2022
Identifierdc.identifier.urihttps://repositorio.uchile.cl/handle/2250/186676
Abstractdc.description.abstractLa incorporación de las técnicas de aprendizaje de máquinas y minería de datos a las estrategias de diseño de mutaciones ha permitido mejorar enormemente su rendimiento y sus facilidades de aplicación. No obstante, diversos desafíos aparecen al agregar estas metodologías computacionales en los protocolos de diseños experimentales, siendo los principales, la generalización de los sistemas de predicción, las estrategias de representación numérica de las secuencias de proteínas, la optimización del rendimiento de los modelos predictivos, y el uso de estos sistemas para tareas como reconstrucción de landscape y exploración de espacios latentes, entre otros. Debido a las variadas problemáticas existentes, esta tesis de doctorado se ha centrado en el diseño e implementación de metodologías computacionales que permitan solventar los desafíos de la incorporación de las técnicas de aprendizaje de máquinas a los protocolos de diseño de proteínas actuales, proponiendo la elaboración de una plataforma de manejo de datos para ingeniería, la cual mejora el rendimiento de modelos predictivos para variadas tareas y permite el diseño de mutaciones con propiedades deseables, contribuyendo en diferentes aristas de desarrollo. Primero, se diseñó e implementó una estrategia de representación numérica de secuencias de proteínas combinando codificadores basados en propiedades fisicoquímicas semánticamente seleccionados con transformaciones de Fourier, con el fin de mejorar el proceso de codificación para aplicaciones de algoritmos basados en técnicas de machine learning. En una segunda etapa, se diseñó e implementó un framework de entrenamiento de modelos predictivos para tareas de ingeniería que proteínas. Este sistema emplea la estrategia de representación numérica propuesta en este trabajo de doctorado como input para entrenar modelos basados en algoritmos de aprendizaje supervisado, los cuales se optimizan su rendimiento mediante la selección eficiente de hiperparámetros mediante algoritmos genéticos. Finalmente, se combinan en un único sistema por medio de sistemas de aprendizaje ensamblado para desarrollar el sistema predictivo de interés. Finalmente, se diseñaron e implementaron estrategias de diseño de proteínas mediante la elaboración de metodologías para explorar espacios latentes y reconstrucción de landscapes. Además, se construyó una estrategia de identificación de sitios relevantes en proteínas, combinando los puntos de vista filogenéticos, termodinámico y estructural, con el fin de favorecer las herramientas de diseño de mutaciones sitio dirigidas y el análisis de trayectorias en procesos evolutivos. Todas las metodologías diseñadas e implementadas en este trabajo se validaron con diferentes conjuntos de datos habilitados en la literatura y se compararon con estrategias previamente reportadas, logrando, en la mayoría de los casos, obtener mejores rendimientos en cuanto a calidad de predicciones, así como también facilidades en interpretación de los resultados, gracias al tipo de algoritmos empleados, siendo directamente relacionado con los ideales de la Inteligencia Artificial Explicable, lo cual denota la relevancia de las metodologías planteadas para los campos de ingeniería de proteínas y biotecnología.es_ES
Lenguagedc.language.isoeses_ES
Publisherdc.publisherUniversidad de Chilees_ES
Type of licensedc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
Link to Licensedc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
Keywordsdc.subjectIngeniería de proteínas
Keywordsdc.subjectAprendizaje de máquina
Keywordsdc.subjectMinería de datos
Keywordsdc.subjectData mining
Keywordsdc.subjectReconstrucción de landscapes
Keywordsdc.subjectExploración de espacios latentes
Títulodc.titleAplicaciones de Machine Learning y Data Mining en ingeniería de proteínas: diseño e implementación de nuevas estrategias para el estudio de mutacioneses_ES
Document typedc.typeTesises_ES
dc.description.versiondc.description.versionVersión original del autores_ES
dcterms.accessRightsdcterms.accessRightsAcceso abiertoes_ES
Catalogueruchile.catalogadorgmmes_ES
Departmentuchile.departamentoDepartamento de Ingeniería Química, Biotecnología y Materialeses_ES
Facultyuchile.facultadFacultad de Ciencias Físicas y Matemáticases_ES
uchile.carrerauchile.carreraIngeniería Civil Químicaes_ES
uchile.gradoacademicouchile.gradoacademicoDoctoradoes_ES
uchile.notadetesisuchile.notadetesisTesis para optar al grado de Doctor en Ciencias de la Ingeniería, Mención Ingeniería Química y Biotecnologíaes_ES


Files in this item

Icon
Icon

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 United States
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States