Show simple item record

Professor Advisordc.contributor.advisorVelásquez Silva, Juan Domingo
Authordc.contributor.authorMarshall Boehmwald, Fernando
Associate professordc.contributor.otherRuiz Moreno, Rocío Belén
Associate professordc.contributor.otherHernández Martínez, Víctor Alejandro
Admission datedc.date.accessioned2022-10-21T15:53:58Z
Available datedc.date.available2022-10-21T15:53:58Z
Publication datedc.date.issued2022
Identifierdc.identifier.urihttps://repositorio.uchile.cl/handle/2250/188774
Abstractdc.description.abstractGenerar conocimiento en base a la evidencia en investigaciones clínicas es muchas veces un proceso lento, costoso y complejo. Dentro de los problemas a los que se enfrentan investigadoras e investigadores del rubro, está el bajo número de participantes en los experimentos, dada la dificultad de encontrar pacientes y el alto costo monetario y temporal de generar un nuevo registro. Esta escasez de información complejiza el trabajo estadístico, evitando la generalización de los resultados que se obtienen, dificultando la obtención de conclusiones aceptables que puedan ser aplicadas a la población. Actualmente es posible solucionar parcialmente la escasez de información utilizando datos de libre acceso, modelos más sencillos o aplicar distintas transformaciones a las fuentes de información. Sin embargo, ninguna de estas soluciones les permite a los investigadores e investigadoras utilizar todo el potencial de los datos que manejan. Con el fin de entregar recomendaciones para resolver los problemas asociados a la escasez de datos en proyectos de aprendizaje de máquinas asociados a salud, en el presente trabajo de título se realizó un estudio de los algoritmos generadores de datos sintéticos más utilizados en la literatura para datos tabulares, basándose en los registros del proyecto Alzheimer Depression Diagnostic with Artificial Intelligence del Web Intelligence Centre. Se aplicaron tres algoritmos generativos en esta oportunidad, Generative Adversarial Networks, Variational Autoencoders y Gaussian Copula, siendo los dos primeros algoritmos de redes neuronales y el tercero un algoritmo estadístico. Ningún algoritmo obtuvo mejores resultados al entrenar un modelo de clasificación en comparación con los datos reales, sin embargo, los mejores resultados provienen del algoritmo Gaussian Copula, presentando una diferencia de -9% y -5% para las métricas Recall y ROC AUC respectivamente al sólo utilizar datos sintéticos para el entrenamiento y otra de -18,5% y -13,5% en Recall y ROC AUC al unir los datos sintéticos y reales, todos estos resultados fueron obtenidos testeando dichos modelos con la información real de los pacientes. No fue posible probar distintos tipos de bases de datos, ya que todas poseían las mismas características; una variable binaria y varias variables numéricas. No obstante, los algoritmos que utilizan redes neuronales presentaron mejores resultados cuando las bases tenían una mayor cantidad de variables.es_ES
Lenguagedc.language.isoeses_ES
Publisherdc.publisherUniversidad de Chilees_ES
Type of licensedc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
Link to Licensedc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
Keywordsdc.subjectAprendizaje de máquina
Keywordsdc.subjectRedes neuronales (Ciencia de la computación)
Keywordsdc.subjectSalud - Investigaciones
Keywordsdc.subjectDatos sintéticos
Keywordsdc.subjectGeneración de datos
Títulodc.titleDiseño de un modelo de generación de datos sintéticos para la aplicación de modelos de machine learning en proyectos interdisciplinarios asociados a saludes_ES
Document typedc.typeTesises_ES
dc.description.versiondc.description.versionVersión original del autores_ES
dcterms.accessRightsdcterms.accessRightsAcceso abiertoes_ES
Catalogueruchile.catalogadorgmmes_ES
Departmentuchile.departamentoDepartamento de Ingeniería Industriales_ES
Facultyuchile.facultadFacultad de Ciencias Físicas y Matemáticases_ES
uchile.carrerauchile.carreraIngeniería Civil Industriales_ES
uchile.gradoacademicouchile.gradoacademicoLicenciadoes_ES
uchile.notadetesisuchile.notadetesisMemoria pra optar al título de Ingeniero Civil Industriales_ES


Files in this item

Icon
Icon

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 United States
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States