Show simple item record

Professor Advisordc.contributor.advisorPeredo Andrade, Óscar
Authordc.contributor.authorPérez Olivares, Joaquín Enrique
Associate professordc.contributor.otherCaba Rutte, Andrés
Associate professordc.contributor.otherEspinoza Pereira, Miguel
Admission datedc.date.accessioned2025-01-03T16:00:01Z
Available datedc.date.available2025-01-03T16:00:01Z
Publication datedc.date.issued2024
Identifierdc.identifier.urihttps://repositorio.uchile.cl/handle/2250/202597
Abstractdc.description.abstractEn el contexto de aprendizaje automático y ciencia de datos, la disponibilidad de grandes volúmenes de datos etiquetados es fundamental para el entrenamiento eficaz de modelos predictivos. Sin embargo, la obtención de datos que sean suficientes y con la calidad adecuada, puede ser costosa y además puede tomar un gran tiempo. Para abordar este problema, se presenta el desarrollo e implementación de un motor de aumento de datos que utiliza una variedad de técnicas avanzadas de machine learning y deep learning, incluidas Redes Generativas Adversarias (GANs). El motor de aumento de datos propuesto está diseñado para generar datos sintéticos que complementen los conjuntos de datos existentes, mejorando la capacidad de generalización de modelos de aprendizaje automático, incluídos los presentes en ClaroVTR. Este motor se estructura en varios módulos clave: engine.py, que maneja el flujo principal de datos y las operaciones de aumento; gan_wrapper.py, que proporciona una capa de abstracción sobre los modelos GAN; y utils.py, que ofrece funciones auxiliares para la manipulación de datos. El desarrollo del motor se realizó en varias fases: definición del problema y requisitos, análisis de datos, diseño de la arquitectura del sistema, implementación de los módulos, y validación del motor mediante pruebas. La solución fue evaluada en diversas bases de datos que varían en tamaño y complejidad para determinar su eficacia en diferentes escenarios. Los resultados demuestran que el motor puede generar datos sintéticos que mejoran el rendimiento de los modelos de aprendizaje automático en múltiples casos de uso, aunque con variaciones en la efectividad dependiendo del tipo y tamaño del conjunto de datos. En situaciones en que la data presenta una dimensión muy alta, es posible que al reducir espacios de búsqueda para optimizar tiempos de ejecución, los resultados no mejoren considerablemente, presentando incluso disminuciones del rendimiento. La implementación se llevó a cabo utilizando bibliotecas de código abierto como numpy, pandas, pytorch y SDV, asegurando la integridad y reproducibilidad del sistema.es_ES
Lenguagedc.language.isoeses_ES
Publisherdc.publisherUniversidad de Chilees_ES
Type of licensedc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
Link to Licensedc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
Títulodc.titleGeneración de data sintética en aplicaciones de machine learning para telecomunicacioneses_ES
Document typedc.typeTesises_ES
dc.description.versiondc.description.versionVersión original del autores_ES
dcterms.accessRightsdcterms.accessRightsAcceso abiertoes_ES
Catalogueruchile.catalogadorchbes_ES
Departmentuchile.departamentoDepartamento de Ingeniería Eléctricaes_ES
Facultyuchile.facultadFacultad de Ciencias Físicas y Matemáticases_ES
uchile.carrerauchile.carreraIngeniería Civil Eléctricaes_ES
uchile.gradoacademicouchile.gradoacademicoLicenciadoes_ES
uchile.notadetesisuchile.notadetesisMemoria para optar al título de Ingeniero Civil Eléctricoes_ES


Files in this item

Icon

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 United States
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States