Show simple item record

Professor Advisordc.contributor.advisorAdams, Martín
Professor Advisordc.contributor.advisorVásquez Albornoz, Jorge
Authordc.contributor.authorDassori Walker, Ignacio Antonio
Associate professordc.contributor.otherCaba Rutte, Andrés
Admission datedc.date.accessioned2024-08-05T19:40:46Z
Available datedc.date.available2024-08-05T19:40:46Z
Publication datedc.date.issued2024
Identifierdc.identifier.urihttps://repositorio.uchile.cl/handle/2250/199934
Abstractdc.description.abstractAvances en la disciplina de aprendizaje reforzado profundo han mostrado promesa en la utilización de estos métodos para la locomoción de robots a través de ambientes complejos. Sin embargo, estos métodos suelen sufrir de baja eficiencia de muestras debido a espacios de acción de alta dimensionalidad. En este trabajo proponemos e implementamos una arquitectura de control para robot cuadrúpedos basada en el uso de generadores de patrones centrales y aprendizaje reforzado. Nuestro método integra extracción de características del ambiente con aprendizaje no supervisado y selección de parámetros de un generador de trajectorias cíclicas para aprender conductas de caminata adaptables a los condiciones observadas por el robot. Restrindiengo el espacio de acción de los motores de nuestro robot somos capaces de aprender caminatas simples en menos de una hora, y caminatas capaces de escalar caminos de pendiente variable en menos de tres horas. Demostramos como nuestro método supera líneas base del estado del arte, superándolas en eficiencia de muestras y rendimiento.es_ES
Abstractdc.description.abstractAdvances in the discipline of deep reinforcement learning have shown promise in utilizing these methods for the locomotion of robots through complex environments. However, these methods often suffer from low sample efficiency due to high-dimensional action spaces. In this work, we propose and implement a control architecture for quadrupedal robots based on the use of central pattern generators and reinforcement learning. Our method integrates environment feature extraction with unsupervised learning and parameter selection from a cyclic trajectory generator to learn walking behaviors adaptable to the states observed by the robot. By constraining the action space of our robot’s motors, we are able to learn simple gaits in less than an hour and gaits capable of navigating paths with varying slopes in less than three hours. We demonstrate how our method outperforms state-of-the-art baselines, surpassing them in sample efficiency and performance.es_ES
Lenguagedc.language.isoenes_ES
Publisherdc.publisherUniversidad de Chilees_ES
Type of licensedc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
Link to Licensedc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
Títulodc.titleGait adaptation of quadruped robot via central pattern generator and reinforcement learninges_ES
Document typedc.typeTesises_ES
dc.description.versiondc.description.versionVersión original del autores_ES
dcterms.accessRightsdcterms.accessRightsAcceso abiertoes_ES
Catalogueruchile.catalogadorchbes_ES
Departmentuchile.departamentoDepartamento de Ingeniería Eléctricaes_ES
Facultyuchile.facultadFacultad de Ciencias Físicas y Matemáticases_ES
uchile.carrerauchile.carreraIngeniería Civil Eléctricaes_ES
uchile.gradoacademicouchile.gradoacademicoLicenciadoes_ES
uchile.notadetesisuchile.notadetesisMemoria para optar al título de Ingeniero Civil Eléctricoes_ES


Files in this item

Icon

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 United States
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States