Resumen de código utilizando GNN
Author
Professor Advisor
Abstract
Es conocimiento general en el mundo de la programación que un código con buena docu-mentación es más fácil de comprender que otro que no presente las anteriores características.La dificultad se encuentra sin embargo, en que en un escenario real un programador debecumplir con determinadas fechas límite que desvían bastante el foco. Debido a esto y otrosfactores, la buena documentación del código pasa entonces a segundo plano y en la mayoríade los casos queda sin documentar.Existen a la fecha diversos acercamientos a la tarea de generar resúmenes o explicarsegmentos de código de forma automática. El problema común entre ellos es que el lenguajede programación a diferencia del lenguaje natural posee su propia sintaxis y esquema derelaciones entre enunciados, características que no son explotadas por los trabajos actualesde traducción de código.Es por ello que este Trabajo de Titulo busca aprovechar tanto los puntos fuertes de lasredes neuronales utilizadas en muchos de los trabajos ya mencionados, como las característicasde preservación de relaciones de los grafos logrando así una implementación basada en redesneuronales de grafos (GNN) de un generador de resúmenes automático o GNN Based SourceCode Summarization (GBSCS).En específico se busca entrenar un modelo de red neuronal capaz de procesar fragmentosde código traduciendo estos a secuencias de nodos y producir como output una secuencia depalabras que logren explicar el funcionamiento principal del fragmento de código.Para ello se utiliza otra herramienta como punto de partida denominada RENCOS la cualhace uso de redes neuronales recurrentes (RNN) para realizar la confección de resúmenesde código. La métrica de comparación deseable para las herramientas consiste en sometera ambas a distintos métodos evaluadores ampliamente usados en la generación de lenguajenatural y comparar los puntajes obtenidos para cada una de aquellas.Debido a problemas de implementación si bien fue posible entrenar el modelo, no fueposible producir resúmenes de código resultado debido a un exceso de uso de recursos porparte del modelo. Sin embargo debido al amplio estudio realizado en conjunción al desarrollode la herramienta se hace la propuesta de posibles cambios que logren habilitar la obtenciónde un modelo que efectivamente logre producir predicciones y que estas sean posiblementemejores que las de la herramienta base.Es así como este trabajo provee de un primer acercamiento a un generador de resumen decódigo fuente que haga uso de la potencialidad de los grafos.
xmlui.dri2xhtml.METS-1.0.item-notadetesis.item
Memoria para optar al título de Ingeniero Civil en Computación
Identifier
URI: https://repositorio.uchile.cl/handle/2250/182319
Collections
The following license files are associated with this item: