Professor Advisor | dc.contributor.advisor | Gutiérrez Gallardo, Claudio | |
Author | dc.contributor.author | Garrido García, Camilo Fernando | |
Staff editor | dc.contributor.editor | Facultad de Ciencias Físicas y Matemáticas | |
Staff editor | dc.contributor.editor | Departamento de Ciencias de la Computación | |
Associate professor | dc.contributor.other | Poblete Labra, Bárbara | |
Associate professor | dc.contributor.other | Pérez Rojas, Jorge | |
Admission date | dc.date.accessioned | 2013-06-03T22:03:23Z | |
Available date | dc.date.available | 2013-06-03T22:03:23Z | |
Publication date | dc.date.issued | 2013 | |
Identifier | dc.identifier.uri | https://repositorio.uchile.cl/handle/2250/113509 | |
General note | dc.description | Ingeniero Civil en Computación | |
Abstract | dc.description.abstract | En la actualidad, la cantidad de información que se genera en el mundo es inmensa. En el campo científico tenemos, por ejemplo, datos astronómicos con imágenes de las estrellas, los datos de pronósticos meteorológicos, los datos de infomación biológica y genética, etc. No sólo en el mundo científico se produce este fenómeno, por ejemplo, un usuario navegando por Internet produce grandes cantidades de información: Comentarios en foros, participación en redes sociales o simplemente la comunicación a través de la web.
Manejar y analizar esta cantidad de información trae grandes problemas y costos. Por ello, antes de realizar un análisis, es conveniente determinar si el conjunto de datos que se posee es adecuado para lo que se desea o si trata sobre los temas que son de nuestro interés. Estas preguntas podrían responderse si se contara con un resumen del conjunto de datos. De aquí surge el problema que esta memoria abarca: Crear resúmenes semi-automáticos de conocimiento formalizado.
En esta memoria se diseñó e implementó un método para la obtención de resúmenes semiautomáticos de conjuntos RDF. Dado un grafo RDF se puede obtener un conjunto de nodos, cuyo tamaño es determinado por el usuario, el cual representa y da a entender cuáles son los temas más importantes dentro del conjunto completo. Este método fue diseñado en base a los conjuntos de datos provistos por DBpedia. La selección de recursos dentro del conjunto de datos se hizo utilizando dos métricas usadas ampliamente en otros escenarios: Centralidad de intermediación y grados. Con ellas se detectaron los recursos más importantes en forma global y local.
Las pruebas realizadas, las cuales contaron con evaluación de usuarios y evaluación automática, indicaron que el trabajo realizado cumple con el objetivo de realizar resúmenes que den a entender y representen al conjunto de datos. Las pruebas también mostraron que los resúmenes logran un buen balance de los temas generales, temas populares y la distribución respecto al conjunto de datos completo. | es_CL |
Lenguage | dc.language.iso | es | es_CL |
Publisher | dc.publisher | Universidad de Chile | es_CL |
Keywords | dc.subject | Ciencia de la computación | es_CL |
Keywords | dc.subject | Estructuras de datos (Ciencia de la computación) | es_CL |
Keywords | dc.subject | Minería de datos | es_CL |
Keywords | dc.subject | Procesamiento de textos (Ciencia de la computación) | es_CL |
Keywords | dc.subject | Linked data | es_CL |
Keywords | dc.subject | DBpedia | es_CL |
Título | dc.title | Resúmenes semiautomáticos de conocimiento : caso de RDF | es_CL |
Document type | dc.type | Tesis | |