A structural analysis of dictionaries as semantic networks
Professor Advisor
dc.contributor.advisor
Gutiérrez Gallardo, Claudio
Author
dc.contributor.author
Garrido García, Camilo Fernando
Associate professor
dc.contributor.other
Hogan, Aidan
Associate professor
dc.contributor.other
Soto Vergara, Guillermo
Associate professor
dc.contributor.other
Serraset, Gilles
Admission date
dc.date.accessioned
2021-09-06T19:30:15Z
Available date
dc.date.available
2021-09-06T19:30:15Z
Publication date
dc.date.issued
2021
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/181849
General note
dc.description
Tesis para optar al grado de Doctor en Ciencias, Mención Computación
es_ES
Abstract
dc.description.abstract
El lenguaje es una cualidad humana que nos permite, entre otras cosas, comunicarnos organizarnos y compartir conocimiento. Es un sistema dinámico en una constante evolución. Existen diversas metodologías lingüísticas para abordar la investigación del lenguaje. Un enfoque para investigar aquellas preguntas ha sido estudiar grandes redes de significados. Construir aquellas redes puede lograrse usando distintas fuentes de datos. En este trabajo nos concentramos en un tipo de fuente: Diccionarios.
Las palabras son bloques de construcción básicos de estructuras de significados más complejos, mientras que la red de sus relaciones puede ser considerado el esqueleto que los mantiene unidos. Los diccionarios proveen una imagen del léxico y, por lo tanto, son una fuente útil para obtener tales esqueletos de significado. La información semántica de los diccionarios puede ser organizada como redes usando un modelo técnicamente simple, pero conceptualmente poderoso donde nodos representan las entradas del diccionario y los arcos representan la relación ``es usada para definir''. El argumento simple es el siguiente: La definición de una palabra involucra recursivamente nuevas palabras, por lo tanto, nuevas acepciones y significados. De esta manera, un diccionario puede ser visto naturalmente como una red.
En esta tesis estudiamos y analizamos redes de diccionario para respaldar la hipótesis que las redes léxicas subyacentes en diccionarios son buenas fuentes de material para estudiar lenguaje natural y obtener valiosos resultados. Mostramos como las redes de diccionario pueden tomar un rol muy relevante al momento de estudiar la semántica del léxico, por ejemplo, al estudiar la evolución y proximidad de nubes de significados o la búsqueda de palabras relevantes y centrales.
Nos enfocamos en tres aspectos de redes de diccionario. Primero, sistematizamos la estructura de tales redes. Descubrimos que comparten una estructura común global y local. La homogeneidad de sus propiedades no parece estar asociada al idioma del diccionario ni tampoco al año de su publicación. Segundo, analizamos la evolución del diccionario español a través de los años. Descubrimos que la incorporación y eliminación de palabras no afectan a esta estable estructura de red. Los cambios son detectables en los subgrafos que rodean a cada nodo, dándole a cada palabra una red de significados de sutil evolución. Tercero, nos concentramos en cómo puede extraerse conocimiento lingüístico usando redes de diccionarios. Descubrimos que diccionarios son valiosas fuentes de "proximity data" (grado de cercanía entre palabras) y que puede extraerse usando sólo técnicas estándares de análisis de redes.
Los resultados nos muestran el tipo de conocimiento que las redes de diccionario pueden entregar. Éstos no podrían haber sido obtenidos analizando sólo el texto o las definiciones individualmente. Conjeturamos que los resultados obtenidos en este trabajo son válidos no sólo para inglés y español (los idiomas centrales de esta tesis) ya que no sacamos partido de ninguna característica particular de estos idiomas. Sería interesante continuar este estudio en otros idiomas así como extenderlo a diccionarios especializados.