Cuantificar la complejidad de las opiniones y debates

Díaz Lara, Ignacio Adolfo

Professor Advisor	dc.contributor.advisor	Abeliuk Kimelman, Andrés
Author	dc.contributor.author	Díaz Lara, Ignacio Adolfo
Associate professor	dc.contributor.other	Piquer Gardner, José
Associate professor	dc.contributor.other	Hevia Angulo, Alejandro
Admission date	dc.date.accessioned	2023-01-06T14:51:28Z
Available date	dc.date.available	2023-01-06T14:51:28Z
Publication date	dc.date.issued	2022
Identifier	dc.identifier.other	10.58011/amjp-vt65
Identifier	dc.identifier.uri	https://repositorio.uchile.cl/handle/2250/191367
Abstract	dc.description.abstract	En el presente trabajo de memoria se presenta el desarrollo e implementación de un método para cuantificar la complejidad de un texto en lenguaje natural especialmente enfocado a entender de mejor manera cómo representar las opiniones y debates. Cuantificar la complejidad es obtener la cantidad mínima de dimensiones en que se puede representar el texto. La motivación para este trabajo nace de lo insatisfactorio de las soluciones que simplifican los debates y opiniones a representaciones unidimensionales, potencialmente perdiendo mucha información. El método desarrollado consiste en modelar las dimensiones como diferenciales semánticos, que es el espectro que hay entre dos representaciones vectoriales de palabras que simbolizan dos extremos en términos de significado. Utilizando el framework POLAR y los diferenciales semánticos, se representan las palabras o documentos en forma de embeddings polares, para finalmente reducir sus dimensiones con el método de análisis de componentes principales para un nivel de varianza representada dado, que sirve como medida de sensibilidad. El cambio de eje de coordenadas que implica el análisis de componentes principales entrega pesos por cada dimensión original, que ya que están basadas en dimensiones de los embeddings polares, pueden entregar interpretabilidad sobre las dimensiones de las opiniones o debates. Al estudiar la solución en un dataset de noticias de la BBC se observó que es importante comparar textos en tamaños similares y que el método funciona como un comparador de complejidades entre documentos o conjuntos de documentos. Se mostró que niveles altos de varianza sirven para comparar entre documentos, y niveles más bajos de varianza pueden ser utilizados para comparar entre conjuntos de documentos. Además, se observó que la complejidad obtenida con word embeddings o embeddings polares está correlacionado y no se obtuvo mayor capacidad de interpretación de los pesos asociados a las dimensiones de los embeddings polares.	es_ES
Lenguage	dc.language.iso	es	es_ES
Publisher	dc.publisher	Universidad de Chile	es_ES
Type of license	dc.rights	Attribution-NonCommercial-NoDerivs 3.0 United States	*
Link to License	dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/us/	*
Keywords	dc.subject	Lenguaje natural
Keywords	dc.subject	Procesamiento del lenguaje natural (Ciencia de la computación)
Keywords	dc.subject	Natural language processing (Computer science)
Keywords	dc.subject	Complejidad computacional
Keywords	dc.subject	Opiniones y debates
Keywords	dc.subject	NLP
Keywords	dc.subject	Word embeddings
Keywords	dc.subject	News framing
Título	dc.title	Cuantificar la complejidad de las opiniones y debates	es_ES
Document type	dc.type	Tesis	es_ES
dc.description.version	dc.description.version	Versión original del autor	es_ES
dcterms.accessRights	dcterms.accessRights	Acceso abierto	es_ES
Cataloguer	uchile.catalogador	gmm	es_ES
Department	uchile.departamento	Departamento de Ciencias de la Computación	es_ES
Faculty	uchile.facultad	Facultad de Ciencias Físicas y Matemáticas	es_ES
uchile.carrera	uchile.carrera	Ingeniería Civil en Computación	es_ES
uchile.gradoacademico	uchile.gradoacademico	Licenciado	es_ES
uchile.notadetesis	uchile.notadetesis	Memoria para optar al título de Ingeniero Civil en Computación	es_ES

Files in this item

Name:: Cuantificar-la-complejidad-de- ...
Size:: 4.513Mb
Format:: PDF

Name:: TablaConten.pdf
Size:: 116.4Kb
Format:: PDF

This item appears in the following Collection(s)

Tesis Pregrado
Tesis Pregrado

Show simple item record

Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States