Show simple item record

Professor Advisordc.contributor.advisorAbeliuk Kimelman, Andrés
Authordc.contributor.authorDíaz Lara, Ignacio Adolfo
Associate professordc.contributor.otherPiquer Gardner, José
Associate professordc.contributor.otherHevia Angulo, Alejandro
Admission datedc.date.accessioned2023-01-06T14:51:28Z
Available datedc.date.available2023-01-06T14:51:28Z
Publication datedc.date.issued2022
Identifierdc.identifier.urihttps://repositorio.uchile.cl/handle/2250/191367
Abstractdc.description.abstractEn el presente trabajo de memoria se presenta el desarrollo e implementación de un método para cuantificar la complejidad de un texto en lenguaje natural especialmente enfocado a entender de mejor manera cómo representar las opiniones y debates. Cuantificar la complejidad es obtener la cantidad mínima de dimensiones en que se puede representar el texto. La motivación para este trabajo nace de lo insatisfactorio de las soluciones que simplifican los debates y opiniones a representaciones unidimensionales, potencialmente perdiendo mucha información. El método desarrollado consiste en modelar las dimensiones como diferenciales semánticos, que es el espectro que hay entre dos representaciones vectoriales de palabras que simbolizan dos extremos en términos de significado. Utilizando el framework POLAR y los diferenciales semánticos, se representan las palabras o documentos en forma de embeddings polares, para finalmente reducir sus dimensiones con el método de análisis de componentes principales para un nivel de varianza representada dado, que sirve como medida de sensibilidad. El cambio de eje de coordenadas que implica el análisis de componentes principales entrega pesos por cada dimensión original, que ya que están basadas en dimensiones de los embeddings polares, pueden entregar interpretabilidad sobre las dimensiones de las opiniones o debates. Al estudiar la solución en un dataset de noticias de la BBC se observó que es importante comparar textos en tamaños similares y que el método funciona como un comparador de complejidades entre documentos o conjuntos de documentos. Se mostró que niveles altos de varianza sirven para comparar entre documentos, y niveles más bajos de varianza pueden ser utilizados para comparar entre conjuntos de documentos. Además, se observó que la complejidad obtenida con word embeddings o embeddings polares está correlacionado y no se obtuvo mayor capacidad de interpretación de los pesos asociados a las dimensiones de los embeddings polares.es_ES
Lenguagedc.language.isoeses_ES
Publisherdc.publisherUniversidad de Chilees_ES
Type of licensedc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
Link to Licensedc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
Keywordsdc.subjectLenguaje natural
Keywordsdc.subjectProcesamiento del lenguaje natural (Ciencia de la computación)
Keywordsdc.subjectNatural language processing (Computer science)
Keywordsdc.subjectComplejidad computacional
Keywordsdc.subjectOpiniones y debates
Keywordsdc.subjectNLP
Keywordsdc.subjectWord embeddings
Keywordsdc.subjectNews framing
Títulodc.titleCuantificar la complejidad de las opiniones y debateses_ES
Document typedc.typeTesises_ES
dc.description.versiondc.description.versionVersión original del autores_ES
dcterms.accessRightsdcterms.accessRightsAcceso abiertoes_ES
Catalogueruchile.catalogadorgmmes_ES
Departmentuchile.departamentoDepartamento de Ciencias de la Computaciónes_ES
Facultyuchile.facultadFacultad de Ciencias Físicas y Matemáticases_ES
uchile.carrerauchile.carreraIngeniería Civil en Computaciónes_ES
uchile.gradoacademicouchile.gradoacademicoLicenciadoes_ES
uchile.notadetesisuchile.notadetesisMemoria para optar al título de Ingeniero Civil en Computaciónes_ES


Files in this item

Icon
Icon

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 United States
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States