Show simple item record

Professor Advisordc.contributor.advisorTobar Henríquez, Felipe
Authordc.contributor.authorGouron, Romain Víctor Olivier 
Associate professordc.contributor.otherRapaport Zimermann, Iván
Associate professordc.contributor.otherPérez Rojas, Jorge
Admission datedc.date.accessioned2018-03-05T20:29:57Z
Available datedc.date.available2018-03-05T20:29:57Z
Publication datedc.date.issued2017
Identifierdc.identifier.urihttps://repositorio.uchile.cl/handle/2250/146690
General notedc.descriptionIngeniero Civil Matemáticoes_ES
Abstractdc.description.abstractEn los últimos años, el procesamiento de lenguaje natural (Natural Language Proces-sing, o NLP) ha experimentado importantes avances. Específicamente, en 2013, Google lanzó "word2vec", un algoritmo que propone, a partir de un corpus dado, una representación vecto-rial de las palabras que lo componen. Dicho algoritmo ha tenido un gran éxito principalmentepor dos razones: La primera es el bajo costo computacional de su entrenamiento que permitióun uso masivo, mientras que la segunda es la intuitiva topología inducida por la representación vectorial ilustrada por el popular ejemplo: word2vec("king") - word2vec("man") + word2vec("woman") = word2vec("queen") En esta memoria, presentamos en un primer lugar un ejemplo ilustrativo del algoritmo "word2vec" mediante su implementación para determinar preguntas duplicadas en Quora, una competencia propuesta por el sitio Kaggle.com. Una vez familiarizados con el algoritmo, nos enfocamos en un problema más abierto que considera el análisis de 45 obras de literatura francesa. En particular, queremos atacar la siguiente pregunta: ¿cómo se puede definir una distancia entre dos libros? Después de haber preparado los libros con el propósito de poder usar el algoritmo, propondremos varios métodos originales para comparar pares de libros. Luego, nos interesará representar estas obras en un espacio, y determinar si dicha representación revela propiedades literarias de las obras consideradas tales como la paternidad o el estilo literario.es_ES
Lenguagedc.language.isoeses_ES
Publisherdc.publisherUniversidad de Chilees_ES
Type of licensedc.rightsAttribution-NonCommercial-NoDerivs 3.0 Chile*
Link to Licensedc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/cl/*
Keywordsdc.subjectAlgoritmos computacionaleses_ES
Keywordsdc.subjectAprendizaje de máquinaes_ES
Keywordsdc.subjectProcesamiento de lenguaje natural (Ciencia de la computación)es_ES
Keywordsdc.subjectWord2veces_ES
Títulodc.titleEstudiando obras literarias con herramientas de procesamiento de lenguaje naturales_ES
Document typedc.typeTesis
Catalogueruchile.catalogadorgmmes_ES
Departmentuchile.departamentoDepartamento de Ingeniería Matemática
Facultyuchile.facultadFacultad de Ciencias Físicas y Matemáticases_ES


Files in this item

Icon
Icon

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 Chile
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 Chile