Modelo de detección de agresiones verbales, por medio de algoritmos de Machine Learning
Professor Advisor
dc.contributor.advisor
Jiménez Molina, Ángel
Author
dc.contributor.author
Bugueño Sáez, Víctor Gabriel
Associate professor
dc.contributor.other
Calisto Leiva, Ignacio
Associate professor
dc.contributor.other
Cabezas Bullemore, Alberto
Admission date
dc.date.accessioned
2018-06-05T15:12:28Z
Available date
dc.date.available
2018-06-05T15:12:28Z
Publication date
dc.date.issued
2017
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/148580
General note
dc.description
Ingeniero Civil Industrial
es_ES
Abstract
dc.description.abstract
El presente trabajo tiene como objetivo detectar evidencias de agresiones verbales en archivos de audio. Al respecto se identifican dos clases: Conversaciones normales y Agresión verbal. Para lograr el objetivo, se aplican 4 métodos. El modelo utilizado por Vincenzo Carletti et.al [7], en donde se propone un enfoque para la detección de eventos de audio basados en el paradigma de "bolsa de palabras" (del inglés, Bag of Words), una variación de este modelo utilizando features de la herramienta openSMILE, Support vector machine alimentado por ambas clases y finalmente regresión lineal alimentada por ambas clases.
Al no tener bases de datos abiertas con las clases que se desean analizar, se procedió a construir una base de datos propia recolectando archivos de audio de películas y de internet. De esta manera se obtuvo 809 archivos de audio de 3 segundos de ambas clases de interés y 145 archivos de audio de pocos milisegundos para alimentar la primera etapa del modelo de Vincenzo Carletti.
Se utilizó el software Audacity para transformar los archivos de audio y para extraer el audio de registros audiovisuales de películas. Se utilizó el software Rstudio para el procesamiento general.
En este trabajo se utilizaron 11 features para realizar la clasificación en el modelo original de Vincenzo Carletti. El modelo de Vincenzo, se repitió usando 148 features provenientes de la herramienta openSMILE. Estas mismas features fueron utilizadas para ejecutar los algoritmos de Support vector machine y Regresión lineal.
Los resultados obtenidos fueron de 86.27% de exactitud para el modelo con features originales de Vincenzo Carletti, 79.32% de exactitud para el modelo de Vincenzo utilizando 148 features de openSMILE, 98.19% para algoritmo Support vector machine y 97.74% de exactitud para el algoritmo de regresión lineal.
Los resultados arrojaron resultados prometedores, respecto a la identificación de agresiones verbales, lo que puede permitir el desarrollo de aplicaciones que las puedan identificar monitoreando en tiempo real y que permitan detectar alguna situación de peligro de una persona en condición de vulnerabilidad.
es_ES
Patrocinador
dc.description.sponsorship
Este trabajo ha sido financiado por el Proyecto Fondecyt 11130252