Análisis de relaciones existentes entre datos de robos de vehículos e información extraída de Twitter aplicando KDD
Tesis
Publication date
2017Metadata
Show full item record
Cómo citar
Weber Haas, Richard
Cómo citar
Análisis de relaciones existentes entre datos de robos de vehículos e información extraída de Twitter aplicando KDD
Professor Advisor
Abstract
Los delitos en cualquier sociedad son una problemática que se intenta disminuir lo mayor posible. En Chile el robo de vehículos presenta tasas bastante elevadas, redondeando los 30.000 al año, lo que significa que un vehículo es sustraído cada 17 minutos en Chile.
Esta investigación se enmarca en el proyecto de análisis de robos de vehículos desarrollado por PROSE, consultora que ofrece servicios de análisis y desarrollo a las empresas de seguros de vehículos de Chile, en conjunto con la Universidad de Chile y con el apoyo del Fondo de Fomento al Desarrollo Científico y Tecnológico.
El proyecto pretende ayudar a entender y desarrollar un modelo predictivo del robo de vehículos utilizando 3 fuentes de información, denuncias de vehículos, medios noticiosos y Twitter.
Twitter es una red social donde se comparten opiniones o declaraciones en tiempo real, los cuales son llamados Tweets, sus características han captado la atención de distintos investigadores que deciden utilizar esta información para explicar fenómenos sociales.
Se han presentado problemas de interpretación de patrones o rendimiento de modelamientos predictivos al utilizar Twitter debido a sesgos inmersos en la red social, producidos por las características de los usuarios, como de localización, edad, contenido compartido o intereses.
Es por esto que el objetivo principal de esta tesis es identificar las relaciones existentes entre el robo de vehículos y denuncias realizadas a través de Twitter en el periodo 2012 al 2016 con el fin de establecer las diferencias y similitudes entre ambas fuentes de datos.
Para el desarrollo de esta tesis se consideran dos fuentes de datos, las denuncias de robos de vehículos almacenados por PROSE y denuncias realizadas por Twitter en el periodo 2012 al 2016.
Se analizó la correlación de las denuncias entre ambas fuentes de datos, identificando que tienen una correlación de 0,73.
Se recreó el proceso por los cuales pasa un robo de vehículo, en donde se descubrió que el orden es 1° Robo del vehículo, 2°Envío del Tweet, 3°.Denuncia en Carabineros de Chile, 4°Validación PROSE, y finalmente el Hallazgo. Es decir el Tweet es el primer evento que se origina luego del robo. Además se descubrió que aquellos vehículos que son denunciados por twitter presentan tasas de hallazgo superiores, conocimiento valioso para futuros trabajos.
Algunos de los sesgos encontrados fueron que en Twitter se denuncia en una mayor proporción los vehículos de menor valor, además de mostrar que los modelos denunciados tienen tasas de frecuencias similares en ambas fuentes de información.
General note
Ingeniero Civil Industrial
Identifier
URI: https://repositorio.uchile.cl/handle/2250/148550
Collections
The following license files are associated with this item: