Clasificación de usuarios de instagram en base a texto e imágenes |
Tesis
Publication date
2019Metadata
Show full item record
Cómo citar
Saavedra Rondo, José
Cómo citar
Clasificación de usuarios de instagram en base a texto e imágenes |
Professor Advisor
Abstract
El proyecto consiste en generar un modelo de clasificación de influenciadores. El contexto
es el mercado de marketing digital en Instagram, red social basada en publicaciones de sus
usuarios, donde se puede comentar las publicaciones de otras personas y dar likes. Un influen-
ciador es un usuario que es considerado influyente ; tiene muchos seguidores, normalmente
más de 3.000, y realiza campañas publicitarias en las que promociona productos a través de
su cuenta personal de Instagram.
Haip es una empresa dedicada a este mercado, que busca encontrar los influenciadores
más apropiados para campañas publicitarias de, por ejemplo, productos deportivos o de
belleza. Actualmente, buscar influenciadores es un proceso costoso porque es, en su mayoría,
manual, y requiere de un gasto considerable de tiempo. Por esto es que se busca clasificar
a los influenciadores en categorías como deporte , aire libre , etc. Conocer de antemano
las categorías a las que pertenece cada influenciador permitirá agilizar las operaciones de la
empresa y optimizar los procesos.
Para lograr el objetivo planteado, se usan modelos de aprendizaje de máquinas tales como
redes neuronales, word embeddings y SVMs. Para ello se deben recolectar suficientes datos
y entrenar los modelos de manera eficiente. Los datos para clasificar a los influenciadores
consisten en sus publicaciones, los que incluyen una o más imágenes y un texto, sin embar-
go, para entrenar los modelos es necesario primero juntar una cantidad suficiente de datos
previamente etiquetados, lo que se logra buscando fuentes de imágenes de acceso público en
ImageNet y Pexels. Para clasificar una publicación, se usa ResNet, primero para clasificar la
imagen y segundo para producir un vector en R n a partir de la imagen, y fastText para hacer
lo mismo a partir del texto. Luego se usa una red neuronal para la clasificación usando ambos
vectores. Finalmente se compara la precisión de la clasificación usando solo las imágenes, solo
los textos, y usando ambos.
Se logra diseñar un clasificados que es muy efectivo para clasificar en 5 categorías. El
clasificador se compara con un conjunto de influenciadores ya clasificados por un grupo de
2 personas, y tiene un rendimiento suficientemente alto, por lo que pasa a ser usado en la
plataforma de Haip. En un trabajo futuro, se puede extender el clasificador para aumentar
la cantidad de categorías.
General note
Memoria para optar al título de Ingeniero Civil en Computación
Identifier
URI: https://repositorio.uchile.cl/handle/2250/171132
Collections
The following license files are associated with this item: