Desarrollo e implementación de un sistema de detección automatica de publicidad en prensa escrita
Professor Advisor
dc.contributor.advisor
Saavedra Rondo, José Manuel
Author
dc.contributor.author
Ramírez Mellado, Maximiliano
Staff editor
dc.contributor.editor
Facultad de Ciencias Físicas y Matemáticas
Staff editor
dc.contributor.editor
Departamento de Ingeniería Eléctrica
Associate professor
dc.contributor.other
Agusto Alegría, Héctor
Associate professor
dc.contributor.other
Galdames Grunberg, Francisco
Admission date
dc.date.accessioned
2014-09-22T20:01:00Z
Available date
dc.date.available
2014-09-22T20:01:00Z
Publication date
dc.date.issued
2014
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/116886
General note
dc.description
Ingeniero Civil Eléctrico
Abstract
dc.description.abstract
La revisión sistemática de la prensa es una importante herramienta para el análisis de presencia de marcas y desarrollo de estrategias publicitarias, el monitoreo de estos medios tradicionalmente es realizado por operadores que manualmente extraen la información.
Este trabajo tiene como objetivo presentar un novedoso sistema de detección automática de publicidad sobre imágenes procedentes de diarios y revistas, dentro del marco del proyecto IntelliMEDIA, llevado a cabo por el startup chileno CPDLabs.
La metodología para detectar anuncios publicitarios se basa en un modelamiento específico de la estructura de la prensa escrita, permitiendo llegar a obtener una estimación del costo de los anuncios detectados. Para ello se separa el problema en 4 bloques: Preprocesamiento que separa el texto de las imágenes dentro de la página.
Detección de logos que busca logos dentro de la página. Detección de publicidad que identifica el anuncio publicitario al que pertenece el logo y finalmente una etapa de tarificación que entrega una estimación del costo asociado al espacio publicitario.
El problema es abordado principalmente mediante tres estrategias: Primero la representación de la imagen en descriptores locales, que permite calzar características similares entre imágenes. Segundo, la estrategia de detección de objetos Viola-Jones, algoritmo de machine learning que genera un clasificador en base a un conjunto de imágenes de entrenamiento. La última estrategia es comparar histogramas de color permitiendo integrar información de color a la clasificación.
Para medir el desempeño de dichas estrategias se desarrolla un marco de evaluación, que consiste en una base de validación de 20.000 páginas de diario con 27 logos marcados, para así medir el desempeño de las distintas estrategias y configuraciones de parámetros, encontrar una solución eficaz para el problema y analizar las fortalezas y debilidades de los distintos métodos.
Los resultados demuestran que la solución es viable y es posible detectar logos mediante descriptores locales y Viola-Jones, logrando desempeños mayores al 90%. Por lo tanto IntelliMediA puede llegar a ser una manera eficaz y eficiente de extraer información publicitaria automáticamente de prensa escrita.