Buscador fonético en base de redes neuronales
Author
Professor Advisor
Abstract
El Instituto Nacional de Propiedad Industrial (INAPI) es la entidad que registra las marcas en Chile y contiene una base de datos de más de 500.000 marcas. Cada vez que registra una nueva marca debe realizar una búsqueda en sus bases de datos para verificar que esta nueva marca no sea igual o similar a una marca ya registrada, por lo que es importante desarrollar métodos de búsqueda fonética para marcas en español e inglés más rápidos y eficientes que los métodos que ya existen.
El presente trabajo muestra el desarrollo de un método de búsqueda de palabras a base de Redes Neuronales que permite encontrar marcas en una base de datos parecidas fonéticamente a una marca buscada, cuya velocidad y precisión se comparó con métodos tradicionales. También, se trabajó en un objetivo secundario de extender una base de datos de marcas fonéticamente similares que sirvió para entrenar y probar los métodos.
Para lograr estos objetivos, primero se estudió la literatura necesaria para entender mejor el problema, las soluciones actuales al problema y las posibles soluciones a base de redes neuronales que se intentaron adaptar para llevar a cabo los objetivos. Luego, se extendió la base de datos, tanto agregando pares de marcas manualmente como buscado en repositorios públicos, y se implementaron los códigos de los algoritmos. Entonces, se midió el ranking promedio de estos algoritmos para comparar sus precisiones y, también, se estimó el tiempo de procesamiento promedio por pares de marcas de los buscadores fonéticos para comparar sus velocidades.
Como resultado se obtuvo una base de datos mucho más grande que la original, la que se utilizó para entrenar las redes neuronales y comparar la precisión de los algoritmos implementados. También, se logró implementar un algoritmo que obtuvo mejores resultados de precisión que los métodos tradicionales, pero con una velocidad más baja que la esperada. Pese a esto, se encontraron otras configuraciones de este algoritmo que lograron una precisión un poco más baja que la original, aunque aún más alta que la de los métodos tradicionales, a cambio de velocidades un poco más cercanas a las de los métodos tradicionales.
xmlui.dri2xhtml.METS-1.0.item-notadetesis.item
Memoria para optar al título de Ingeniero Civil Eléctrico
Identifier
URI: https://repositorio.uchile.cl/handle/2250/185499
Collections
The following license files are associated with this item: