Soft-clustering in static and dynamic environments
Author
Professor Advisor
Abstract
En la actualidad, el entorno macro y micro económico en el cual op eran las empresas está
cambiando constantemente y a gran velo cidad. Esto se deb e princip almente al auge de las
nuevas tecnologías, la revolución de la información y la gran facilidad con la que ahora p o demos comu nicarnos con cualquier parte d el mundo. Debido a la gran canti dad de información
que está siendo generada segundo tras segundo, junto con la facilidad con la que se puede
acceder a ella, la minería de datos y la investigación de op eracion es se han convertido en
una de las herramientas más imp ortantes para desarrollar sistemas de ap oyo a la toma de
decisiones en to dos los niveles. La imp ortancia del traba jo conjunto de ambas disciplinas
radica en la faci lidad relativa con la que extraen cono cimiento de enormes bases de datos y
la utilizan para optimizar los pro cesos organizacionales relevantes.
En particular, para la min ería de datos, estos hechos h an provo cado qu e las bases de datos
sean dinámicas, es decir, el nà omero de datos disponibles crece cada segundo haciendo que
tiempo de vida útil de los modelos se reduzca, haciendo necesario actualizarlos periódicamente de tal forma que encajen con la realidad actual. Lo anterior demanda el desarrollo de
nuevos algoritmos que sean capaces de manejar este tipo de cambios, lo cual ha ido ganando
importancia en los últimos años.
Adicionalmente, la incertidumbre, ambigüedad e imprecisión presentes en los problemas
de la vida real son factores muy importantes a considerar cuando se desarrollan diferentes
algoritmos de minería de datos. La forma más común de lidiar con la incertidumbre viene
dada por la teoría de probabilidad, sin embargo, la ambigüedad e imprecisión han sido dejadas
de lado hasta la aparición de nuevas formas de tratarlas; dos de las cuales son la teoría de
conjuntos " fuzzy" y "rough."
Con las ideas anteriores en mente, en esta tesis, un algoritmo clásico de clustering basado
en support vectors es estudiado profundamente y extendido a una versión rough-fuzzy con
el fin de darle la habilidad de manejar la ambigüedad e imprecisión presente en el mundo
real. Luego de esto, este novedoso algoritmo de soft-computing es generalizado a una versión
dinámica siendo capaz de procesar bases de datos que reciben nueva información con el paso
del tiempo. Finalmente, utilizando como base estos dos algoritmos, un método de detección
de outliers es propuesto como una de las múltiples posibles aplicaciones que resultan de esta
investigación.
En cada capítulo, los experimentos computacionales, resultados y discusión son provistos
enfatizando la contribución que este trabajo de investigación tiene para la sociedad señalando
los futuros desarrollos y posibles campos de aplicación
General note
Doctor en Sistemas de Ingeniería
Identifier
URI: https://repositorio.uchile.cl/handle/2250/142058
Collections
The following license files are associated with this item: