Gender classification using pair group feature selection based on mutual information from frontal faces and iris images
Tesis
Publication date
2015Metadata
Show full item record
Cómo citar
Pérez Flores, Claudio
Cómo citar
Gender classification using pair group feature selection based on mutual information from frontal faces and iris images
Author
Professor Advisor
Abstract
El uso de imágenes de rostros o iris para estimar información demográfica, tal como género, raza, edad y emociones se denomina Soft Biometrics . En un marco de reconocimiento biométrico, la información de género nos puede ayudar a buscar solo en la mitad de la base de datos. La mayoría de los métodos reportados en la literatura usan todas las características disponibles para la clasificación de imágenes. En el procesamiento de imágenes, el ingreso directo de los datos a los clasificadores tiene una alta dimensionalidad y un limitado número de ejemplos. En este escenario la selección de características juega un rol importante mejorando la tasa de clasificación, la eficiencia y la escalabilidad de las imágenes en el proceso de identificación. Un manera de realizar esta tarea, es mediante la selección de características usando información mutua (IM)
y ordenándolas en un ranking de acuerdo a su valor individual de relevancia usando métodos de filtros. Los métodos de ranking se caracterizan por ser rápidos y efectivos, particularmente cuando el número de características es grande y el número de ejemplos disponibles para entrenamiento es comparativamente pequeño, como en el caso de los bases de datos benchmark (Sonar, Spambase, Ionosphere y Madelon). Sin embargo, el ranking reduce la capacidad de selección debido a que no estima ningún tipo de complementariedad entre las variables, lo cual es poco adecuado para la función de selección de conjuntos de datos que tienen altos niveles de complementariedad. Las posibles redundancias entre más de dos variables no se tienen en cuenta.
Dos métodos fueron desarrollados en esta tesis, el primero selecciona características en pares y el segundo en grupos. En el primer método, usamos selección de características basados en la información mutua en pares, aplicada al problema de clasificación de género usando rostros frontales e iris. Se fusionaron las características seleccionadas obtenidas desde la intensidad de los píxeles, forma y textura en varias escalas espaciales. Los resultados fueron evaluados y comparados con los publicados anteriormente en bases de datos estándares tales como las bases de datos FERET y UND usadas para ambientes controlados y la base de datos Labeled Faces in the Wild (LFW) para ambientes no controlados. Este método fue también aplicado a imágenes de iris de bandas espectrales cercanas al infrarrojo de la Universidad de Notre Dame, llamada Gender From Iris (GFI).
El segundo método es basado en filtros y envolventes (filtrappers), para la selección de características en grupo en vez de pares usando información mutua. Este método fue aplicado a la clasificación de género usando rostros e imágenes de iris. La selección de grupos basadas en características relevantes y redundantes fue realizada asignándole un peso a cada característica en relación a sus vecinos. El método fue aplicado a imágenes de rostros usando las bases de datos UND, LFW, MORPH II y en iris usando la base de datos GFI.
Los resultados del primer método de selección de características usando rostros, fueron obtenidos con la fusión de 18.900 características seleccionadas alcanzando una tasa de clasificación de 99.13% en la base de datos FERET. Para la base de datos UND, la mejor tasa de clasificación de género fue obtenida por la fusión de 14.200 características seleccionadas con 94.01%. Para la base de datos LFW la mejor tasa de clasificación fue obtenida con la fusión de 10.400 características seleccionadas, usando 3 escalas espaciales diferentes con un 98.01%. A nuestro entender estos resultados son los mejores resultados reportados para la clasificación de género usando estas bases de datos. Dependiendo del tamaño de la imagen, el número total de características seleccionadas fue reducido a lo menos en 70% en FERET, 73% en UND y 90% en LFW.
En iris, el mejor resultado usando ventanas de 10x10 con un solapamiento del 50% usando histogramas de LBP(8,1) fue de 91.33%, Este nivel de precisión superar los resultados previamente publicados.
Para el segundo método, la mejor tasa de clasificación fue obtenida para la base de datos UND en la fusión de 2.100 características seleccionadas y 30 vecinos cercanos con un 98.25%. El mejor resultado para la base de datos MORPH II fue obtenida con 1.300 características y 25 vecinos cercanos con un 95.50%. Para la base de datos LFW el mejor resultado fue obtenido con 900 características y 25 vecinos cercanos con un 97%, usando validación cruzada de cinco grupos. Nuestros resultados muestran que la clasificación de género puede ser mejorada significativamente mediante el uso de la selección de características en grupos. La mejor tasa de clasificación para el uso de benchmark fue obtenida por la base de datos Sonar, obteniendo 95.68% usando 55 características y 35 vecinos cercanos. En la selección de características para iris, nuestra propuesta obtiene una precisión de 89% basada en la fusión de la información de las mejores características provenientes del iris derecho e izquierdo.
General note
Doctor en Ingeniería Eléctrica
Identifier
URI: https://repositorio.uchile.cl/handle/2250/137825
Collections
The following license files are associated with this item: