Outlier detection for multicandidate electrions with demographic groups
Tesis
Access note
Acceso abierto
Publication date
2023Metadata
Show full item record
Cómo citar
Thraves Cortés-Monroy, Charles
Cómo citar
Outlier detection for multicandidate electrions with demographic groups
Author
Professor Advisor
Abstract
La inferencia ecológica es una técnica para estimar el comportamiento individual utilizando datos agregados. Un caso particular se encuentra en las elecciones políticas, donde en cada mesa electoral conocemos los votos de los candidatos y el número de votantes de distintos grupos demográficos (como la edad, el sexo y la nacionalidad). En este trabajo, aplicamos el algoritmo EM para estimar las probabilidades de voto de los grupos demográficos para cada candidato en un distrito determinado. Desafortunadamente, el E-step escala exponencialmente en el número de candidatos.
En este estudio proponemos cuatro métodos polinomiales alternativos para estimar las probabilidades del paso E-step: (1) simulación de escenarios utilizando un método de hit-and-run, (2) aproximación utilizando una distribución normal multivariada con integración de Monte Carlo o (3) una distribución normal multivariada utilizando su FDP, y (4) aproximación mediante una única multinomial. Mostramos a partir de experimentos numéricos que el método de aproximación multinomial es el más rápido, ejecutándose en menos de una centésima de segundo. Además, el error absoluto promedio de la probabilidad estimada con este método es muy similar al obtenido al realizar el algoritmo EM con la probabilidad exacta.
Implementamos los métodos propuestos en la primera vuelta de la elección presidencial de Chile de 2021. Presentamos una metodología que utiliza programación entera mixta para agregar grupos y estimar intervalos de confianza en las probabilidades estimadas mediante el uso de bootstraping, de modo que el modelo pueda identificar correctamente las probabilidades de voto. Observamos que los distritos con más mesas electorales se benefician de conjuntos de grupos menos agregados en contraste con los distritos con menos mesas electorales. Finalmente, calculamos p-valores utilizando simulación con la aproximación multinomial, obteniendo 27 urnas electorales con un p-valor menor o igual 1e-08.
xmlui.dri2xhtml.METS-1.0.item-notadetesis.item
Tesis para optar al grado de Magíster en Gestión de Operaciones Memoria para optar al título de Ingeniero Civil Industrial
Patrocinador
FONDO PUENTE DAII - FCFM 2023 Powered@NLHPC: Esta tesis fue parcialmente apoyada por la infraestructura de supercómputo del NLHPC (ECM-02)
Identifier
URI: https://repositorio.uchile.cl/handle/2250/197567
Collections
The following license files are associated with this item: