Outlier detection for multicandidate electrions with demographic groups
Professor Advisor
dc.contributor.advisor
Thraves Cortés-Monroy, Charles
Author
dc.contributor.author
Ubilla Pavez, Pablo
Associate professor
dc.contributor.other
Sauré Valenzuela, Denis
Associate professor
dc.contributor.other
Ordóñez Pizarro, Fernando
Admission date
dc.date.accessioned
2024-03-18T21:00:02Z
Available date
dc.date.available
2024-03-18T21:00:02Z
Publication date
dc.date.issued
2023
Identifier
dc.identifier.uri
https://repositorio.uchile.cl/handle/2250/197567
Abstract
dc.description.abstract
La inferencia ecológica es una técnica para estimar el comportamiento individual utilizando datos agregados. Un caso particular se encuentra en las elecciones políticas, donde en cada mesa electoral conocemos los votos de los candidatos y el número de votantes de distintos grupos demográficos (como la edad, el sexo y la nacionalidad). En este trabajo, aplicamos el algoritmo EM para estimar las probabilidades de voto de los grupos demográficos para cada candidato en un distrito determinado. Desafortunadamente, el E-step escala exponencialmente en el número de candidatos.
En este estudio proponemos cuatro métodos polinomiales alternativos para estimar las probabilidades del paso E-step: (1) simulación de escenarios utilizando un método de hit-and-run, (2) aproximación utilizando una distribución normal multivariada con integración de Monte Carlo o (3) una distribución normal multivariada utilizando su FDP, y (4) aproximación mediante una única multinomial. Mostramos a partir de experimentos numéricos que el método de aproximación multinomial es el más rápido, ejecutándose en menos de una centésima de segundo. Además, el error absoluto promedio de la probabilidad estimada con este método es muy similar al obtenido al realizar el algoritmo EM con la probabilidad exacta.
Implementamos los métodos propuestos en la primera vuelta de la elección presidencial de Chile de 2021. Presentamos una metodología que utiliza programación entera mixta para agregar grupos y estimar intervalos de confianza en las probabilidades estimadas mediante el uso de bootstraping, de modo que el modelo pueda identificar correctamente las probabilidades de voto. Observamos que los distritos con más mesas electorales se benefician de conjuntos de grupos menos agregados en contraste con los distritos con menos mesas electorales. Finalmente, calculamos p-valores utilizando simulación con la aproximación multinomial, obteniendo 27 urnas electorales con un p-valor menor o igual 1e-08.
es_ES
Patrocinador
dc.description.sponsorship
FONDO PUENTE DAII - FCFM 2023 Powered@NLHPC: Esta tesis fue parcialmente apoyada por la infraestructura de supercómputo del NLHPC (ECM-02)
es_ES
Lenguage
dc.language.iso
en
es_ES
Publisher
dc.publisher
Universidad de Chile
es_ES
Type of license
dc.rights
Attribution-NonCommercial-NoDerivs 3.0 United States