Show simple item record

Professor Advisordc.contributor.advisorThraves Cortés-Monroy, Charles
Authordc.contributor.authorUbilla Pavez, Pablo
Associate professordc.contributor.otherSauré Valenzuela, Denis
Associate professordc.contributor.otherOrdóñez Pizarro, Fernando
Admission datedc.date.accessioned2024-03-18T21:00:02Z
Available datedc.date.available2024-03-18T21:00:02Z
Publication datedc.date.issued2023
Identifierdc.identifier.other10.58011/eksh-cq28
Identifierdc.identifier.urihttps://repositorio.uchile.cl/handle/2250/197567
Abstractdc.description.abstractEcological inference is a technique to estimate individual behaviour by using aggregated data. A particular case is found in political elections where in each ballot box we know the candidates’ votes and the number of voters for different demographic group (like age, sex and nationality). In this work, we apply the EM-algorithm to estimate the voting probabilities of demographic groups for each candidate at a particular district. Unfortunately, the E-Step scales exponentially in the number of candidates. We propose four alternative polynomial methods to estimate the E-Step probabilities: (1) sample scenarios using hit-and-run, (2) approximate using a multivariate normal with Monte Carlo integration or (3) a multivariate normal using its PDF, and (4) approximate by a single multinomial. We show from numerical computations that the multinomial approximation method is the fastest, running in less than a hundredth of a second. In addition, the mean absolute error of the estimated probability with this method is very similar to the one obtained when performing the EM-algorithm with the exact probability. We run the proposed methods in the first round Chilean Presidential Election of 2021. We present a methodology that uses mixed integer programming to aggregate groups, and estimate confidence intervals on the estimated probabilities by using bootstrapping, so that the model can correctly identify the voting probabilities. We observe that districts with more ballot boxes benefit from less aggregated group sets in contrast to districts with less ballot boxes. Finally, we compute p-values using simulation with the multinomial approximation, obtaining 27 ballot-boxes with a p-value lower or equal than 10−8.
Abstractdc.description.abstractLa inferencia ecológica es una técnica para estimar el comportamiento individual utilizando datos agregados. Un caso particular se encuentra en las elecciones políticas, donde en cada mesa electoral conocemos los votos de los candidatos y el número de votantes de distintos grupos demográficos (como la edad, el sexo y la nacionalidad). En este trabajo, aplicamos el algoritmo EM para estimar las probabilidades de voto de los grupos demográficos para cada candidato en un distrito determinado. Desafortunadamente, el E-step escala exponencialmente en el número de candidatos. En este estudio proponemos cuatro métodos polinomiales alternativos para estimar las probabilidades del paso E-step: (1) simulación de escenarios utilizando un método de hit-and-run, (2) aproximación utilizando una distribución normal multivariada con integración de Monte Carlo o (3) una distribución normal multivariada utilizando su FDP, y (4) aproximación mediante una única multinomial. Mostramos a partir de experimentos numéricos que el método de aproximación multinomial es el más rápido, ejecutándose en menos de una centésima de segundo. Además, el error absoluto promedio de la probabilidad estimada con este método es muy similar al obtenido al realizar el algoritmo EM con la probabilidad exacta. Implementamos los métodos propuestos en la primera vuelta de la elección presidencial de Chile de 2021. Presentamos una metodología que utiliza programación entera mixta para agregar grupos y estimar intervalos de confianza en las probabilidades estimadas mediante el uso de bootstraping, de modo que el modelo pueda identificar correctamente las probabilidades de voto. Observamos que los distritos con más mesas electorales se benefician de conjuntos de grupos menos agregados en contraste con los distritos con menos mesas electorales. Finalmente, calculamos p-valores utilizando simulación con la aproximación multinomial, obteniendo 27 urnas electorales con un p-valor menor o igual 1e-08.
Patrocinadordc.description.sponsorshipFONDO PUENTE DAII - FCFM 2023 Powered@NLHPC: Esta tesis fue parcialmente apoyada por la infraestructura de supercómputo del NLHPC (ECM-02)es_ES
Lenguagedc.language.isoenes_ES
Publisherdc.publisherUniversidad de Chilees_ES
Type of licensedc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
Link to Licensedc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
Títulodc.titleOutlier detection for multicandidate elections with demographic groupses_ES
Title in another languagedc.title.alternativeDetección de valores atípicos en elecciones con múltiples candidatos y grupos demográficos
Document typedc.typeTesises_ES
dc.description.versiondc.description.versionVersión original del autores_ES
dcterms.accessRightsdcterms.accessRightsAcceso abiertoes_ES
Catalogueruchile.catalogadorgmmes_ES
Departmentuchile.departamentoDepartamento de Ingeniería Industriales_ES
Facultyuchile.facultadFacultad de Ciencias Físicas y Matemáticases_ES
uchile.titulacionuchile.titulacionDoble Titulaciónes_ES
uchile.carrerauchile.carreraIngeniería Civil Industriales_ES
uchile.gradoacademicouchile.gradoacademicoMagisteres_ES
uchile.notadetesisuchile.notadetesisTesis para optar al grado de Magíster en Gestión de Operacioneses_ES
uchile.notadetesisuchile.notadetesisMemoria para optar al título de Ingeniero Civil Industrial


Files in this item

Icon

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 United States
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States