Data mining and machine learning algorithms in cosmology to optimize the constraining power of parameters by bayesian inference
Tesis
Publication date
2020Metadata
Show full item record
Cómo citar
Sapone, Domenico
Cómo citar
Data mining and machine learning algorithms in cosmology to optimize the constraining power of parameters by bayesian inference
Author
Professor Advisor
Abstract
El objetivo de esta tesis es explorar algunos algoritmos de minería de datos y aprendizaje de máquinas aplicados a datos cosmológicos, especialmente a los observables obtenidos del agrupamiento de galaxias en la estructura a gran escala de nuestro Universo. Revisamos como obtener esos observables para el catálogo "New York University Value-Added Galaxy Catalog", del cual reducimos aproximadamente 600000³ coordenadas de galaxias a tan solo 45³ números. Luego, procedemos a constreñirlos, para adquirir información cosmológica, usando el modelo ΛCDM e inferencia Bayesiana. Además, obtenemos los resultados usando dos algoritmos: Metropolis-Hastings y DELFI; que están basados en cadenas de Marcov y redes neuronales, respectivamente. Donde el último puede ser más eficiente que el primero bajo una arquitectura apropiada. Concluimos que los resultados obtenidos de ambos métodos son consistentes, pero los errores en los parámetros de Shift y Redshift Space Distortions son subestimados en comparación con otros trabajos que usaron datos similares.
También usamos las medidas de fσ8(z) de diferentes catálogos junto a medidas de H(z), obtenidas de los cronómetros cósmicos, para comparar diferentes modelos de Energía Oscura. Utilizamos diferentes criterios estadísticos, como la evidencia Bayesiana, el criterio de información Bayesiano, el criterio de información de Akaike y la figura de mérito. Finalmente, contrastamos esos criterios para todos los modelos y concluimos que el modelo ΛCDM es siempre el favorecido con estos datos.
Además, exploramos los observables obtenidos del agrupamiento de galaxias del catálogo "SDSS DR7 main galaxy sample", usando diferentes tipos de galaxias como trazadores. El uso de múltiples trazadores puede inducir un sesgo en la función de correlación, que se refleja en su amplitud y en el pico de las oscilaciones acústicas de bariones. Sin embargo, como estas galaxias trazan la misma distribución de Materia Oscura, esperamos que el sesgo sea pequeño y que el uso conjunto de los múltiples trazadores nos ayude a reducir la varianza cósmica. Finalmente, concluimos que el sesgo es bajo y que los resultados son estadísticamente consistentes entre los trazadores. Asimismo, al combinar la covarianza de las galaxias, obtenemos resultados concordantes con otros trabajos que usaron los mismos datos.
Finalmente, estudiamos como el tamaño y el número de celdas, para obtener la covarianza de los multipolos de la función de correlación usando la técnica de jackknife, afecta en su precisión para el catálogo "SDSS-III BOSS CMASS sample". Además, los comparamos con covarianzas obtenidas a través de catálogos de galaxias simulados con la estimación log-normal, bajo la misma área del catálogo original. Queremos saber cuál es el error propagado a la escala característica de las oscilaciones acústicas de bariones, y para aquello utilizamos la corrección de tapering en ambas covarianzas. En conclusión, encontramos que aquel error no depende de la escala asociada del método de jackknife.
General note
Tesis para optar al grado de Magíster en Ciencias, Mención Física
Patrocinador
FONDECYT Iniciación N. 11140496 y FONDECYT Regular N. 1200171
Identifier
URI: https://repositorio.uchile.cl/handle/2250/179923
Collections
The following license files are associated with this item: