Contributions to the study of chemical evolution in the solar neighbourhood using phylogenetic trees
Tesis

Access note
Acceso abierto
Publication date
2024Metadata
Show full item record
Cómo citar
San Martín Aristegui, Jaime
Cómo citar
Contributions to the study of chemical evolution in the solar neighbourhood using phylogenetic trees
Professor Advisor
Abstract
El enriquecimiento químico juega un papel importante en la formación y evolución de nuestra Galaxia, con avances obtenidos a partir de surveys como GALAH y Gaia-ESO, que han observado cientos de miles de estrellas para las cuales se han medido abundancias químicas de hasta 30 elementos. Aunque este aumento de datos es esencial, se necesitan herramientas para analizar conjuntos de datos más grandes. Este trabajo se centra en dos aspectos: extraer información química de las estrellas mediante espectroscopía estelar y analizar abundancias químicas para recuperar una historia evolutiva del enriquecimiento químico galáctico.
La historia galáctica comparte algunas características con la evolución biológica. De hecho, estudios anteriores han demostrado que pueden implementarse técnicas filogenéticas para reconstruir la evolución de la formación estelar dentro de la vecindad solar utilizando una muestra pequeña pero muy precisa de abundancias estelares de gemelas solares. Sin embargo, la interpretación de sus resultados fue difícil debido a los efectos de selección en sus muestras estelares, que eran una muestra bastante pequeña de espectros obtenidos de archivos públicos.Aunque los principales surveys espectroscópicos recolectan datos de millones de estrellas, existe un trade-off entre la escala de los datos con su resolución y precisión, que son necesarias para realizar estudios filogenéticos de alta calidad a partir de datos de abundancias químicas.
Así pues, esta tesis está motivada por la creación cuidadosa de una muestra de abundancias químicas de alta precisión a partir de datos obtenidos de surveys, para luego utilizar un algoritmo de árboles filogenéticos para evaluar las secuencias de formación de la Vía Láctea.
En este trabajo, realizamos el primer estudio de un árbol filogenético a partir de datos de un survey, centrándonos en las gemelas solares del tercer data release de GALAH. Utilizamos el algoritmo de aprendizaje automático basado en datos The Cannon para mejorar las incertezas de las abundancias del catálogo mediante la selección de un conjunto de entrenamiento adaptado después de un estudio sistemático del proceso de entrenamiento del modelo. Para validar nuestros resultados, comparamos las predicciones de nuestro modelo The Cannon y las incertezas reportadas en varios ratios de señal-a-ruido (SNR) con los datos de GALAH DR3. El catálogo resultante se utiliza luego para construir árboles filogenéticos. Al emplear el algoritmo de Neighbour-Joining (NJ) y el árbol de Maximum-Clade-Credibility (MCC), comparamos los árboles filogenéticos obtenidos con los datos de The Cannon y GALAH DR3, donde evaluamos la consistencia y significancia astrofísica de los grupos identificados.
Este trabajo sienta nuevas bases para el prometedor futuro de la filogenética galáctica, donde podemos hacer uso de grandes surveys espectroscópicos con aprendizaje de máquinas cuando sea necesario para mejorar la precisión de las abundancias químicas, y utilizar herramientas filogenéticas para estudiar la evolución química de nuestra Galaxia Vía Láctea Chemical enrichment plays an important role in the formation of evolution of our Galaxy,
with insights gleaned from surveys like GALAH and Gaia-ESO, which have observed hundreds of thousands of stars for which chemical abundances for up to 30 elements have been
measured. While this increase of data is essential, tools for analysing larger datasets are
needed. This work focuses on two aspects: extracting chemical information from stars via
stellar spectroscopy and analysing chemical abundances to retrieve an evolutionary history
of Galactic chemical enrichment.
Galactic history shares some features with biological evolution. Indeed, previous studies
have shown that phylogenetic techniques can be employed to reconstruct the evolution of star
formation within the solar neighbourhood using a small but very precise sample of stellar
abundances of solar twins. Interpreting their results was difficult because of selection effects
in their stellar samples, which were a rather small sample of spectra obtained from public
archives. While major spectroscopic surveys retrieve data on millions of stars, there is a tradeoff between the scale of data and its resolution and precision, which is necessary to perform
high quality phylogenetic studies from abundance data. This thesis is thus motivated by
carefully creating a sample of high-precision chemical abundances from survey data, to then
use a phylogenetic tree algorithm to assess the formation sequences of the Milky Way.
In this work, we make the first study of a phylogenetic tree from survey data, focusing on
the solar twins from GALAH’s third data release. We use the data-driven machine learning
algorithm The Cannon to improve the abundance uncertainties of the catalogue by selecting
a tailored training set after a systematic assessment of the model’s training step. To validate
our results, we compare our The Cannon model predictions and reported uncertainties at
various signal-to-noise ratios (SNR) with GALAH DR3 data. The resulting catalogue is
then utilised to construct phylogenetic trees. By employing the Neighbour-Joining (NJ)
algorithm and the Maximum-Clade-Credibility (MCC) tree, we compare the phylogenetic
trees obtained with The Cannon and GALAH DR3 data and evaluate the consistency and
astrophysical significance of their identified groups.
This work sets further basis for the promising future of Galactic phylogenetics, where
we can make use of large spectroscopic surveys with machine learning when needed to improve the precision of chemical abundances, and use phylogenetic tools to study the chemical
evolution of our Milky Way Galaxy
xmlui.dri2xhtml.METS-1.0.item-notadetesis.item
Tesis para optar al grado de Magíster en Ciencias de la Ingeniería, Mención Matemáticas Aplicadas Memoria para optar al título de Ingeniero Civil Matemático
Patrocinador
CMM ANID Basal FB210005
Núcleo Milenio ERIS N◦ NCN2021_017
ANID Magíster Nacional N◦ 22230932
Collections
The following license files are associated with this item: