Diseño e implementación de un servicio de crossmatching astronómico usando Apache Cassandra
Tesis
Access note
Acceso abierto
Publication date
2023Metadata
Show full item record
Cómo citar
Hogan, Aidan
Cómo citar
Diseño e implementación de un servicio de crossmatching astronómico usando Apache Cassandra
Author
Professor Advisor
Abstract
ALeRCE (Automatic Learning for the Rapid Classification of Events) es un broker astron´omico chileno encargado de procesar y clasificar alertas astron´omicas provenientes de
telescopios como Zwicky Transient Facility (ZTF). Estas alertas astron´omicas corresponden
a cambios de naturaleza astrof´ısica detectados en el cielo. El enfoque de ALeRCE es estudiar
objetos transitorios como n´ucleos gal´acticos activos, estrellas variables y la clasificaci´on de
cuerpos del Sistema Solar.
Para filtrar e identificar los datos de las alertas astron´omicas, se realiza un crossmatch,
el cual consiste en buscar y comparar objetos de cat´alogos astron´omicos en posiciones espec´ıficas. No obstante, ALeRCE depende actualmente de un servicio externo para este fin,
CDS X-Match, desarrollado por el Centro de datos astron´omicos de Estrasburgo (Centre de
Donn´ees astronomiques de Strasbourg, o CDS), lo que limita su control sobre los cat´alogos
disponibles y la disponibilidad del sistema. Esta dependencia puede afectar el rendimiento
y la eficiencia del agente de alertas, lo que motiva la necesidad de desarrollar un servicio
interno de crossmatch para ALeRCE que se adapte a sus requerimientos, garantizando un
mejor control sobre los datos y rendimiento del pipeline.
Dadas estas circunstancias, se propone en este trabajo la implementaci´on de un servicio
compuesto por una API que se conecta a una base de datos en Cassandra, donde se encuentre almacenado el cat´alogo astron´omico CatWISE2020. Esta API permite realizar consultas
HTTP para obtener resultados de realizar crossmatch entre una lista de coordenadas y el
cat´alogo. Con esta soluci´on, se busca mejorar el control sobre el proceso de crossmatch, e
idealmente lograr una eficiencia mayor, utilizando Cassandra como sistema de base de datos y
las metodolog´ıas Hierarchical Equal Area iso-Latitude Pixelation (HEALPix) y Hierarchical
Triangular Mesh (HTM) para representar ubicaciones de manera eficiente.
Luego de realizar pruebas para verificar la precisi´on y eficiencia del sistema desarrollado
se determin´o que no hay diferencias significativas entre las t´ecnicas de proyecci´on. En ambos
casos se logr´o un 100 % de coincidencia con los matches obtenidos al utilizar los mismos
par´ametros en CDS. Se observ´o que para conjuntos de m´as coordenadas, CDS es m´as eficiente que el sistema desarrollado. No obstante, al utilizar threads y trabajar con un menor
n´umero de coordenadas, se logr´o mejorar los tiempos de ejecuci´on respecto a los de CDS. Los
resultados logrados cumplen con los requisitos para la integraci´on del servicio de crossmatch
en la API de ALeRCE, no obstante, se sugiere realizar mejoras adicionales a los tiempos
de ejecuci´on, considerando el uso de hilos como una opci´on para garantizar respuestas m´as
r´apidas.
xmlui.dri2xhtml.METS-1.0.item-notadetesis.item
Memoria para optar al título de Ingeniera Civil en Computación
Identifier
URI: https://repositorio.uchile.cl/handle/2250/199059
Collections
The following license files are associated with this item: