Studying the relationship of biotic and abiotic processes in the ocean biome from the point of view of genomic regulation
Tesis
Access note
Acceso abierto
Publication date
2023Metadata
Show full item record
Cómo citar
Maass Sepúlveda, Alejandro
Cómo citar
Studying the relationship of biotic and abiotic processes in the ocean biome from the point of view of genomic regulation
Author
Professor Advisor
Abstract
El océano, que abarca el 70% de la superficie de la Tierra, presenta muchos ecosistemas,
cada uno caracterizado por hábitats, temperaturas y nutrientes distintos. En el núcleo de
estos ecosistemas se encuentra el microbioma oceánico, dominado por entidades planctónicas
como las bacterias, que juegan un papel fundamental en los ciclos biogeoquímicos, influyen
en los patrones climáticos globales y contribuyen al ciclo del carbono de la Tierra. Con un
enfoque en la regulación genómica dentro de estas comunidades bacterianas, este trabajo usa
el conjunto de datos generado por la expedición TARA Oceans para estudiar las relaciones
de los factores de transcripción con las variables ambientales marinas.
En esta tesis, nuestro objetivo específico es analizar cómo las abundancias de los motivos
de unión asociados a una familia de 88 factores de transcripción, presentes en las regiones
intergénicas de un metagenoma bacteriano, pueden capturar las condiciones ambientales.
Para ello, utilizamos los metagenomas bacterianos reconstruidos de las expediciones TARA
Oceans y construimos una matriz de abundancia, donde las filas representan una muestra (o
un metagenoma bacteriano), las columnas están asociadas a un factor de transcripción (de
los 88 utilizados), y en cada posición de la celda almacenamos la abundancia de los motivos
de unión asociados al factor de transcripción en las regiones intergénicas de la muestra. El
objetivo principal de este trabajo es descubrir si esta información biótica está relacionada
de alguna manera con los datos ambientales, en particular, si podemos predecir características del ambiente a partir de la información regulatoria de los metagenomas bacterianos
encapsulada en esta matriz.
Analizamos nuestro conjunto de datos de variables ambientales y biológicas primeramente
desde un punto de vista descriptivo. Investigamos la estructura de estas variables, revelando
agrupaciones de factores de transcripción independientes de su funcionalidad e identificando
interacciones biótico-abióticas clave influenciadas por la geografía y la profundidad del agua
marina. Luego exploramos la estructura de nuestras matrices biológicas utilizando reducción
de dimensionalidad y construimos modelos predictivos. Estos modelos diferencian muestras
de aguas oceánicas polares y no polares, regiones oceánicas y profundidades de capas de agua.
Desarrollando un concepto de robustez para las predicciones, enfatizamos, por ejemplo, los
roles de FabR y BirA en la diferenciación de la polaridad y capas oceánicas respectivamente.
Estos hallazgos subrayan el papel de los factores de transcripción como sensores ambientales relevantes, afirmando nuestra hipótesis inicial. Además, refuerzan la noción de que un
número limitado de componentes puede producir predicciones significativas, en contraste con
el énfasis en genes o virus como objeto principal de estudio. The ocean, encompassing 70% of Earth’s surface, presents an intricate tapestry of ecosystems, each characterized by distinct habitats, temperatures, nutrients, etc. At the core of
these ecosystems is the ocean microbiome, dominated by planktonic entities such as bacteria,
which play a paramount role in biogeochemical cycles, influence global climate patterns, and
contribute to Earth’s carbon cycle. With an emphasis on the genomic regulation within these
bacterial communities, this research exploits the immense dataset generated by the TARA
Oceans expedition to investigate the relations of transcription factors, the molecular switches
of genomic regulation, with marine environmental variables.
In this thesis, we specifically aim to analyze how the abundances of the binding motifs
associated to a family of 88 transcription factors, appearing in the intergenic regions of a
bacterial metagenome, are able to capture the environmental conditions. For that, we used
the bacterial metagenomes reconstructed from TARA Ocean expeditons and we build an
abundance matrix, where rows represent a sample (or a bacterial metagenome), columns are
associated to a transcription factor (among the 88 used), and at each cell position we store
the abundance of the binding motifs associated to the transcription factor in the intergenic
regions of the sample. The main objetive of this work is to unravel whether this biotic
information is related in some way with environmental data, in parituclar, if we can predict
characteristics of the enviroment from the regulatory information of bacterial metagenomes
encapsulated in this matrix.
We comprehensively analyzed our dataset of environmental and biological variables, referencing literature for the environmental aspects and visualizing distributions for the biological
ones. We probed the structure of these variables, revealing clusters of transcription factors
independent of their functionality and identifying key biotic-abiotic interactions influenced
by geography and seawater depth. We then explored our biological matrices’ geometry using
dimensionality reduction and built predictive models. These models differentiate samples
from polar-non polar, ocean regions and layer depth seawaters. Developing a robustness concept for the predictions, we emphasize, for instance, the roles of FabR and BirA in polarity
and layer differentiation respectively.
These results accentuate transcription factors as key environmental indicators, demonstrating that a few select components can provide significant predictions. This challenges the
conventional focus on genes or viruses as primary study objects.
xmlui.dri2xhtml.METS-1.0.item-notadetesis.item
Tesis para optar al grado de Magíster en Ciencias de la Ingeniería, Mención Matemáticas Aplicadas Memoria para optar al título de Ingeniero Civil Matemático
Patrocinador
CMM ANID BASAL FB210005, INSTITUTO MILENIO Nº ICN2021 044 Y
PROYECTO EXPLORACIÓN ANID No 1322000.
Identifier
URI: https://repositorio.uchile.cl/handle/2250/198787
Collections
The following license files are associated with this item: