Evaluación de la precisión de imputación de genotipos utilizando diferentes densidades para un panel de SNP (single nucleotide polymorphisms) de Cobia (Rachycentron canadum)
Access note
Acceso abierto
Publication date
2022Metadata
Show full item record
Cómo citar
Yáñez López, José Manuel
Cómo citar
Evaluación de la precisión de imputación de genotipos utilizando diferentes densidades para un panel de SNP (single nucleotide polymorphisms) de Cobia (Rachycentron canadum)
Author
Professor Advisor
Abstract
La producción de cobia (Rachycentron canadum) se verá ampliamente beneficiada con la implementación de un programa de mejoramiento genético. La aplicación de paneles de SNP de alta densidad permitirá implementar metodologías de mejoramiento, tales como la selección genómica (GS) y estudios de asociación del genoma completo (GWAS), los cuales pueden acelerar el progreso genético de la especie. La aplicación de paneles de SNP de alta densidad implica costos elevados de genotipado, limitando su implementación.
La imputación de genotipos permite disminuir el costo del uso de información genómica, mediante la utilización de paneles de SNP de baja densidad imputados a mayor densidad, con una precisión determinada. El presente trabajo apuntó a evaluar la precisión de imputación desde un panel de baja densidad a un panel de alta densidad bajo diferentes densidades de paneles de SNP en una población de cobia. Un total de 192 animales fueron genotipados mediante metodología ddRAD-seq, generando 8.894(9K) posterior al control de calidad. La precisión de imputación fue evaluada mediante diferentes densidades de paneles de SNPs (2K, 1K, 0,5K y 0,1K) obtenidos mediante pruning del desequilibrio de ligamiento del panel de 9K usando diferentes valores de R2 (0,29, 0,13, 0,048 y 0,003). Para la imputación un esquema quíntuple de validación cruzada fue aplicado usando como grupo de referencia un 80% de los individuos y un 20% de los individuos como grupo de validación. La precisión de imputación de los genotipos se evaluó mediante la correlación entre genotipos observados e imputados, la cual fue mayor en la densidad 2K (0,53 ± 0,19), seguido por 1K (0,36 ± 0,21), 0,5K (0,20 ± 0,21) y 0,1K (0,06 ± 0,16). Las diferencias entre las precisiones de imputación según las distintas densidades pueden ser explicadas por: densidad de marcadores en los animales como referencia y la cantidad de estos, ausencia de pedigrí disponible, parentesco de la población, variabilidad genómica de los marcadores y presencia de gaps al genotipar con metodología ddRAD-seq. Concluyendo que la densidad de 2K permite obtener un panel de 6K con la mayor precisión de imputación, abaratando un 27% de los costos, en una producción tipo Cobia (Rachycentron canadum) production will greatly benefit from the implementation of a genetic improvement program. The application of high-density SNP panels will allow the implementation of breeding methodologies, such as genomic selection (GS) and genome-wide association studies (GWAS), which can accelerate the genetic progress of the species. The application of high-density SNP panels implies high genotyping costs, limiting its implementation. The imputation of genotypes makes it possible to reduce the cost of using genomic information, using panels of low-density SNPs imputed at higher density, with a certain precision. The present work aimed to evaluate the imputation accuracy from a low-density panel to a high-density panel under different SNP panel densities in a cobia population. A total of 192 animals were genotyped using the ddRAD-seq methodology, generating 8,894(9K) after quality control. Imputation accuracy was assessed using different densities of SNP panels (2K, 1K, 0.5K and 0.1K) obtained by linkage disequilibrium pruning of the 9K panel using different R2 values (0.29, 0.13, 0.048 and 0.003). For the imputation, a quintuple cross-validation scheme was applied using 80% of the individuals as the reference group and 20% of the individuals as the validation group. The imputation accuracy of the genotypes was evaluated by the correlation between observed and imputed genotypes, which was higher at density 2K (0.53 ± 0.19), followed by 1K (0.36 ± 0.21), 0 .5K (0.20 ± 0.21) and 0.1K (0.06 ± 0.16). The differences between the imputation precisions according to the different densities can be explained by: density of markers in the reference animals and their quantity, absence of pedigree, kinship of the population, genomic variability of the markers and presence of gaps in the genotype with ddRAD-seq methodology. Concluding that the 2K density allows to obtain a 6K panel with the highest imputation precision, lowering costs by 27%, in a typical production setting
xmlui.dri2xhtml.METS-1.0.item-notadetesis.item
Memoria para optar al Título Profesional de Médico Veterinario
Collections
The following license files are associated with this item: