Caracterización genómica de la anchoa europea (Engraulis encrasicolus)
Laburpena
[ES] La anchoa europea, Engraulis encrasicolus (Linnaeus, 1758), es un pequeño pez teleósteo con un amplio rango de distribución que comprende la costa Atlántica de Europa y África occidental, el Mar Mediterráneo y el Mar Negro. Muestra una gran capacidad de dispersión, dando lugar a dos ecotipos genéticamente diferenciados como resultado de aislamientos, dispersiones y colonizaciones pasadas. Se trata de una especie sobreexplotada con gran importancia comercial, particularmente en el mar Cantábrico. La ausencia de recursos genómicos de la anchoa, su amplia distribución y dinámica poblacional, dificulta comprender sus requisitos fisiológicos y ecológicos. En este trabajo, se emplearon las tecnologías de secuenciación de Illumina y PacBio, para generar lecturas cortas (RNA-seq) y largas (HiFi) que fueron utilizadas para el posterior ensamblaje del transcriptoma y genoma, respectivamente, mediante herramientas bioinformáticas. Se obtuvo un genoma con una longitud de 918,56 megabases, formado por 27.218 cóntigos, una longitud de cóntigo N50 de 38,21 kilobases y con una integridad de BUSCO del 60%. Un 45,86% del ensamblaje está formado por elemento repetitivos y se predijeron un total de 35.742 genes codificantes de proteínas. Para complementar la anotación funcional del genoma se ensambló el transcriptoma de huevo de anchoa resultando en 349 megabases con una integridad del 48,7%. Además, se obtuvo el mitogenoma con una longitud de 16.677 pares de bases. Este estudio proporciona un conjunto de datos ómicos y el primer borrador del genoma para Engraulis encrasicolus, que aportará la base para la creación uno de mayor calidad. La disponibilidad de un genoma de referencia permitirá comprender su estructura y función, así como ser utilizado en estudios genómicos comparativos con otros cupléidos. A su vez, representa un recurso esencial para la conservación, gestión y explotación sostenible de la anchoa. [EN] The European anchovy, Engraulis encrasicolus (Linnaeus, 1758), is a small teleost fish with a wide distribution range that includes the Atlantic coast of Europe and western Africa, the Mediterranean Sea and the Black Sea. It has a great dispersal capacity, giving rise to two genetically differentiated ecotypes as a result of past isolations, dispersals, and colonizations. It is an overexploited species with great commercial importance, particularly in the Cantabrian Sea. The absence of genomic resources of the anchovy, its wide distribution and population dynamics, makes more difficult to understand its physiological and ecological requirements. In this work, Illumina and PacBio sequencing technologies were used to obtain short (RNA-seq) and long (HiFi) reads that were used for the subsequent assembly of the transcriptome and genome, respectively, using bioinformatics tools. A genome with a length of 918.56 megabases was obtained, made up of 27,218 contigs, an N50 contig length of 38.21 kilobases and with a 60% BUSCO integrity. A 45.86% of the assembly was formed by repetitive elements and a total of 35,742 protein-coding genes were predicted. To complement the functional annotation of the genome, the anchovy egg transcriptome was assembled, resulting in 349 megabases with 48.7%. integrity. Furthermore, the mitogenome with a length of 16,677 base pairs was obtained. This study provides a set of omic data and the first draft genome of Engraulis encrasicolus, which will provide the basis for the creation of a higher quality one. The availability of a reference genome will allow to understand its structure and function, as well as to be used in comparative genomic studies with other clupleid fishes. In turn, it represents an essential resource for the conservation, management and sustainable exploitation of the anchovy.