Con el propósito de constituir la librería de secuencias de código de barras de ADN de flora de la Amazonia colombiana, se ensamblaron y editaron secuencias de ADN de las regiones génicas rbcL, matK, ITS2, pbsA-trnH, pbsK-pbsI, rpl16, rpoB, rpoC1 y trnL. A partir de esta actividad se seleccionaron 2370 secuencias que se encuentran distribuidas en las regiones génicas según se aprecia en la Figura 9.

Figura 9. Cantidad de secuencias amplificadas por región génica

Figura 9. Cantidad de secuencias amplificadas por región génica en la librería de códigos de barra de la flora amazónica colombiana.

Como se observa en la Figura 9, la mayor cantidad de secuencias que contiene la librería corresponden a los genes matK y rbcL, dado que son los genes estándar seleccionados por la iniciativa mundial de códigos de barra de ADN, y que además son la base de información de la iniciativa que se está desarrollando actualmente denominada BIOSCAN, el cual es un programa de iBOLD que emplea los códigos de barra de ADN para agilizar la identificación de especies, investigar las interacciones y dinámicas entre especies (Metabarcoding), de esta forma el programa BIOSCAN comenzará a compilar una línea base integral de biodiversidad.

Considerando todas las secuencias obtenidas, 459 especies amazónicas tienen información de códigos de barra de ADN con uno o varios de los genes mencionados anteriormente. Una síntesis del número de secuencias por familia se puede observar en la Figura 10. La familia con mayor número de secuencias es Cyatheaceae, esto porque los códigos de barra para este tipo de especies no están completamente definidos, por lo que cada especie tiene dos o más genes secuenciados. Vale la pena aclarar que están por definir la especie, género o familia de 135 secuencias, por tanto, aumenta el número de especies de flora amazónica con información de códigos de barra de ADN.

Figura 10. Secuencias de ADN por familia botánica

Figura 10. Secuencias de ADN por familia botánica

De acuerdo con la base de datos pública de códigos de barra BOLD la representación de secuencias de la división Magnoliophyta en Colombia es de 816 registros, de los cuales 297 han sido publicados por el Instituto SINCHI.

Por otro lado, en la base de datos pública del Genbank no se encuentran representadas ni el 50% de las especies de Flora que actualmente comprenden la librería de secuencias de Mark o rbcL del Instituto: en el caso se matK, de las 299 especies para las que se tienen datos con este gen, solo se encontraron 107 especies en el Genbank y, para el gen rbcL para el cual se tiene información de 431 especies, la consulta realizada en el Genbank arrojó datos públicos para 180 especies.

Por estas razones, se procedió a la documentación de la preparación de datos de secuencia de ADN para su sometimiento en bases de datos públicas (p.e. Genbank, BOLD) esto con el fin de visibilizar y publicar esta información y para el cumplimiento de requisitos de publicación de documento científico. Para tal fin, se realizó el proceso de anotación de las secuencias matK y rbcL (1870 secuencias en total), el cual es el proceso de identificar los elementos funcionales de la secuencia para darle el sentido a la misma y requisito fundamental para su publicación en este tipo de bases de datos.

Con el propósito de avanzar en el desarrollo e identificación de marcadores moleculares para trazabilidad de madera en Cedrela odorata, se realizó el aislamiento de ADN de más de 100 individuos de esta especie distribuidos en la región amazónica. Se espera que estas muestras aumenten el número de individuos que ya se tienen de la especie y determinar una posible estructura genética de la especie en la región.

Fichas del capítulo I

Fichas del capítulo I, 2019