Subscribe RSS

Por Morgan Echeverry-Solarte





Durante los últimos años del siglo XX las ciencias biológicas vivieron una revolución. En ese entonces, los conocimientos científicos y los avances tecnológicos permitieron empezar proyectos investigativos cuya finalidad era revelar las secuencias de los genomas de varias especies. El mas renombrado caso fue el proyecto genoma humano; sin embargo, al mismo tiempo, el genoma de varios organismos como la mosca de la fruta ( Drosophila melanogaster), el nemátodo de suelo ( Caenorhabditis elegans), el ratón ( Mus musculus), entre otros, fueron también estudiados en detalle. En el caso del reino de las plantas, el primer genoma revelado fue el de Arabidopsis thaliana, una pequeña planta con un ciclo de vida corto, la cual ha servido como organismo modelo. No obstante, el interés de muchos investigadores a nivel mundial ha estado concentrado en la familia de plantas con mayor impacto económico: La familia de las gramíneas (también denominada Poacea).

Dentro de la familia de las gramíneas encontramos el grupo de plantas conocidas como cereales. En términos generales, los cereales son un tipo de plantas herbáceas, los cuales son cultivados por sus frutos comestibles (denominado en términos botánicos como cariopsis). Los cereales más importantes en la actualidad son el arroz (subfamilia Ehrhartoideae), el trigo, la cebada y la avena (subfamilia Pooidae), así como el maíz, sorgo y el millo (subfamilia Panicoideae). Estas plantas han acompañado a la humanidad desde sus comienzos, de hecho, el nombre cereal es derivado de la diosa Romana de la agricultura Ceres. Igualmente, se considera que la domesticación de cereales como el trigo y la cebada fue fundamental para el desarrollo de las primeras civilizaciones en la antigua Mesopotamia; y en el caso del maíz, este fue esencial para el florecimiento de las culturas precolombinas en América.

A través de este artículo comentaremos los procesos que permitieron conocer en detalle el genoma de tres cereales: Arroz, maíz y sorgo; así como el caso de una especie emparentada al trigo y a la cebada: Brachipodium distachyon. Igualmente, algunos de los principales resultados de la secuenciación serán presentados. De esta forma, al final, se podrán apreciar las similaridades y diferencias entre estas especies a nivel genómico así como comprender los retos venideros.


Descubriendo el genoma de los cereales

Las experiencias obtenidas en la secuenciación de otros organismos fueron aplicadas en los proyectos de cereales. Sin embargo, hasta el momento solo especies con dos series de cromosomas (diploides), con un genoma pequeño, han sido exitosamente secuenciadas. Tal es el caso del arroz (con un tamaño del genoma de 389 megabases (Mb)) [1], el maíz (2300 Mb)[2], y el sorgo (760 Mb)[3]. En el caso de los cereales con más de dos series de cromosomas (poliploides) de la subfamilia Pooidae, tales como el trigo (16000Mb), la cebada (5000 Mb) y la avena (11000 Mb), no se ha reportado una secuencia completa debido a sus enormes genomas. No obstante, importantes progresos se han realizado en la genómica de esta subfamilia. En este sentido, el año pasado se obtuvo la secuencia de Brachypodium (273 Mb) [4], un tipo de gramínea no comestible, perteneciente también a la misma subfamilia (Pooidae), la cual ha sido presentada como un modelo de estudio para el trigo, la cebada y la avena.
De las especies diploides, el genoma del arroz fue el primero en ser reportado [1], utilizando el cultivar Oryza sativa ssp. Japonica cv, Nipponbare. El proyecto fue inicialmente programado para 10 años, pero fue realizado en tan solo 6 años. La secuenciación de los 389 Mb presentes en esta planta fue logrado a través de la estrategia conocida como secuenciación jerárquica (en la inglés clone-by, –clone shotgun sequencing o hierarchical sequencing). Esta estrategia fue implementada en proyecto público del Proyecto Genoma Humano, y también aplicado en otros organismos como C. elegans y Arabidopsis [5], [6] . Esta aproximación es caracterizada por la construcción preliminar de un mapa físico del genoma, con el objetivo de asegurar que la secuencia final será reportada de manera ordenada. Un mapa físico es un ensamblaje ordenado de fragmentos conocidos de ADN, en el cual la distancia entre ellos es expresada en unidades denominadas kilobases [6]. Paralelamente a la publicación de la secuencia del arroz, en 2005 tres agencias gubernamentales de los Estados Unidos de Norte América (National Science Fundation (NSF), The Department of Energy (DOE) y United States Departament of Agriculture (USDA)) soportaron con US $32 millones la secuencia de los 2,300 Mb presentes en el genoma del Maíz [7]. Cuatro años después el genoma de esta especie americana fue publicado [2]. El ADN de la famosa variedad de maíz, B73, fue usada en este trabajo. Similar al caso del arroz, el proyecto siguió la estrategia de secuenciación jerárquica reportándose finalmente 379´598.676 pares de bases. De la misma manera, en 2005 fue iniciado el proyecto de secuenciación del sorgo por parte de DOE-JGI (Department of Energy Joint Genome Institute). El genoma de éste cereal de gran importancia en países Africanos fue liberado al público en el 2009. A diferencia del arroz y del maíz, este proyecto siguió la metodología conocida como “ whole-genome shotgun sequencing” (acrónimo en inglés, WGS), previamente utilizada por la empresa privada Celera Genomics durante la secuenciación del genoma Humano. Esta estrategia se considera mucho más rápida que la secuenciación jerárquica ya que no es necesario la construcción de un mapa físico, en cambio utiliza potentes programas y algoritmos para establecer un orden adecuado de las secuencias obtenidas [5], [6]. Finalmente, hacia el año 2010 se publicó la secuencia de Brachypodium [4]. La línea Bd21 fue usada en este proyecto, para el cual, similar al caso de sorgo, se siguió la estrategia WGS.

Descubriendo nuevos Genes

Después del ensamblaje y la verificación de un genoma, los proyectos de investigación se centran en el proceso conocido como “Descubrimiento de Genes”, con el fin de buscar el significado del código del ADN y la función génica de las secuencias del genoma. El proceso del descubrimiento de genes ha sido dinamizado en la última década gracias al desarrollo de la bioinformática. De esta forma, hoy en día el descubrimiento de genes, se realiza considerando características típicas de secuencias de inicio de la transcripción, y fragmentos de libre lectura entre otros [8]. Estas características son condensadas en programas que permiten verificar estadísticamente hipótesis conocidas como “Modelos de Genes” [6], [8].

Así, en el caso del arroz fueron predichos 37 544 genes, en una densidad de 9.9kb/genes y un tamaño promedio de cada gen de 1553 pares de bases. Estos genes fueron comparados con previos cDNAs (secuencias de ADN envueltas en la producción de ARN, resultando en 17016 modelos de genes soportados por esta evidencia. Estos genes fueron comparados con la información disponible para ese entonces en otros cereales (previa a los posteriores resultados de la secuenciación de sus genomas) encontrando que 2927 genes compartían similaridades en sus secuencias [1]. Este resultado evidenció, además, que los cereales mantienen un cierto orden de sus genes en sus correspondientes genomas, proceso conocido como sintenia (ver más abajo). El análisis del tipo de proteínas encontradas, evidenció que un 51% de ellas están relacionadas con procesos metabólicos y fisiología celular, así pues, las proteínas de tipo kinasa fueron las más abundantes en el arroz [1]. Por su parte, los análisis realizados en maíz permitieron encontrar 32540 genes, lo cual resultó en un bajo número teniendo en cuenta que las investigaciones previas habían predicho entre 42000 y 56000 genes. Este bajo número pudo haber sido debido a la alta rigidez usada en los análisis bioinformáticos de predicción de genes. Así pues, en el maíz la densidad fue de 76.5 genes/Mb. De los genes anotados 30626 fueron anotados con al menos un domino [2]. Similar al caso del arroz, los dominios mas frecuentes fueron los de proteínas de tipo kinasa (tipos de enzimas involucradas en procesos de regulación celular). Por otra parte, en sorgo fueron predichos 34496 genes, de los cuales el 80% tenían un domino proteíco específico [3]. Finalmente en el caso de Brachypodium, un total de 25532 genes específicos a proteínas fueron encontrados [4].

La sintenia dentro de los cereales

Sin lugar a dudas, uno de los resultados más interesantes obtenidos en estos proyectos de secuenciación fue la verificación de la sintenia entre los cereales. En términos específicos sintenia se refiere a la conservación del orden de los genes entre segmentos de cromosomas de dos o más organismos [6]. En un cereal, parte de los genomas de especies relacionadas pueden ser encontrados de manera conservadas dentro de él. El estudio de estas relaciones permite establecer patrones que reflejan la historia evolutiva de este grupo de especies. Estudios genéticos en plantas durante las últimas décadas han ilustrado muchísimos patrones de sintenia, demostrando que la historia evolutiva de las angiospermas es una “historia de duplicaciones” [9]. La taxonomía y la sistemática han considerado desde siempre que la subfamilia del arroz (Ehritrahoidea) y la subfamilia de trigo, cebada y avena (Pooidae) pertenecen a un mismo grupo evolutivo. Por su parte la subfamilia del maíz y el sorgo (Panicoidae) pertenece a otro clado que previamente divergió de las otras subfamilias [4], [10]. Durante la década de los 90’s se demostró que en el trigo, el maíz y el arroz el orden de los genes es conservado pese a que las especies hayan divergido hace millones de años atrás [10]. Acorde a estos estudios, un mapa de los cromosomas presentes en los cereales puede estar en términos de 19 largos segmentos (algo así como legos). La evidencia sugiere que el ancestro de los cereales presentó una duplicación de su genoma, dando origen a una especie con 12 cromosomas (los 19 segmentos están re-ordenados en estos cromosomas). Este número fue retenido en el arroz [1], [4], [10]. Por su parte, la subfamilia Pooidae (trigo, cebada y avena), la cual divergió del arroz hace 40-54 millones de años atrás, presentó una redistribución de los segmentos en 7 cromosomas básicos, de tal forma que muchos de ellos se han fusionado [4], [10]. Los resultados de la secuencia de Brachypodium evidenciaron este fenómeno a través de un un gran número de similaridades con el arroz [4]. Mientras tanto, en el caso del sorgo, aparentemente, en algún momento histórico los 19 legos se reordenaron en 10 cromosomas el cual dio origen a un ancestro intermedio a esta especie [3], [4]. En el caso del maíz, su origen resulta un poco más intrigante. La evidencia sugiere el mismo ancestro común de 10 cromosomas entre el sorgo y maíz. Sin embargo, aparentemente, una población de este ancestro presentó subsecuentes fusiones de los segmentos, dando origen a un individuo con cinco cromosomas [4]. Estos cromosomas o bien se pudieron duplicar dando origen a una especie ancestral a la maíz con 10 cromosomas; o bien dos especies de cinco cromosomas se hibridaron dando origen al maíz. Así pues ha sido observado que en estas especies los cromosomas 3 y 10 del arroz, así como el 7 y el 9 se encuentras fusionados en uno [11].

Conclusión

Los grandes avances y experiencias obtenidas en la consecución del proyecto Genoma Humano y otros tales como el de arabidopsis, han sido aplicados para elucidar el genoma de los principales cereales. Las secuencias y genes descubiertos en estas especies han aportado nuevas evidencias de su origen evolutivo, demostrando la altísima similaridad entre estas especies. Sin embargo, el próximo reto será implementar toda esta información dentro de programas de mejoramiento genético de estas plantas. Como bien se ha descrito, las secuencias obtenidas fueron realizadas sobre una planta específica (variedad); el reto ahora será poder secuenciar un gran numero se variedades en corto tiempo, con el fin de obtener información más pormenorizada que pueda ser integrada exitosamente en programas de mejoramiento genético de esta plantas.


REFERENCIAS

[1]International rice genome sequencing project. 2005. The map-based sequence of the rice genome. Nature 436: 793-800
[2]Schnable, P. S. 2009. The B73 maize genome: complexity, diversity, and dynamics. Science 236:1112-1115.
[3]Paterson, A. H. et al. 2009. The sorghum bicolor genome and the diversification of grasses. Nature 457: 551-556.
[4]The International Brachypodium Initiative. 2010. Genome sequencing and analysis of the model grass Brachypodium distachyon. Nature 463:763-768.
[5]Green, E. D. 2001. Strategies for the systematic sequencing of complex genomes. Nature reviews 2:573-583.
[6]Gibson, G. and Muse, S. V. 2004. A primer of genome science. Second edition. Sinaur Associate, INC. Publisher. USA.
[7]Zhou, S. et al. 2009. A single molecule scaffold for the maize genome. PLos Genetics 5:1-14
[8]Lincoln S. 2001. Genome annotation: from sequence to biology. Nature Reviews 2:493-503.
[9]Van de Peer, Y. et al. 2009. The flowering world: a tale of duplications. Trends in plant science 14: 680-688.
[10]Moore, G., Devos, K. M., Wang, Z. & Gale, M. D. 1995. Cereal genome evolution. Grasses, line up and form a circle. Curr. Biol. 5: 737–739.
[11]Wei, F. et al. 2007. Physical and genetic structure of the maize genome reflects its complex evolutionary history. PLoS Genet. 3, e123.

Category: | 3 Comments