Subscribe RSS

La bioinformática, una opción de investigación para países emergentes


Por: Mauricio Quimbaya y Leonardo Galindo


La gran limitación de la biología celular y molecular modernas en países emergentes:

Las nuevas técnicas de biología celular y molecular han revolucionado el entendimiento que tenemos sobre la vida; desde el descubrimiento de la estructura del ADN (Watson & Crick, 1953) hasta la consecución del genoma humano (Lander et al., 2001; Venter et al., 2001), los avances han sido exponenciales. En las últimas décadas hemos avanzado a pasos agigantados para entender los sistemas biológicos. Como lo hemos mencionado en escritos anteriores (Galindo, 2013; Quimbaya, 2013), estos avances han sido construidos gracias a innovaciones tecnológicas que han permitido desarrollar una nueva perspectiva conceptual de las dinámicas celulares.

Tecnologías como la secuenciación de segunda generación, los microarreglos y sus tecnologías derivadas (por ejemplo Chip-on-Chip) o el uso sistémico de dobles híbridos de levadura para detectar interacciones específicas proteína-proteína son utilizadas a diario en los laboratorios de biología molecular. Sin embargo, aunque la aplicación de estas y otras técnicas han permitido la generación de un número sin precedentes de datos biológicos, su implementación se traduce en altos costos experimentales. Tanto los equipos como el costo de los insumos, la capacitación de personal para el uso de los equipos y la implementación y análisis experimentales implican un alto costo monetario que no es asumible por laboratorios pequeños o en países donde los recursos para la investigación científica son escasos. Por ejemplo, si un laboratorio decide tener una maquina personal para secuenciación de segunda generación los costos oscilan entre 80000 y más de 125000 dólares solo por comprar el equipo (http://massgenomics.org/2012/04/comparison-of-benchtop-sequencers.html), y máquinas aún más grandes pueden pasar de medio millón de dólares (Quail et al., 2012). Por ejemplo el equipo 454 de ROCHE utilizado en el Centro de Secuenciación Genómica afiliado a la Universidad de Antioquia tiene un valor de más de 500000 dólares, pero es posiblemente uno de los pocos equipos que existen en Colombia. Esto en clara contraposición a lo que ocurre en países como Estados Unidos en donde un solo complejo, como el Centro Genómico de la Universidad de Washington (The Genome Center at Washington University) tiene 50 equipos Illumina y 8 equipos ROCHE 454 (http://omicsmaps.com/).

Como una opción alterna a la compra de equipos, es posible contratar, por ejemplo, servicios de secuenciación de segunda generación ofrecidos por empresas o entidades específicas, lo cual cuesta una fracción de lo que podría costar la realización del experimento completo si se tuviera el equipo. Sin embargo, este proceso, aunque permite la obtención de datos a un precio razonable, muchas veces no permite el seguimiento de todos los pasos del experimento y la adquisición de datos en el proceso de secuenciación, filtro y anotación. En ocasiones esto se vuelve una desventaja para el investigador, quien tiene que hacer inferencias acerca de los resultados sin poder hacer una reflexión completa sobre el proceso metodológico. Adicionalmente si el proyecto es grande o de largo plazo (ejemplo: secuenciación y anotación de genomas o metagenómica) el contratar servicios se torna tedioso y pone limitaciones al diseño experimental y su implementación.


Es evidente que con un presupuesto altamente limitado para la investigación científica (http://en.wikipedia.org/wiki/List_of_countries_by_research_and_development_spending),aspecto que es característico en países de centro y sur américa (con excepción de Brasil que es ahora considerado una potencia regional), resulta difícil ser competitivo en el mundo de las ciencias biológicas, sobre todo, cuando es el desarrollo de nuevas tecnologías, costosas y difíciles de mantener, lo que en la actualidad guía la investigación. Entonces, ¿están las naciones emergentes condenadas al rezago científico?, ¿cómo ser competitivo en un mundo investigativo contemporáneo cuando no se tienen los recursos para invertir en herramientas de alta tecnología?


No generar datos, no implica no poder utilizar los datos generados por otros

Durante los últimos 15 años, la biología molecular ha experimentado grandes cambios en sus paradigmas científicos. Progresivamente, los científicos se han movido desde un punto de vista relativamente reduccionista hacia una perspectiva global, que permite la visualización de un fenómeno particular desde una perspectiva sistémica. Actualmente, con el advenimiento de las denominadas ciencias “omicas” (transcriptómica, proteómica, metabolómica, etc), los investigadores están en la capacidad de abordar y entender un problema desde dicha perspectiva holística.

En consecuencia de la explosión en la utilización de las tecnologías “ómicas” se han generado inmensas cantidades de información. Sin embargo, a pesar de que la generación de dichos datos se ha dado en un contexto experimental específico, muchos de los datos contienen información adicional, esperando ser analizada a partir de nuevas hipótesis científicas.

Para mencionar un ejemplo, el NASC's International Affymetrix Service (http://affymetrix.arabidopsis.info/) es un repositorio de información que almacena la mayoría de resultados experimentales derivados de la implementación de microarreglos utilizando como modelo experimental a la planta modelo Arabidopsis thaliana. Dichos resultados, están disponibles de forma gratuita a toda la comunidad científica. Esto quiere decir que aunque usted como investigador no hubiera realizado directamente ninguno de los experimentos de microarreglos almacenados en NASC, podría utilizar esta información experimental para depurarla, clasificarla y analizarla, proponiendo finalmente, alguna solución para un problema específico de su interés, todo esto sin invertir los 4000 dólares que en promedio cuesta un experimento de microarreglos.

Sin embargo el utilizar información “prestada” tiene algunos inconvenientes. Por ejemplo la mayoría de los repositorios de información se basan en organismos modelo, por lo tanto, investigaciones que no tengan como eje central dichos organismos estarán limitadas a la información que éstas generen directamente. En este sentido se espera que con la avalancha de proyectos genómicos (6880 terminados según GOLD- Database (http://www.genomesonline.org/cgi-bin/GOLD/index.cgi) cada vez sean más los recursos en red que estén disponibles para el análisis e interpretación de diversos organismos. Adicionalmente surge nuevamente un  hueco en el seguimiento del proceso experimental para quien no genera los datos, lo cual puede resultar en conclusiones erróneas y en hipótesis que, en ocasiones, no pueden ser soportadas en su totalidad.


Para analizar datos, sólo necesitamos una buena capacidad de cómputo y mentes capacitadas con rigurosidad científica

Si bien es cierto que el análisis de inmensas cantidades de información (como la que se deriva del uso de las tecnologías ómicas) requiere de una poderosa capacidad de cómputo, su implementación da como resultado un proceso más eficiente en la obtención de resultados. Con la aparición de la computación en paralelo en donde varios ordenadores se sincronizan para maximizar un proceso de cómputo específico, la generación de una plataforma computacional de alta capacidad y bajo costo, es ahora posible.

La implementación de plataformas computacionales locales que permitan implementar técnicas bioinformáticas para filtrar, procesar y analizar los datos biológicos generados, es de suma importancia tanto para generar hipótesis como para realizar los análisis y obtener las conclusiones una vez que se hayan realizado los experimentos pertinentes

Sin embargo, para diseñar una plataforma computacional viable no sólo se requiere del recurso técnico. Es necesario educar a nuestros científicos en habilidades relacionadas con el trabajo computacional que incluya el análisis de datos y la habilidad de usar lenguajes de programación. Sólo se puede llegar a la excelencia investigativa en bioinformática cuando tecnología y capital humano converjan en la estructuración de una proyectos sólidos que nos lleve a competir a nivel internacional.


La bioinformática en Colombia, ¿Cómo estamos y lo qué falta?

Aunque Colombia no es una potencia investigativa en el continente, si es posible afirmar que en los últimos años sus investigadores se han concientizado en la importancia de la labor bioinformática para estructurar una ciencia competitiva a nivel internacional. Como prueba de ello es posible mencionar la creación y consolidación de grupos de investigación que se dedican a la generación de herramientas computacionales en Colombia (Benítez-Páez & Cárdenas-Brito, 2010). Entre dichos grupos podemos mencionar al Grupo de Parasitología Molecular (GEPAMOL) de la Universidad del Quindío (http://portal.uniquindio.edu.co/fac/salud/index.php?option=com_content&view=article&id=170&Itemid=2), el Centro de Bioinformática del Instituto de Biotecnología de la Universidad Nacional de Colombia (http://bioinf.ibun.unal.edu.co/cbib/), el Grupo de Investigación en Bioquímica Computacional de la Pontificia Universidad Javeriana (http://www.javeriana.edu.co/Facultades/Ciencias/dep_nut/grupos_investigacion/bioquimica_computacional.htm) y el Grupo de Análisis Bioinformático (GABi) del Centro de Investigación y Desarrollo en Biotecnología (http://gabi.cidbio.org/). De la misma manera, recientemente el gobierno nacional en asocio con la industria privada ha hecho importantes esfuerzos para crear plataformas bioinformáticas masivas.

Entre los ejemplos más destacados de proyectos a gran escala, podemos mencionar al  proyecto GeBIX (Genómica y Bioinformática de Ambientes Extremos), el cual busca explorar sistemáticamente ecosistemas naturales como fuentes hidrotermales con el fin de realizar caracterizaciones metagenómicas (material genómico mezclado encontrado en un ambiente específico) de los organismos encontrados en dichas condiciones. De esta manera, Colombia da un paso hacia el futuro para explorar nuestra diversidad biológica como mecanismo dinámico de conservación, pero también como potencial biotecnológico. De la misma manera, el presente año, fue inaugurado en Manizales el Centro Nacional de Bioinformática y Biología Computacional (CBBC) (http://www.risc-project.eu/), el cual es un ambicioso proyecto que tiene como fin ofrecer servicios de tecnología de punta para el procesamiento y almacenamiento de datos, desarrollo de software y soporte técnico y científico a empresas, organizaciones públicas, universidades, centros y grupos de investigación en Colombia. Para tal fin, por medio de una alianza público – privada liderada por el Ministerio de Tecnologías de la Información y las Comunicaciones (MinTIC) y el Departamento Administrativo de Ciencia, Tecnología e Innovación (Colciencias), en conjunto con Microsoft Colombia, Microsoft Research y un grupo de prestigiosas universidades Colombianas, entre las cuales se encuentran, la Universidad de Caldas, la Universidad Autónoma de Manizales, la Universidad de Manizales, la Universidad del Quindío, la Universidad Tecnológica de Pereira y la Universidad del Tolima, se gestó un centro de excelencia investigativa soportado por una de las tres computadoras más potentes de todo el continente americano.

Estos son claros ejemplos, del interés y de la posibilidad latente que tenemos en países emergentes de utilizar la bioinformática como una herramienta para mejorar nuestra investigación y nuestra competitividad a nivel internacional. Esto demuestra así mismo que ahora existe la posibilidad no solo de utilizar la información depositada en las bases de datos, sino también, de generar proyectos autóctonos que exploren problemas locales.

Nos atreveríamos a decir que vamos por buen camino. Necesitamos adquirir un mejor entrenamiento en habilidades bioinformáticas (Benítez-Páez & Cárdenas-Brito, 2010). Dichas habilidades deben ser enseñadas y adquiridas de una forma inicial en el pregrado para luego ser fortalecidas en posgrados específicos en bioinformática, y finalmente ser potencializadas en los centros de investigación. Adicionalmente disciplinas como la bioinformática deben ser implementadas de tal manera que sean accesibles para cualquier proyecto científico que las requiera, y debe expandirse para explorar todos los niveles biológicos, desde las moléculas hasta los ecosistemas.

El avance en la investigación científica en nuestros países podrá dar un paso importante utilizando plataformas de investigación pertinentes y viables como lo es el desarrollo bioinformático. Para que esto ocurra, deben converger en un mismo punto el interés del gobierno, la educación y capacitación científica y la inversión en tecnología

Para más información sobre el estado de la bioinformática en Colombia consultar Benítez-Páez & Cárdenas-Brito, 2010.


Referencias:

Benítez-Páez, A., & Cárdenas-Brito, S. (2010). Bioinformática en Colombia: presente y futuro de la investigación biocomputacional. Biomedica, revista del instituto nacional de salud, 30. Retrieved from http://www.revistabiomedica.org/index.php/biomedica/article/view/180/354#figura3
Galindo, L. (2013). Anotación de genomas, descifrando los libros de la vida. blog biogenic. Retrieved from http://biogenic-colombia.blogspot.ca/2013/07/anotacion-de-genomas-descifrando-los.html
Lander, E. S., Linton, L. M., Birren, B., Nusbaum, C., Zody, M. C., Baldwin, J., Devon, K., et al. (2001). Initial sequencing and analysis of the human genome. Nature, 409(6822), 860–921. doi:10.1038/35057062
Quail, M. A., Smith, M., Coupland, P., Otto, T. D., Harris, S. R., Connor, T. R., Bertoni, A., et al. (2012). A tale of three next generation sequencing platforms: comparison of Ion Torrent, Pacific Biosciences and Illumina MiSeq sequencers. BMC genomics, 13, 341. doi:10.1186/1471-2164-13-341
Quimbaya, M. (2013). Más allá de la bioinformática. blog biogenic. Retrieved from http://biogenic-colombia.blogspot.ca/2013/07/mas-alla-de-la-bioinformatica.html
Venter, J. C., Adams, M. D., Myers, E. W., Li, P. W., Mural, R. J., Sutton, G. G., Smith, H. O., et al. (2001). The Sequence of the Human Genome. Nature, 291, 1304–1315. doi:10.1126/science.1058040
Watson, J., & Crick, F. (1953). Molecular structure of nucleic acids. Nature, 171, 737–738.

1 comments to “ ”

  1. Cenicafé esta liderando proyectos de secuenciación masiva, no solo del café si no también de sus plagas mas importantes (Roya y Broca): http://bioinformatics.cenicafe.org/index.php/wiki//Hypothenemus_hampei_Project.

Escribe aquí tu opinión!