La
bioinformática, una opción de investigación para países emergentes
Por: Mauricio Quimbaya y Leonardo Galindo
La
gran limitación de la biología celular y molecular modernas en países
emergentes:
Las nuevas técnicas de biología celular
y molecular han revolucionado el entendimiento que tenemos sobre la vida; desde
el descubrimiento de la estructura del ADN (Watson & Crick, 1953) hasta la
consecución del genoma humano (Lander et al., 2001; Venter et al., 2001), los avances
han sido exponenciales. En las últimas décadas hemos avanzado a pasos
agigantados para entender los sistemas biológicos. Como lo hemos mencionado en
escritos anteriores (Galindo, 2013; Quimbaya, 2013), estos avances
han sido construidos gracias a innovaciones tecnológicas que han permitido
desarrollar una nueva perspectiva conceptual de las dinámicas celulares.
Tecnologías como la secuenciación de
segunda generación, los microarreglos y sus tecnologías derivadas (por ejemplo
Chip-on-Chip) o el uso sistémico de dobles híbridos de levadura para detectar
interacciones específicas proteína-proteína son utilizadas a diario en los
laboratorios de biología molecular. Sin embargo, aunque la aplicación de estas
y otras técnicas han permitido la generación de un número sin precedentes de
datos biológicos, su implementación se traduce en altos costos experimentales.
Tanto los equipos como el costo de los insumos, la capacitación de personal
para el uso de los equipos y la implementación y análisis experimentales
implican un alto costo monetario que no es asumible por laboratorios pequeños o
en países donde los recursos para la investigación científica son escasos. Por
ejemplo, si un laboratorio decide tener una maquina personal para secuenciación
de segunda generación los costos oscilan entre 80000 y más de 125000 dólares
solo por comprar el equipo (http://massgenomics.org/2012/04/comparison-of-benchtop-sequencers.html), y
máquinas aún más grandes pueden pasar de medio millón de dólares (Quail et al., 2012). Por ejemplo el
equipo 454 de ROCHE utilizado en el Centro
de Secuenciación Genómica afiliado a la Universidad de Antioquia tiene un
valor de más de 500000 dólares, pero es posiblemente uno de los pocos equipos que
existen en Colombia. Esto en clara contraposición a lo que ocurre en países
como Estados Unidos en donde un solo complejo, como el Centro Genómico de la
Universidad de Washington (The Genome
Center at Washington University) tiene 50 equipos Illumina y 8 equipos
ROCHE 454 (http://omicsmaps.com/).
Como una opción alterna a la compra de
equipos, es posible contratar, por ejemplo, servicios de secuenciación de
segunda generación ofrecidos por empresas o entidades específicas, lo cual
cuesta una fracción de lo que podría costar la realización del experimento
completo si se tuviera el equipo. Sin embargo, este proceso, aunque permite la obtención
de datos a un precio razonable, muchas veces no permite el seguimiento de todos
los pasos del experimento y la adquisición de datos en el proceso de secuenciación,
filtro y anotación. En ocasiones esto se vuelve una desventaja para el
investigador, quien tiene que hacer inferencias acerca de los resultados sin
poder hacer una reflexión completa sobre el proceso metodológico. Adicionalmente
si el proyecto es grande o de largo plazo (ejemplo: secuenciación y anotación
de genomas o metagenómica) el contratar servicios se torna tedioso y pone
limitaciones al diseño experimental y su implementación.
Es evidente que con un presupuesto
altamente limitado para la investigación científica (http://en.wikipedia.org/wiki/List_of_countries_by_research_and_development_spending),aspecto
que es característico en países de centro y sur américa (con excepción de
Brasil que es ahora considerado una potencia regional), resulta difícil ser
competitivo en el mundo de las ciencias biológicas, sobre todo, cuando es el
desarrollo de nuevas tecnologías, costosas y difíciles de mantener, lo que en
la actualidad guía la investigación. Entonces, ¿están las naciones emergentes condenadas
al rezago científico?, ¿cómo ser competitivo en un mundo investigativo
contemporáneo cuando no se tienen los recursos para invertir en herramientas de
alta tecnología?
No
generar datos, no implica no poder utilizar los datos generados por otros
Durante los últimos 15 años, la biología
molecular ha experimentado grandes cambios en sus paradigmas científicos.
Progresivamente, los científicos se han movido desde un punto de vista
relativamente reduccionista hacia una perspectiva global, que permite la
visualización de un fenómeno particular desde una perspectiva sistémica.
Actualmente, con el advenimiento de las denominadas ciencias “omicas”
(transcriptómica, proteómica, metabolómica, etc), los investigadores están en
la capacidad de abordar y entender un problema desde dicha perspectiva
holística.
En consecuencia de la explosión en la
utilización de las tecnologías “ómicas” se han generado inmensas cantidades de
información. Sin embargo, a pesar de que la generación de dichos datos se ha
dado en un contexto experimental específico, muchos de los datos contienen
información adicional, esperando ser analizada a partir de nuevas hipótesis
científicas.
Para mencionar un ejemplo, el NASC's International Affymetrix Service
(http://affymetrix.arabidopsis.info/) es
un repositorio de información que almacena la mayoría de resultados
experimentales derivados de la implementación de microarreglos utilizando como
modelo experimental a la planta modelo Arabidopsis
thaliana. Dichos resultados, están disponibles de forma gratuita a toda la
comunidad científica. Esto quiere decir que aunque usted como investigador no
hubiera realizado directamente ninguno de los experimentos de microarreglos
almacenados en NASC, podría utilizar
esta información experimental para depurarla, clasificarla y analizarla,
proponiendo finalmente, alguna solución para un problema específico de su
interés, todo esto sin invertir los 4000 dólares que en promedio cuesta un
experimento de microarreglos.
Sin embargo el utilizar información “prestada”
tiene algunos inconvenientes. Por ejemplo la mayoría de los repositorios de
información se basan en organismos modelo, por lo tanto, investigaciones que no
tengan como eje central dichos organismos estarán limitadas a la información
que éstas generen directamente. En este sentido se espera que con la avalancha
de proyectos genómicos (6880 terminados según GOLD- Database (http://www.genomesonline.org/cgi-bin/GOLD/index.cgi)
cada vez sean más los recursos en red que estén disponibles para el análisis e
interpretación de diversos organismos. Adicionalmente surge nuevamente un hueco en el seguimiento del proceso
experimental para quien no genera los datos, lo cual puede resultar en
conclusiones erróneas y en hipótesis que, en ocasiones, no pueden ser
soportadas en su totalidad.
Para
analizar datos, sólo necesitamos una buena capacidad de cómputo y mentes
capacitadas con rigurosidad científica
Si bien es cierto que el análisis de
inmensas cantidades de información (como la que se deriva del uso de las
tecnologías ómicas) requiere de una poderosa capacidad de cómputo, su
implementación da como resultado un proceso más eficiente en la obtención de
resultados. Con la aparición de la computación en paralelo en donde varios
ordenadores se sincronizan para maximizar un proceso de cómputo específico, la
generación de una plataforma computacional de alta capacidad y bajo costo, es
ahora posible.
La implementación de plataformas
computacionales locales que permitan implementar técnicas bioinformáticas para
filtrar, procesar y analizar los datos biológicos generados, es de suma
importancia tanto para generar hipótesis como para realizar los análisis y
obtener las conclusiones una vez que se hayan realizado los experimentos
pertinentes
Sin embargo, para diseñar una plataforma
computacional viable no sólo se requiere del recurso técnico. Es necesario
educar a nuestros científicos en habilidades relacionadas con el trabajo computacional
que incluya el análisis de datos y la habilidad de usar lenguajes de
programación. Sólo se puede llegar a la excelencia investigativa en
bioinformática cuando tecnología y capital humano converjan en la
estructuración de una proyectos sólidos que nos lleve a competir a nivel
internacional.
La
bioinformática en Colombia, ¿Cómo estamos y lo qué falta?
Aunque Colombia no es una potencia
investigativa en el continente, si es posible afirmar que en los últimos años
sus investigadores se han concientizado en la importancia de la labor
bioinformática para estructurar una ciencia competitiva a nivel internacional.
Como prueba de ello es posible mencionar la creación y consolidación de grupos
de investigación que se dedican a la generación de herramientas computacionales
en Colombia (Benítez-Páez & Cárdenas-Brito, 2010). Entre dichos
grupos podemos mencionar al Grupo de Parasitología Molecular (GEPAMOL) de la
Universidad del Quindío (http://portal.uniquindio.edu.co/fac/salud/index.php?option=com_content&view=article&id=170&Itemid=2), el
Centro de Bioinformática del Instituto de Biotecnología de la Universidad
Nacional de Colombia (http://bioinf.ibun.unal.edu.co/cbib/), el
Grupo de Investigación en Bioquímica Computacional de la Pontificia Universidad
Javeriana (http://www.javeriana.edu.co/Facultades/Ciencias/dep_nut/grupos_investigacion/bioquimica_computacional.htm) y
el Grupo de Análisis Bioinformático (GABi) del Centro de Investigación y
Desarrollo en Biotecnología (http://gabi.cidbio.org/). De
la misma manera, recientemente el gobierno nacional en asocio con la industria
privada ha hecho importantes esfuerzos para crear plataformas bioinformáticas
masivas.
Entre los ejemplos más destacados de proyectos a gran escala,
podemos mencionar al proyecto GeBIX (Genómica
y Bioinformática de Ambientes Extremos), el cual busca explorar sistemáticamente ecosistemas naturales como
fuentes hidrotermales con el fin de realizar caracterizaciones metagenómicas
(material genómico mezclado encontrado en un ambiente específico) de los
organismos encontrados en dichas condiciones. De esta manera, Colombia da un
paso hacia el futuro para explorar nuestra diversidad biológica como mecanismo
dinámico de conservación, pero también como potencial biotecnológico. De la
misma manera, el presente año, fue inaugurado en Manizales el Centro
Nacional de Bioinformática y Biología Computacional (CBBC) (http://www.risc-project.eu/), el cual es un ambicioso proyecto que tiene
como fin ofrecer servicios de tecnología de punta para el procesamiento y
almacenamiento de datos, desarrollo de software y soporte técnico y científico
a empresas, organizaciones públicas, universidades, centros y grupos de
investigación en Colombia. Para tal fin, por medio de una alianza público –
privada liderada por el Ministerio de Tecnologías de la Información y las
Comunicaciones (MinTIC) y el Departamento Administrativo de Ciencia, Tecnología
e Innovación (Colciencias), en conjunto con Microsoft Colombia, Microsoft
Research y un grupo de prestigiosas universidades Colombianas, entre las cuales
se encuentran, la Universidad de Caldas, la Universidad Autónoma de Manizales,
la Universidad de Manizales, la Universidad del Quindío, la Universidad
Tecnológica de Pereira y la Universidad del Tolima, se gestó un centro de
excelencia investigativa soportado por una de las tres computadoras más
potentes de todo el continente americano.
Estos son claros ejemplos, del
interés y de la posibilidad latente que tenemos en países emergentes de
utilizar la bioinformática como una herramienta para mejorar nuestra
investigación y nuestra competitividad a nivel internacional. Esto demuestra
así mismo que ahora existe la posibilidad no solo de utilizar la información
depositada en las bases de datos, sino también, de generar proyectos autóctonos
que exploren problemas locales.
Nos atreveríamos a decir que vamos
por buen camino. Necesitamos adquirir un mejor entrenamiento en habilidades
bioinformáticas (Benítez-Páez
& Cárdenas-Brito, 2010). Dichas habilidades deben ser
enseñadas y adquiridas de una forma inicial en el pregrado para luego ser
fortalecidas en posgrados específicos en bioinformática, y finalmente ser
potencializadas en los centros de investigación. Adicionalmente disciplinas como
la bioinformática deben ser implementadas de tal manera que sean accesibles
para cualquier proyecto científico que las requiera, y debe expandirse para
explorar todos los niveles biológicos, desde las moléculas hasta los
ecosistemas.
El avance en la investigación
científica en nuestros países podrá dar un paso importante utilizando
plataformas de investigación pertinentes y viables como lo es el desarrollo
bioinformático. Para que esto ocurra, deben converger en un mismo punto el
interés del gobierno, la educación y capacitación científica y la inversión en
tecnología
Para más información sobre el
estado de la bioinformática en Colombia consultar Benítez-Páez & Cárdenas-Brito, 2010.
Referencias:
Benítez-Páez, A., &
Cárdenas-Brito, S. (2010). Bioinformática en Colombia: presente y futuro de la
investigación biocomputacional. Biomedica, revista del instituto nacional de
salud, 30. Retrieved from
http://www.revistabiomedica.org/index.php/biomedica/article/view/180/354#figura3
Galindo, L. (2013). Anotación de genomas, descifrando
los libros de la vida. blog biogenic. Retrieved from
http://biogenic-colombia.blogspot.ca/2013/07/anotacion-de-genomas-descifrando-los.html
Lander, E. S., Linton, L. M., Birren, B., Nusbaum, C.,
Zody, M. C., Baldwin, J., Devon, K., et al. (2001). Initial sequencing and
analysis of the human genome. Nature, 409(6822), 860–921.
doi:10.1038/35057062
Quail, M. A., Smith, M., Coupland, P., Otto, T. D.,
Harris, S. R., Connor, T. R., Bertoni, A., et al. (2012). A tale of three next
generation sequencing platforms: comparison of Ion Torrent, Pacific Biosciences
and Illumina MiSeq sequencers. BMC genomics, 13,
341. doi:10.1186/1471-2164-13-341
Quimbaya, M. (2013). Más allá de la bioinformática. blog
biogenic. Retrieved
from
http://biogenic-colombia.blogspot.ca/2013/07/mas-alla-de-la-bioinformatica.html
Venter, J. C., Adams, M. D., Myers, E. W., Li, P. W.,
Mural, R. J., Sutton, G. G., Smith, H. O., et al. (2001). The Sequence of the
Human Genome. Nature, 291, 1304–1315. doi:10.1126/science.1058040
Watson, J., & Crick, F. (1953). Molecular structure
of nucleic acids. Nature, 171, 737–738.
Cenicafé esta liderando proyectos de secuenciación masiva, no solo del café si no también de sus plagas mas importantes (Roya y Broca): http://bioinformatics.cenicafe.org/index.php/wiki//Hypothenemus_hampei_Project.