Cómo
trabajamos en Bioinformática
NIVELES DE PARTICIPACIÓN EN LA BIOINFORMÁTICA
- Hay dos niveles de participación en el área de la Bioinformática:
- Bioinformática basica. El objeto de esta asignatura. Es aquella en la que está implicada y se procesan una o unas pocas secuencias obtenidas mediante la técnica Sanger. Con esta técnica obtenemos secuencias cortas, de hasta 1000-1200 bases pero con un promedio real mucho menor (500 a 800 bases) que pueden ser procesadas mediante programas o servicios WEB sin ninguna exigencia especial. Este tipo de trabajo implica la búsqueda de secuencias, del análisis de las mismas para encontrar secuencias codificantes, secuencias similares con funciones conocidas, sitios de corte con enzimas de restricción, y un largo etc. Al mismo tiempo estudiamos las propiedades y función biológica de una o unas pocas proteinas. Este es el tipo de trabajo que podemos considerar básico y esencial que vamos a abordar y aprender en esta asignatura
- Bioinformatica avanzada. Aquella que implica a los modernos sistemas de secuenciación masiva de segunda, tercera generación y cuarta generación (sistemas NGS o Next Generation Sequencing) en la que se obtiene una cantidad ingente de datos (a veces 15Tb de la secuenciación de un genoma humano que puede conserguirse hoy en uno o en unos pocos dias). Aquí se requiere otros programas más especializados, y enormes requerimientos para el procesado de datos, como servidores con varios procesadores paralelos, cantidades ingentes de RAM (256Gb o más) y sistemas de almacenamiento de datos de gran tamaño. Estos estudios implican la generación de nuevos genomas completos, de estudios transcriptómicos completos (RNA-Seq), de sistemas de generación de variantes génicas, de sistemas de diagnóstico y medicina personalizada, y un largo etc. Abordaremos estos estudios en la asignatura Biología Molecular de Sistemas de cuarto curso.
PROGRAMAS Y SISTEMAS OPERATIVOS
- Muchas de las aplicaciones o programas
de interés en la Biología Molecular se han realizado usando
nuevas tecnologías como servidores en páginas WEB de internet.
Estas aplicaciones, han podido ser realizadas con varios tipos de lenguaje
de programación (JAVA, ActiveX, Perl, Phyton, etc).
- En cualquier caso, esto no es
relevante para el usuario final, que usará el programa sin necesitar
ningún tipo de conocimiento especial. Sólo hay que aprender
a manejarlo, sin tener conocimientos previos.
- Otras aplicaciones, sin embargo,
se ejecutan sobre el sistema operativo Windows, con el que
casi todo el mundo está familiarizado.
- Hay, sin embargo, otros sistemas
operativos, como el llamado UNIX. El UNIX es un sistema operativo especialmente
robusto y estable, que se ha convertido en el preferido para su uso por las
grandes organizaciones como la Universidad. Hay muchos programas de caracter
científico, entre los que se incluyen gestores de bases de datos, de
arquitectura, y los de bioinformática. Una variante de UNIX en es sistema operativo Linux, que se puede instalar gratuitamente en nuestros ordenadores PC y también en grandes servidores. Hay muchas variantes de Linux compiladas por diferentes empresas o asociaciones entre las que destaca Ubuntu.
- Esto significa que el uso de la
bioinformática tiene una complejidad añadida. El usuario final
debe ser un usuario con un nivel de formación elevado, que debe tener
conocimientos de la navegación por Internet, y de los sistemas operativos
Windows y UNIX/Linux, por no mencionar a otros.
- Dado que existen múltiples
sistemas operativos, redes informáticas y ordenadores emplazados en
cualquier parte del mundo, existe la necesidad de conocer los métodos
para transferir los archivos de secuencias desde unos ordenadores a otros
aunque éstos tengan sistemas operativos diferentes. EL sistema más popular de transferencia es el FTP (File Transfer Protocol). Y una de las aplicaciones más populares y eficientes para instalar en casi cualquier sistema operativo es Filezilla. Estos métodos
se tratará en las primeras lecciones.
- Luego, hay necesidad de conocer
diferentes formatos gráficos (que constituyen muchas veces el resultado
de un análisis que hayamos realizado), y la forma en la que éstos
se pueden convertir a otros formatos que pueden integrarse finalmente en nuestros
trabajos científicos.