Bases de datos

0

Los conjuntos de datos de expresión de genes, que ya se acercan al millón disponibles en repositorios de acceso público, pueden conducir a identificar tendencias en las enfermedades o revelar nuevas dianas, sin entrar siquiera a un laboratorio convencional. Ese es el criterio del que parte un artículo en Nature 2012;487:282-283.

0

La Universidad de California en Santa Cruz ha lanzado un repositorio para almacenar y publicar los masivos volúmenes de datos generados por los proyectos de genómica de cáncer. El nuevo recurso se nombra Cancer Genomics Hub (CGHub) y, con capacidad de 5 petabytes, fue generado para respaldar tres grandes proyectos del Instituto Nacional del Cáncer de Estados Unidos: The Cancer Genome Atlas, the Therapeutically Applicable Research to Generate Effective Treatments program, y The Cancer Genome Characterization Initiative.

0

Está disponible el mayor volumen de datos nunca antes publicado sobre el cáncer humano, derivado del Pediatric Cancer Genome Project. La intención de la iniciativa es secuenciar más de 1200 genomas para fin de año, aunque ahora se divulgan 520 obtenidos de muestras de tejidos normales y tumorales de 260 pacientes pediátricos. El anuncio apareció en Nature Genetics 2012;44:619-622, y los datos pueden consultarse en el Instituto Europeo de Bioinformática.

Un método de secuenciación ultraprofundo, denominado Ultra-deep targeted sequencing (UDT-Seq), permite detectar mutaciones somáticas de baja prevalencia en muestras tumorales. La sensibilidad reportada para el ensayo fue de 94 %, en tanto la especificidad superó el 99 %. Las potenciales aplicaciones clínicas del método se relacionan con la identificación de la clonalidad tumoral así como la selección de las mejores opciones de tratamiento, en opinión de los autores en Genome Biology, quienes depositaron los datos obtenidos en el NCBI.

En un taller realizado en Bruselas varias agencias de seguridad alimentaria y sanitarias concordaron en que el secuenciamiento de próxima generación (en inglés next-generation sequencing) será la tecnología de elección para monitorear los brotes de patógenos a escala global. Se espera que en una década los laboratorios de microbiología clínica dispongan de un secuenciador de ADN para el uso diario y los costos de un genoma bacteriano completo se hayan reducido a menos de $138. El mayor reto será la creación y mantenimiento de las bases de datos donde almacenar la información obtenida.

El volumen y la diversidad crecientes de datos generados por las tecnologías genómicas requiere del desarrollo de aplicaciones para su gestión más óptima. BioConductor, elaborado en lenguaje R, es una suite con más de 460 algoritmos para analizar y anotar datos de secuencia y microarrays. Cloudman, una versión en nube de la plataforma Galaxy, podría aplicarse a los experimentos en cáncer, como ya se hace con Nimbus.

El mayor y más detallado mapa de interacciones entre proteínas en un organismo multicelular condujo a identificar que son unas 5000 las proteínas que cooperan para mantener la vida. El estudio, realizado en la mosca drosófila, puede ser clave para comprender el comportamiento de las moléculas que causan enfermedades en el humano, así como la evolución de las redes de proteínas. El estudio aparace en Cell.