Ministerio de Ciencia e Innovación

Desarrollan una herramienta para la visualización y representación de datos de expresión génica en cáncer: CANCERTOOL

lunes, 26 de noviembre de 2018

El grupo del CIBERONC liderado por Arkaitz Carracedo, junto con el grupo del CIBEREHD representado por Ana M. Aransay, ambos localizados en CIC bioGUNE, han desarrollado una herramienta web que permite explotar datos públicos de expresión génica de pacientes con cáncer, sin necesidad de conocimientos de informática.

Desde el punto de vista de la transcriptómica como técnica para el estudio funcional de los tejidos afectados en ciertas enfermedades, y más en concreto en cáncer, existen ciertas trabas que pueden dificultar su estudio. Por una parte, la obtención de muestras y datos para su estudio es complicado, ya que hay que disponer de la financiación necesaria para llevar a cabo todo el proceso y por supuesto contar con cohortes de pacientes que cumplan los criterios de inclusión/exclusión definidos en cada caso. Como posible solución, existen repositorios tales como GEO o el TCGA, en los que, entre otros, se encuentran disponibles datos de expresión génica procedentes de estudios que han sido publicados. Estos datos se encuentran disponibles, por lo que cualquier persona con los conocimientos adecuados puede descargarlos y trabajar con ellos, es decir, se requieren analistas de datos especializados personal (Ej.: bioinformáticos) para su análisis.

Previo a este trabajo se evaluaron las plataformas existentes para la explotación de este tipo de datos tales como Oncomine o cBioportal. Estas herramientas ofrecen una interfaz amigable mediante la que acceder a la información, pero también presentan ciertas limitaciones, como por ejemplo la necesidad de comprar una licencia para su uso completo o la dificultad en la interpretación de los resultados que se facilitan (tanto gráficos como estadísticos). Además, estas herramientas no permiten la obtención de los datos crudos cuestionados para su posterior análisis.

Con todo, se procedió al diseño de una herramienta que desafiase los inconvenientes mencionados, denominada CANCERTOOL, una web (no depende de ningún navegador concreto) multiplataforma, libre y gratuita. Actualmente, esta herramienta consta de una base de datos que contiene información de expresión génica y fenotipos de diversos datasets, manualmente curados, de cuatro tipos de cáncer: mama, colon, pulmón y próstata.

CANCERTOOL ofrece la posibilidad de abordar los datos desde distintos puntos de vista tales como la comparación de niveles de expresión de los genes que sean de interés entre varios grupos fenotípicos de pacientes, la correlación entre los niveles de expresión de genes en cada dataset y el análisis de enriquecimiento de listas de genes.

Para su utilización "el usuario tan sólo tendrá que elegir qué tipo de análisis quiere realizar y el tipo de cáncer en el que trabajar", asegura el Dr. Carracedo. "Con esto seleccionado -puntualiza el investigador- sólo tendrá que insertar un listado de los genes que quiera consultar, seleccionar el tipo de identificador que está facilitando a la herramienta, seleccionar el tipo de resultados que desee obtener y, en caso que desee recibir un link desde el que descargar dichos resultados en lugar de esperar a que se complete el proceso de análisis, facilitar una dirección de email válida".

"Como siguientes objetivos, ampliaremos el número de datasets accesibles tanto para los cánceres ya considerados como para otros tipos de cáncer y evaluaremos la posibilidad de ofrecer datos derivadis de otras ómicas, como estudios de metilación. Estamos generando una cola de tareas sobre la cual iremos trabajando progresivamente para mejorar CANCERTOOL"concluye la Dra. Aransay