RNA-Gatherer: uma ferramenta computacional para anotação de RNAs não-codificantes em organismos pouco conhecidos
ncRNA. Arapaima Gigas. Anotação de Genes. Predição de Funções
RNAs não-codificantes são moléculas que desempenham papéis decisivos em vários tipos de regulação genética. Identificar eles é essencial para entender a genética de uma espécie. Diversos fatores, como: baixo nível de expressão, amplo espectro de subtipos, atributos diversos, funções heterogêneas e ausência de homologia entre espécies; fazem a detecção de ncRNAs um desafio. Estratégias de bioinformática recentes para detecção genes de ncRNA tentam identificar suas localizações nos genomas e suas estruturas secundárias, usando modelos de covariância e inteligência artificial. A co-expressão desses genes também vem sendo analisada computacionalmente para revelar anotações funcionais. No entanto, não há consenso sobre quais métricas e parâmetros usar no processo de prever as funções dessas moléculas. Em organismos pouco conhecidos, como Arapaima gigas, a falta de informações de referência aumenta essa dificuldade. Além disso, principalmente para RNAs longos não- codificantes, há poucas funções conhecidas, o que torna difícil explicar os papéis desses genes e avaliar a qualidade das predições. Neste trabalho, é descrito um software para descobrir os genes não-codificantes, de diversos tipos, e suas funções em espécies de eucariotos. Este foi validado com uma espécie modelo, o camundongo, e utilizado para explorar o panorama de ncRNAs numa espécie pouco estudada, o Arapaima gigas. A comparação da semelhança entre funções de genes co-expressos nos permitiu definir níveis de confiança para as métricas de calcular co- expressão, e assim, desenvolver uma pipeline de predição funções para lncRNA, a qual inclui métricas para calcular correlações não- lineares. O pacote de software descrito aqui fez 63307 anotações não-codificantes em A. gigas, incluindo 11 tipos de ncRNA e 4 de regiões cis-regulatórias. Dessas anotações, apenas 706 eram similares a ncRNAs já conhecidos em outras espécies e os restantes não haviam sido descritos anteriormente. A análise exploratória dos lncRNAs também revelou 19854 lncRNAs de tecido específico e 256 lncRNAs expressos de forma onipresente. Prever as funções dessas moléculas também revelou que elas estão envolvidas na pigmentação da pele, diferenciação sexual, crescimento e defesa contra tumores.