RNA Nexus: um novo software para anotação de ncRNA e predição funcional
RNA, não-codificante, software, predição funcional, anotação.
Os RNAs não codificantes (ncRNAs) consistem de moléculas de RNA que não são traduzidas em proteínas. Ao invés disso, os diversos tipos de ncRNA desempenham importantes papéis na defesa do genoma e em processos de regulação transcricional, dentre outras funções. Dado seu baixo nível de expressão e conservação, quando comparados aos genes codificantes, a identificação desses RNAs pode ser difícil. Pipelines atuais de identificação de ncRNAs não incluem rotinas para integrar dados públicos nos resultados ou para as especificidades da identificação de lncRNAs, uma classe cuja predição é complicada pelo fato de poderem ser semelhantes estruturalmente a genes codificantes. Além disso, há poucas informações funcionais até mesmo sobre os lncRNAs conhecidos, o que dificulta a interpretação dos papéis desses genes no organismo. Muitos pesquisadores têm aplicado técnicas de predição funcional In Silico através de co- expressão para revelar anotações funcionais, porém não há consenso sobre quais métricas de correlação e parâmetros utilizar, assim como faltam softwares prontos e disponíveis para que usuários realizem tais predições em espécies além de Homo Sapiens. Levando em conta este cenário atual, esse trabalho descreve o desenvolvimento de uma pipeline integrada de criação de anotações de ncRNAs, incluindo diversas ferramentas e dados de bancos públicos, para que diferentes tipos de ncRNA possam ser identificados. Também foi desenvolvido um preditor de funções para lncRNAs que incluí métricas não-lineares, até então nunca utilizadas com ncRNAs. Utilizando a similaridade semântica entre anotações, definimos níveis de confiança para as métricas utilizadas em predições funcionais. A efetividade do uso de diferentes métricas, assim como suas possíveis combinações, foi avaliada nesses níveis de confiança comparando as predições com dados de referência. Os resultados evidenciam a importância de levar em consideração relações de co- expressão não-lineares entre reguladores e alvos, além das relações lineares. Nossos testes da pipeline de anotação para ncRNA indicam que ela é capaz de identificar lncRNAs, snRNAs, snoRNAs, tRNAs, rRNAs, SRP RNAs e RNAs precursores, dentre outros. A ferramenta desenvolvida, chamada RNA Nexus, é um software livre que busca abstrair complexidades das pesquisas In Silico sobre ncRNAs, de forma que as barreiras de conhecimentos prévios de programação deixem de existir. Com ela esperamos tornar os estudos sobre ncRNAs mais rápidos e completos, acelerando e facilitando a expansão do conhecimento sobre essas moléculas essenciais nos mais diversos organismos.