Integração de dados e desenvolvimento de métricas escalável para análise de fatores de transcrição.
Fatores de Transcrição. Genes alvo. Grau de confiabilidade. Ferramenta web. Análise de enriquecimento.
Atualmente há diversas ferramentas propostas para análise de Fatores de Transcrição (TF), tais como TFCheckpoint, JASPAR, SSTAR, GTRD, Enrichr. No entanto nenhuma dessas ferramentas oferece uma experiência completa, em que se possa avaliar a confiabilidade do TF, ou seja, se de fato uma proteína analisada é um TF e a sua associação com o gene alvo. Ao longo do tempo foram construídas inúmeras bases de dados, todas elas com riquíssimas informações, porém a complexidade intrínseca do dado, o volume de informações, problemas de nomenclatura dos genes e diversos outros fatores fizeram com que tais ferramentas não oferecessem um espectro completo da análise. Por outro lado, para se trabalhar com um grande volume de dados, se requer conhecimentos avançados de computação. Entretanto, o grande público interessado em analisar esses dados são profissionais procedentes das áreas biológicas. Configurando-se como uma barreira, uma vez que a formação acadêmica desta área não oferece em seus componentes curriculares disciplinas de programação. Diante desta situação, este trabalho tem como objetivo criar uma ferramenta web destinada exclusivamente para análise dos TFs. Contendo a integração de diferentes bases de dados e um conjunto de scripts para manipular estas informações, juntamente com osparâmetros cruciais definidos pelo usuário em sua análise, foi idealizado e desenvolvido o Transcription Factor Analysis Tools (TFAT). O cerne desta ferramenta é aanálise para identificar os TFs chaves na modularização da transcrição gênica, ou seja, o enriquecimento dos TFs reguladores de uma lista de genes submetida pelo usuário, que através dos scripts que integram a mesma, consulta sua base de dados, identificam os TFs que estão associados aos genes da lista e calcula o p-valor de enriquecimento. Além disso, a ferramenta verifica a confiabilidade do TF, disponibiliza as predições realizadas e converte os itens de uma lista para o GeneID ou Symbol do Entrez Gene. Outro recurso presente neste trabalho é a utilização da confiabilidade do TF aplicado em toda a ferramenta. Esse grau de confiabilidade levaem consideração evidências de diferentes bases de dados, experimentos, predições e outras características dos TFs. Possuindo um modo padrão e um modo com parâmetros definidos pelo próprio usuário, este recurso de confiabilidade permite toda uma personalização por meio de filtros nas consultas e controle de análise para o usuário final.