Biologia de sistemas de células individuais de RNAs não codificantes longos associados com o desenvolvimento do tecido cardíaco e com doenças cardiovasculares
desenvolvimento do coração, lncRNAs, single-cell, biologia de sistemas, co-expressão.
Os RNAs não codificantes longos (lncRNAs) compreendem as unidades transcricionais mais representativas do genoma dos mamíferos e são conhecidos por estar associados ao desenvolvimento de órgãos. Assim, foi decidido estudar o desenvolvimento do coração, pois de acordo com a Organização Mundial da Saúde (do inglês, World Health Organization (WHO)), as doenças cardiovasculares são responsáveis pela morte de 17,9 milhões de pessoas a cada ano, correspondendo a 31% de todas as mortes em todo o mundo. Sendo assim, foi utilizado uma combinação dos transcritos das bases de dados Gencode (M20), Ensembl (GRCm38.95) e Amaral et al (2018) para definir o conjunto de lncRNAs de referência não redundantes; e Gencode (M20) para os transcritos codificantes de referência. Além disso, foi utilizado a base dados de single-cell publicada por DeLaughter et al (2016), no qual havia dados de 4 estágios embrionários (E9.5, E11.5, E14.5, E18.5) e 4 estágios pós-natais (P0, P3, P7, P21) do organismo modelo mus musculus. Portanto, os transcritos foram mapeados e foram filtrados pelos seus valores de expressão (FPKM> 0,001) e por uma porcentagem de células no qual os transcritos eram expressos, ou seja, os transcritos teriam que ser expressos em pelo menos 5% das células. Em seguida, foi realizada uma seleção de atributos e foram encontrados os transcritos diferencialmente expressos. Posteriormente, foi utilizado o método de silhueta para estimar o número mais adequado de clusters, agrupamento hierárquico para agrupar as células, PCA para reduzir a dimensionalidade e t-SNE para a visualização dos clusters. Além disso, foram utilizados genes marcadores para atribuir aos clusters seus tipos celulares, testes de qui-quadrado e de aderência para observar a significância dos clusters (p-value<0,05) e, em seguida, foi observada a co-expressão dos genes. Foram utilizadas 5 áreas diferentes do coração durante o desenvolvimento: ventrículo, átrio, ventrículo esquerdo, ventrículo direito e átrio esquerdo. Em relação aos clusters de células, foi possível identificar 8 tipos distintos de células: cardiomiócitos; mioblastos; endotelial; células murais, do músculo liso vascular e pericitos; fibroblastos e miofibroblastos; células T; macrófagos e monócitos; e dendríticas. Além disso, foram identificados novos transcritos marcadores divididos em genes codificantes e diferentes tipos de lncRNAs. As análises de biologia de sistemas identificaram módulos de co-expressão ligados ao desenvolvimento do coração. Como trabalho futuro, pretende-se adquirir os papéis funcionais desses RNAs no desenvolvimento de tecidos cardíacos usando abordagens de validação experimental.