Investigando as moléculas do DNA usando ferramentas de física estatística
DNA humano, multifractal, CGR, Complexidade, entropia
Exploramos uma série de ferramentas estatísticas na análise de sequências de DNA, com foco especial em quatro espécies de interesse: seres humanos, coronavírus, milho e soja. A escolha dessas espécies se deve a importância que elas desempenham no contexto médico, biológico, econômico, tratamento de doenças e agricultura. Utilizando métodos como o Chaos Game Representation, Multifractal Detrended Fluctuation Analysis, e o plano complexidade-entropia, investigamos a estrutura e a dinâmica das sequências de DNA dessas espécies. Além disso, buscamos caracterizar a distribuição dos comprimentos dos pares de base da parte do codificante do DNA humano utilizando modelos fundamentados na estatística de Tsallis e recorrendo à estatística bayesiana para identificar o modelo mais preciso para estas distribuições. Os resultados revelaram correlação do tipo lei de potência nas sequências genéticas estudadas, destacando a presença de características multifractais e a natureza persistente em sua composição. Essas descobertas sublinham a complexidade e a dificuldade de prever a composição genética, além de enfatizar o potencial dessas ferramentas estatísticas para aprofundar nossa compreensão das sequências de DNA e suas implicações para a saúde, agricultura e tecnologia. As descobertas abrem caminho para pesquisas futuras, sugerindo a aplicação dessas metodologias a uma gama mais ampla de organismos, com o intuito de explorar a vasta complexidade genética existente.