Modelagem em superestatística da distribuição de tamanho de sequências de DNA codificantes para Genoma
Eucarionte.
DNA, Estatística não aditiva, Superestatística, Inferência Bayesiana, Séries Temporais.
Neste trabalho, exploramos os princípios fundamentais do formalismo superestatístico e aplicamos esses conceitos à
análise de dados genômicos de organismos eucariontes. Utilizamos um modelo generalizado de Heston no contexto da
superestatística para capturar as correlações de curto alcance nas distribuições de tamanhos da região codificante, éxons, do
genoma \textit{Homo sapiens}. Para o estudo dos vegetais, adotamos uma abordagem de análise de séries temporais com o
objetivo de descrever as correlações de curto alcance na família \textit{Cucurbitaceae}.
Os modelos resultantes, as distribuições $q$-Gama e $q$-Gama Inversa, mostraram-se eficazes na descrição dos dados
genômicos. Além disso, a aplicação da análise Bayesiana permitiu-nos avaliar a incerteza associada aos parâmetros do modelo
e selecionar o modelo mais apropriado para a descrição dos dados. Nossos resultados indicam que a abordagem superestatística
e o uso de distribuições generalizadas são ferramentas valiosas na análise de dados genômicos, proporcionando uma
compreensão mais profunda das correlações de curto alcance na distribuição dos tamanhos dos éxons.