PandemAI: Um Arcabouço de Aprendizado de Máquina para a Dinâmica de Sintomas de Doenças Virais
COVID-19, sintomas, aprendizado de máquina, framework, t-sne, k-means, apriori, xgboost, inteligência artificial explicável
Historicamente, as pandemias se manifestaram de diversas formas, impactando as sociedades humanas ao redor do mundo de maneiras diferentes ao longo do tempo. Algumas pandemias são particularmente lembradas devido às suas altas taxas de mortalidade, ampla disseminação geográfica ou longa duração. No entanto, ao lidar com pandemias causadas por vírus, é fundamental considerarmos a sua capacidade inerente de mutação rápida, gerando diferentes linhagens e variantes.
Essa tarefa se torna particularmente difícil ao considerarmos as variações sintomáticas entre as diferentes variantes/linhagens ao longo do tempo e seu impacto na caracterização da doença, especialmente devido aos sintomas frequentemente serem o principal fator para um diagnóstico. Nesse contexto, ao longo das últimas décadas, os algoritmos de Aprendizado de Máquina (AM) se consolidaram como ferramentas analíticas poderosas. Uma vez que identificar padrões em conjuntos de dados é uma das funções primárias da AM, tais técnicas desempenham um papel fundamental no reconhecimento da doença em suas diversas manifestações, contribuindo assim para diagnósticos mais precisos.
Assim, este estudo propõe o PandemAI, um framework orientado por dados, desenvolvido para analisar como as variações de sintomas impulsionadas pela evolução de variantes virais impactam o reconhecimento da doença ao longo do tempo. O framework é composto por três fases: exploração de padrões sintomáticos, mineração de regras de sintomas e predição diagnóstica baseada em sintomas. Para validar a abordagem proposta, utilizamos dados do sistema brasileiro de vigilância de casos de Síndrome Respiratória Aguda Grave (SRAG).