Autoencoder com espaço latente expandido para previsão de séries temporais da Covid-19
Aprendizado de Máquina, Redes Neurais Artificiais, Auto-encoder, Pandemia, COVID-19
A pandemia global de SARS-CoV-2 levou governos, instituições e pesquisadores a avaliar seu impacto e a desenvolver estratégias baseadas em indicadores gerais para alcançar as previsões mais precisas possíveis. Embora os modelos epidemiológicos tenham sido amplamente utilizados, eles frequentemente geravam previsões incertas devido a dados insuficientes ou ausentes. Além das limitações de dados, diversos modelos de aprendizado de máquina, como florestas aleatórias, regressão por vetores de suporte, LSTM, autoencoders e modelos tradicionais de séries temporais, como Prophet e ARIMA, foram empregados, resultando em desempenhos impressionantes, mas com algumas limitações. Alguns desses métodos enfrentam dificuldades de precisão ao lidar com entradas multivariadas, o que é crucial para problemas como a previsão de séries temporais em pandemias, que exigem previsões de curto e longo prazo. Em resposta a esse desafio, propomos uma abordagem inovadora para a previsão de séries temporais que utiliza uma estrutura de autoencoder empilhado. Nosso modelo utiliza $n$ autoencoders internos para processar as entradas e gerar diferentes espaços latentes para essas respectivas entradas. Em seguida, esses diferentes espaços latentes são concatenados e o espaço latente expandido é obtido. Conduzimos um experimento usando um conjunto de series previamente publicados sobre casos de COVID-19, mortes, temperatura, umidade e índice de qualidade do ar (IQAr) na cidade de São Paulo, Brasil. Esse experimento avaliou a adequação do nosso modelo para previsões de curto, médio e longo prazo. Além disso, comparamos diretamente nosso modelo proposto com dois trabalhos existentes na literatura que já passaram pelo escrutínio de especialistas. A primeira comparação posiciona nosso modelo entre aqueles que utilizam uma rede para extração de características e outra para prever tendências da pandemia. A segunda comparação destaca a eficácia do nosso modelo na previsão de múltiplas séries de indicadores pandêmicos. Os resultados sugerem que o modelo proposto possui fortes capacidades tanto na extração de características quanto na previsão de múltiplas séries, oferecendo melhorias em relação aos dois trabalhos comparados. Finalmente, o modelo demonstra uma precisão promissora em previsões e versatilidade em conjuntos de dados de diferentes tamanhos, tornando-se uma opção destacada para tarefas de previsão de séries temporais.