Framework para Análise de Grande Volume de Dados por Serviço REST
Big Data, Spark, Framework, Análise de Dados, Séries Temporais, Saúde Pública
Dada a crescente quantidade de dados eletrônicosregistrados diariamente, relacionados à saúde pública, existe uma tendência atual para o uso da análise de dados no intuito de implementar mudanças nos sistemas de saúde, que possibilitem a redução de custos e a melhor prestação de serviços à população. O termo Big Data na Saúde vem sendo amplamente utilizado em diversos estudos, os quais buscam encontrar e avaliar os possíveis benefícios de Big Data, dentre os quais: a redução do desperdício e ineficiência na saúde pública por meio da análise de padrões de doença e rastreamento de surtos para melhorar a vigilância e acelerar a resposta, o desenvolvimento de vacinas mais direcionadas, etc. Entretanto, grande parte dos estudos que envolvem Big Data e Saúde Pública se baseiam em análises teóricas e qualitativas, apresentando como limitações e desafios, por exemplo, a validação das sugestões propostas e a formação de competências para o uso das tecnologias de Big Data, as quais diferem das tecnologias tradicionais. Nesse sentido, o presente trabalho tem o objetivo de implementar um framework para análise de grandes volumes de dados, que permitirá a utilização de métodos tradicionais disponíveis na linguagem R, muito utilizada por estatísticos para analisar dados na Epidemiologia. Para permitir a interoperabilidade entre sistemas, será desenvolvida uma API (Application Programming Interface) web para acesso às funcionalidades do framework por REST (Representational State Transfer). Como estudo de caso, serão utilizadas funcionalidades para manipulação de séries temporais.