Um algoritmo online e evolutivo para compressão automática de dados em cenários de IoT
Compressão de dados online, IoT, Veículos Inteligentes, TinyML, aprendizado de máquina, algoritmo evolutivo, excentricidade de dados
Com o avanço e adoção em massa de soluções no campo de Internet das Coisas (IoT) e cidades conectadas, o número de dispositivos e sensores conectados à rede tende a crescer exponencialmente. Nesse cenário, a transmissão e armazenamento do crescente volume de dados trazem novos desafios. Quando dispositivos transmitem dados potencialmente irrelevantes ou redundantes, há um maior gasto de energia e processamento, além do uso desnecessário do canal de comunicação. Dessa forma, soluções de compressão de dados localmente nos próprios dispositivos de IoT se tornam cada vez mais atrativas, possibilitando a eliminação de amostras que teriam pouca ou nenhuma contribuição para a aplicação, de forma a reduzir significativamente o volume de dados necessários para representar as informações. No entanto, tais dispositivos presentes hoje no mercado tem sérias limitações de armazenamento e poder de processamento. A fim de circundar tais limitações, surge o campo de TinyML, que busca maneiras de implementar modelos de aprendizado de máquina em dispositivos de baixa potência. Dado esse contexto, um dos setores que mais pode se beneficiar dessas novas tecnologias é a indústria automobilística, pois atualmente todos os carros produzidos devem ser instrumentados com uma série de sensores. Dessa forma, ao conectar um dispositivo inteligente no veículo, é possível fazer um processamento local dos dados e transmiti-los para um servidor remoto posteriormente. Nesse contexto, o presente trabalho propõe o desenvolvimento de um novo algoritmo de compressão de dados online, não supervisionado, e automaticamente adaptável para aplicações de IoT. A abordagem proposta é chamada de Tiny Anomaly Compressor (TAC) e é baseada na excentricidade de dados e não requer modelos matemáticos previamente estabelecidos ou quaisquer suposições sobre a distribuição de dados. Para testar a eficácia da solução e validá-la foram realizados dois testes com diferentes objetivos. Primeiramente foi desenvolvida uma análise comparativa em dois conjuntos de dados do mundo real com dois outros algoritmos da literatura, o Swing Door Trending (SDT) e o Discrete Cosine Transform (DCT). Por fim, a proposta foi embarcada em um dispositivo IoT baseado em um Arduino e conectado a um carro com o propósito de verificar o impacto do algoritmo no tempo de processamento das operações primárias do sistema. Resultados preliminares mostram ser possível alcançar significativas taxas de compressão sem impactos significativos no erro gerado e no processamento do sistema.