Macro SOStream: Um algoritmo evolutivo para agrupamento auto-organizado baseado em densidade
Sistemas Evolutivos, Fluxo de dados, Aprendizado online, Agrupamento de dados.
Situações que geram fluxo de dados contínuo, como são os casos de tráfego TCP/IP, e-commerce e monitoramento industrial, podem tornar inviável a utilização de algoritmos que possuem estratégias de aprendizagem de máquina off-line. Isto se deve à necessidade de armazenamento dos dados em função do crescimento infindável da geração dos dados e às restrições como memória limitada. Para tratar essa classe de problemas, surgiram os algoritmos que possuem a aprendizagem totalmente ou parcialmente on-line. Dentre eles, há os algoritmos evolutivos, os quais têm sido alvo de interesse pelo fato de possuírem a capacidade de se desenvolverem e atualizarem em ambientes desconhecidos, como também a habilidade de detecção de mudanças e desvios dos dados de entrada ao longo do tempo. Diante da vasta gama de possíveis aplicações de algoritmos evolutivos em problemas reais, neste trabalho propomos um novo algoritmo evolutivo denominado de Macro SOStream. Esse algoritmo possui aprendizagem on-line e é baseado em densidade para agrupamento auto-organizável de fluxo de dados. O Macro SOStream tem como origem o algoritmo SOStream, porém aqui foi incorporado o conceito de macroclusters, os quais são formados pelos microclusters. Enquanto que os microclusters possuem formas esféricas, os macroclusters têm formas arbitrárias. Além disso, a performance do Macro SOStream é comparada com o SOStream e o DenStream. Para isso, foi utilizado bases de dados juntamente com a métrica de desempenho de clusterização Adjusted Rand Index (ARI).