Proposta de Implementação Paralela de Algoritmos de Clustering em Hardware
Data sets Massivos, Clusterização de Dados, Sistemas Paralelos, Hardware.
Este trabalho apresenta um estudo sob algoritmos de clusterização de dados implementados em hardware dedicado para aplicações em geral, objetivando aumentar a velocidade de processamento. Algoritmos de clusterização têm sido amplamente adotados para encontrar a padrões entre dados, em diferentes áreas. No entanto, estes algoritmos normalmente implicam em uma alta complexidade de processamento e, além disso, a quantidade de dados armazenados atualmente é massiva. Sendo assim, a necessidade de processamento de dados com alto throughput tornou-se ainda mais importante, especialmente para aplicações em tempo real. Uma solução que foi adotada para aumentar a velocidade de processamento é o uso de técnicas paralelas implementadas em hardware dedicado, que provou ser mais eficiente em comparação com sistemas sequenciais. Logo, este trabalho propõe a implementação totalmente paralela dos algoritmos de clusterização de dados em hardware para otimizar o tempo de processamento dos sistemas em diversas áreas, possibilitando aplicações para sistemas com quantidade massiva de dados. Uma nova proposta de implementação dos algoritmos de clusterização K-means e Self-Organising Map são apresentadas, juntamente a análises dos resultados relacionados ao throughput e o recurso de hardware para diferentes parâmetros. As implementações apresentadas aqui apontam para uma nova direção associada a implementação de algoritmos de clusterização e poderá ser utilizada em outros algoritmos.