t-SNE paralelo: Uma técnica paralela para redução de dimensionalidade de dados aplicada em Cidades Inteligentes
Big Data, Cidades Inteligentes, Redução de Dimensionalide, t-SNE.
Nos últimos anos, a população urbana vem crescendo de maneira acelerada ao redor do mundo. Para se adequar a esse aumento populacional, os prefeitos precisam mudar a sua forma de gerir essas grandes cidades. Assim, o conceito de Cidades Inteligentes ganha força e vem para modificar a forma de vida da população mundial. O investimento nesse conceito de cidades inteligentes se encontra na direção de melhorar a gestão e a qualidade de vida das pessoas. Os maiores desafios na aplicação desse tipo de sistemas, estão vinculados ao processamento, visualização e análise dos dados gerados, visto que ao funcionarem conectados esses sistemas geram uma grande massa de dados, chamada de Big Data, que precisam ser tratados de maneira diferentes dos sistemas convencionais. Para a visualização dos dados, um artifício que pode ser utilizado são as técnicas para redução de dimensionalidade, que trazem os dados de uma dimensão n para duas ou três dimensões, ficando assim perceptíveis aos olhos humanos. Um dos principais problemas que envolve as técnicas de Redução de Dimensionalidade está vinculado ao tempo de processamento, o que os tornam praticamente inviáveis de serem aplicados a grandes massas de dados. Nessa tese, é sugerida uma maneira de diminuir o tempo de processamento desses algoritmos, através da paralelização do algoritmo t-SNE. Foi realizada uma análise em cada uma das partes do algoritmo, verificando que trechos poderiam ser paralelizados e quais trechos continuariam com seu processamento convencional. Dessa forma, o algoritmo paralelizado apresentou melhores resultados que a sua versão convencional, apresentando-se como uma técnica mais eficiente e eficaz na Redução da Dimensionalidade de dados com o objetivo de otimizar a visualização e análise dos mesmos.