Uma Nova Forma de Calcular os Centros dos Clusters em Algoritmos de Agrupamento Tipo Fuzzy C-Means
Lógica Fuzzy, Agrupamentos, Fuzzy C-means, Centros de Clusters, Dados Intervalares, Distancias Intervalares, ckMeans.
Agrupar dados é uma tarefa muito importante em mineração de dados, processamento de imagens e em problemas de reconhecimento de padrões. Um dos algoritmos de agrupamentos mais popular é o Fuzzy C-Means (FCM). Esta tese porpõe aplicar uma nova forma de calcular os centros dos clusters no algoritmo FCM, que denominamos de ckMeans, e que pode ser também aplicada em algumas variantes do FCM, em particular aqui aplicamos naquelas variantes que usam outras distancias. Com essa modificação pretende-se reduzir o número de iterações e o tempo de processamento desses algoritmos sem afetar a qualidade da partição ou até melhorar o número de classificaçõe corretas em alguns casos. Também, desenvolveu-se um algoritmo baseado no ckMeans para manipular dados intervalares considerando graus de pertinência intervalares, possibilitando assim, representar os dados sem nenhuma conversão dos dados intervalares para pontuais, como ocorre com outras extensões do FCM que lidam comdados intervalares. Para validar as metodologias propostas, comparou-se o agrupamento ckMeans com os algoritmos K-Means (pois a nova forma de calcular os centros se assemelha à do K-Means) e FCM, considerando três distâncias diferentes.Utilizaram-se várias bases de dados conhecidas. No caso, do ck-Means intervalar, foi comprada com outros algoritmos de agrupamentointervalar quando aplicadas a uma base de dados intervalar com a temperatura mínima e máxima do mês de um determinado ano de 37 cidades distribuídas entre os continentes.