Classificação de padrões através de um comitê de máquinas aprimorado por aprendizagem por reforço
Aprendizado de Máquina, Sistemas Inteligentes, Classificação de Padrões, Máquinas de Comitê, Máquinas de Vetor de Suporte, Aprendizagem por Reforço.
A aprendizagem por reforço é uma técnica de aprendizado de máquina que, embora já te- nha encontrado uma grande quantidade de aplicações, talvez ainda não tenha alcançado seu pleno potencial. Uma das possibilidades que não foi devidamente testada até hoje foi a utili- zação da aprendizagem por reforço em conjunto com outros métodos para a solução de pro- blemas de classificação de padrões.
É bem documentada na literatura a problemática que ensembles de máquinas de vetor de suporte encontram em termos de capacidade de generalização. Algoritmos como Adaboost não lidam com apropriadamente com os desequilíbrios que podem surgir nessas situações. Várias alternativas já foram propostas, com margens variadas de sucesso.
Esta dissertação apresenta uma nova abordagem para a construção de comitês de máqui- nas de vetor de suporte. O algoritmo apresentado combina o algoritmo Adaboost com uma camada de aprendizagem por reforço, para ajustar parâmetros do comitê evitando que dese- quilíbrios nos classificadores componentes do comitê prejudiquem o desempenho de generali- zação da hipótese final. Foram efetuadas comparações de comitês com e sem essa camada adicional de aprendizagem por reforço, testando conjuntos de dados benchmarks amplamente conhecidos na área de classificação de padrões.