APRENDIZAGEM POR REFORÇO COMO AUXÍLIO À TOMADA DE DECISÃO EM SELF-TRAINING
Aprendizado de Máquina, Classificação de Padrões, Aprendizagem por Reforço, Aprendizado Semi-supervisionado, Self-training
O aprendizado de máquina comumente se define entre os dois paradigmas tradicionais: aprendizado supervisionado e aprendizado não-supervisionado. Contudo, há uma gama de problemas de classificação que não se encaixam nesses paradigmas, e a busca pela solução desses problemas motiva a pesquisa em aprendizado semi-supervisionado.
Dentro deste paradigma de aprendizado, a subárea de invólucro semi-supervisionado trata de técnicas que utilizam métodos supervisionados para resolver problemas semi-supervisionados, encontrando formas de extrair informações dos dados não-rotulados. O Self-training, uma dessas técnicas, utiliza a confiança do próprio classificador como ferramenta de decisão na evolução do algoritmo, o que pode gerar problemas de propagação de erros.
A aprendizagem por reforço é uma abordagem bastante reconhecida na área de problemas de decisão seqüencial, ajustando seus parâmetros com a experiência das decisões. Esta pesquisa busca desenvolver uma modelagem do problema do self-training como um problema de decisão seqüencial, de forma a utilizar a aprendizagem por reforço para treinar um agente capaz de tomar essa decisão, buscando solucionar os problemas apresentados por self-training.