Aprendizagem Semissupervisionada por meio de Técnicas de Deep Learning e de Teoria da Informação
Semissupervisionado, Deep Learning, Rotulação, Agrupamento, Classificação, Teoria da Informação.
O crescimento expressivo de conjuntos de dados modernos, combinado à dificuldade de obter informações sobre rótulos, tornou o aprendizado semissupervisionado um dos problemas de importância prática na análise moderna de dados. Na maioria dos casos, obter conjunto de dados com a quantidade de exemplos suficientes para induzir um classificador, pode ser oneroso, pois é necessário que seja realizada uma rotulação dos dados por um especialista. Dados não rotulados são mais fáceis de serem obtidos, porém mais difíceis de serem analisados e interpretados. No problema do aprendizado semissupervisionado, têm-se uma base de dados formada por uma pequena parte rotulada e uma parte maior não rotulada, sendo possível duas vertentes: classificação semissupervisionada e agrupamento semissupervisionado. A partir disso, o objetivo deste trabalho baseia-se na aplicação de modelos que utilizam técnicas de Deep Learning no aprendizado semissupervisionado, onde treina-se uma rede neural, neste caso um auto encoder utilizando dados não rotulados. Então, acopla-se uma camada a mais no encoder. Esta nova camada tem seus pesos inicializado pelo algoritmo K-means++, e ajustados por meio do backpropagation utilizando aprendizado por teoria da informação. Os dados rotulados são atribuídos aos grupos gerados pelo encoder, influenciando os não rotulados, grupo à grupo, desta forma rotulando os dados não rotulados que foram previamente agrupados. Com os experimentos realizados notou-se que o desempenho satisfatório do modelo proposto quando comparados com outros algoritmos semissupervisionados, tantos os clássicos como selftraining e co-training, como outros trabalhos mais recente, mostrando a viabilidade do modelo proposto para o problema de aprendizagem semissupervisionada.