Investigando a Combinação Técnicas de Aprendizado Semissupervisionado em Classificação Hierárquica Multirrótulo
classificação hierárquica, classificação multirrótulo, classificação hierárquica multirrótulo, aprendizado semissupervisionado
Embora a classificação tradicional seja bastante utilizada, há vários domínios nos quais os exemplos podem estar associados a mais de uma classe. Nesses casos, à tarefa de classificação dá-se o nome de classificação multirrótulo. Além disso, há também um grande número de problemas de classificação mais complexos chamados problemas de classificação hierárquica, nos quais as classes a serem preditas estão dispostas em uma estrutura hierárquica. Adicionalmente, em muitos dos problemas de classificação hierárquica, duas ou mais classes do conjunto finito de classes podem ser atribuídas ao mesmo exemplo. Esses problemas nos quais são combinadas a classificação hierárquica e a classificação multirrótulo são chamados de problemas de classificação hierárquica multirrótulo. Por outro lado, há uma forte tendência da comunidade científica em estudar uma nova categoria de aprendizado, surgida através da junção do aprendizado supervisionado com o aprendizado não-supervisionado, principalmente em problemas onde a quantidade de exemplos não-rotulados gerados é extremamente alta e a quantidade de exemplos rotulados é muito baixa. A essa nova categoria de aprendizado dá-se o nome de aprendizado semissupervisionado O aprendizado semissupervisionado combina dados rotulados e dados não-rotulados, durante a fase de treinamento, reduzindo, assim, a necessidade de dados rotulados quando somente um pequeno conjunto de exemplos rotulados está disponível. Desse modo, uma vez que tanto as técnicas de classificação hierárquica, multirrótulo e hierárquica multirrótulo quanto o aprendizado semissupervisionado vem apresentando resultados favoráveis à sua utilização, nesta proposta de trabalho é sugerida a combinação da classificação hierárquica multirrótulo com técnicas de aprendizado semissupervisionado, de modo a se aproveitar eficientemente as principais vantagens das duas áreas.