Uma Implementação Reativa Usando Algoritmos Busca Tabu e Aprendizagem por Reforço
Aprendizagem por reforço
Busca Tabu
Busca Reativa
Metaheurísticas
As metaheurísticas são técnicas conhecidas para a resolução de problemas de otimização, classificados como NP-Completos e vêm obtendo sucesso em soluções de boa qualidade. Elas fazem uso de abordagens não determinísticas que geram soluções que se aproximam do ótimo, mas no entanto, sem a garantia de que se encontre o ótimo global. Motivado pelas dificuldades em torno da resolução destes problemas, este trabalho propõe o desenvolvimento de métodos utilizando a aprendizagem por reforço, busca reativa e busca tabu. Com a utilização dessas técnicas em conjunto, objetiva-se então, contribuir na obtenção de soluções mais eficazes. Neste caso, utiliza-se o algoritmo Q-learning da aprendizagem por reforço, não apenas como técnica de geração das soluções iniciais da busca reativa, mas também aplicando o reforço e penalidades para o auto-ajustamento dos parametros da busca tabu e dele próprio, afim de uma melhor adaptação ao contexto na busca da metaheurística.