Do Alarme ao Diagnóstico: Explicabilidade de Modelos e LLMs para Classificação de Falhas sob Supervisão Fraca em Usinas Hidrelétricas
Manutenção preditiva. Supervisão fraca. Diagnóstico de falhas. Explicabilidade de Modelos (XAI). SHAP. LIME. Grandes Modelos de Linguagem. Usinas hidrelétricas. Mancal de escora.
Sistemas industriais modernos registram anomalias em larga escala por meio de alarmes, violações de limiar e eventos de proteção, mas raramente oferecem diagnósticos acionáveis sobre o mecanismo subjacente à falha. Em usinas hidrelétricas, esse descompasso é particularmente crítico pois o volume de ocorrências supera a capacidade de análise de causa raiz por especialistas, elevando o risco de paradas não programadas e decisões reativas. Esta tese investiga a viabilidade de transformar detecções binárias de falha em hipóteses plausíveis de modos de falha por meio de um framework orientado a evidências sob supervisão fraca. A abordagem é estruturada em duas etapas no nível macro. Na primeira etapa, um classificador supervisionado é treinado exclusivamente com rótulos binários derivados de eventos operacionais. Na segunda etapa, o refinamento diagnóstico é realizado a partir de evidências estruturadas: atribuições locais de importância (SHAP/LIME) e contextualização percentílica categórica (muito baixo a muito alto), que são fornecidas a um Grande Modelo de Linguagem (LLM) para sintetizar hipóteses diagnósticas rastreáveis às evidências. A plausibilidade do arcabouço foi validada inicialmente no dataset sintético AI4I 2020, demonstrando que explicações locais e percentis permitem inferência automatizada de modos de falha em regime zero-shot/few-shot, com desempenho superior quando SHAP é combinado à contextualização percentílica. Em seguida, o estudo de caso na UHE Água Vermelha (mancais de escora) confirmou aplicabilidade em condições reais, destacando que a heterogeneidade entre unidades geradoras é fator dominante no desempenho e motivando uma estratégia híbrida de implantação, combinando modelos dedicados e um modelo combinado como contingência. A análise de explicabilidade revelou predominância de atributos térmicos e relações não monotônicas entre variáveis e risco predito, reforçando a necessidade de explicações locais e evidências contextualizadas. A inferência por LLM apresentou alta consistência em cenários com evidência clara e divergências controladas em cenários ambíguos, úteis como critério de escalonamento para revisão humana. Por fim, uma análise de confiabilidade via Weibull complementou a discussão operacional, oferecendo subsídios para planejamento e avaliação prospectiva de impactos na vida útil e disponibilidade dos ativos.