Da Execução Reativa ao Planejamento Estruturado: Automação de Testes E2E Guiada por Grafos Navegacionais e LLMs Multimodais.
Automação de Testes Web; Testes End-to-End; Modelos de Linguagem de Grande Escala (LLMs); Modelos Navegacionais; Testes Frágeis (Flaky Tests); Agentes Multimodais.
A automação de testes end-to-end (E2E) é fundamental para assegurar a qualidade de aplicações Web modernas ao validar fluxos completos sob a ótica do usuário final. No entanto, estratégias tradicionais baseadas em scripts apresentam alto custo de manutenção e elevada fragilidade, frequentemente resultando em testes instáveis devido ao forte acoplamento a detalhes mutáveis do Document Object Model (DOM). Embora modelos de linguagem de grande escala (LLMs) já demonstrem capacidade de produzir testes a partir de descrições em linguagem natural, as abordagens atuais operam majoritariamente por tradução direta dessas descrições em scripts, sem manter uma representação estrutural persistente da interface, o que limita a reutilização de conhecimento. Neste trabalho, analisamos o impacto do uso de modelos navegacionais que representam a interface da aplicação como um grafo de rotas semanticamente enriquecidas para a geração de testes E2E. Propomos uma estratégia que separa a etapa de descoberta de conhecimento da síntese de testes, explorando a interface para construir um grafo de transições cujos estados são anotados com informações semânticas obtidas por um agente multimodal que avalia a estrutura e o visual da interface. Em seguida, mapeamos casos de teste em linguagem natural para caminhos nesse grafo, visando à geração de scripts executáveis mais robustos. A abordagem é avaliada por meio de um estudo empírico-experimental comparativo em aplicações Web de código aberto, frente a baselines de tradução direta. Com isso, esperamos reduzir a fragilidade típica de testes fortemente acoplados ao DOM e promover maior reutilização do conhecimento ao longo do ciclo de vida da aplicação.