Metodologia Orientada a Agentes de Linguagem para Assistência Automotiva: Integrando Engenharia de Prompts e MLOps em Chatbots Avançados
Retrieval-Augmented Generation, Assistência Automotiva, Engenharia de Prompts, Modelos de Linguagem, Self-RAG, Gradiente Descendente.
O avanço tecnológico tem alterado de maneira expressiva a forma como o conhecimento técnico é buscado e interpretado, especialmente em áreas complexas, como a assistência automotiva. Nesse contexto, modelos de linguagem que utilizam técnicas de Retrieval-Augmented Generation (RAG) destacam-se por permitir a recuperação e geração de respostas precisas a partir de grandes volumes de dados textuais, como manuais automotivos. No entanto, a crescente complexidade dos cenários de busca exige soluções mais robustas, capazes de integrar otimização contínua e adaptação dinâmica das consultas e respostas. Diante disso, este trabalho propõe uma metodologia orientada a agentes de linguagem para a assistência automotiva, combinando Engenharia de Prompts e práticas de MLOps em chatbots avançados. A abordagem é composta por quatro variantes: RAG padrão, RAG com Gradiente Descendente (para otimização de prompts), Self-RAG Adaptativo e Self-RAG Adaptativo com Gradiente Descendente. Os resultados mostram que o RAG gerou respostas mais precisas e estruturadas, enquanto o RAG com Gradiente Descendente teve falhas em precisão e abrangência. O Self-RAG Adaptativo e sua variação, por sua vez, mostraram potencial, mas enfrentaram desafios em clareza e precisão, exigindo refinamentos para equilibrar autocrítica e geração de conteúdo.