Banca de QUALIFICAÇÃO: GABRIEL AFONSO FREITAS AIRES

Uma banca de QUALIFICAÇÃO de MESTRADO foi cadastrada pelo programa.
DISCENTE : GABRIEL AFONSO FREITAS AIRES
DATA : 11/05/2026
HORA: 16:00
LOCAL: Google Meet - https://meet.google.com/urn-abst-shm
TÍTULO:

Razão custo–desempenho de LLMs em BioNER: análise de escalabilidade e estratégias de In-Context Learning no corpus BC5CDR


PALAVRAS-CHAVES:

BioNER; Grandes Modelos de Linguagem; In-Context Learning; escalabilidade; F1-Score; BC5CDR


PÁGINAS: 105
RESUMO:

Este trabalho investiga a razão custo-desempenho e os limites cognitivos de Grandes Modelos de Linguagem (LLMs) na tarefa de Reconhecimento de Entidades Nomeadas Biomédicas (BioNER) sob o paradigma de In-Context Learning (ICL). Utilizou-se o corpus BC5CDR consolidado (1.500 artigos) para a extração estruturada de compostos químicos (Chemicals) e patologias (Diseases). Por meio de um pipeline distribuído e reprodutível baseado no motor vLLM, foram avaliadas 18 arquiteturas open-weights (1B a 70B parâmetros) submetidas a variações sistemáticas do número de exemplos few-shot em contexto (k ∈ {0, 1, 2, 4, 8, 16, 32}). A avaliação pautou-se no critério estrito de Exact Match, mensurando Precisão, Revocação e F1-Score. Os resultados quantitativos revelam que: (i) a escalabilidade paramétrica eleva o desempenho, com o modelo de 70B atingindo o teto preditivo (F1 ∼ 0,63), ao passo que modelos altamente instruídos de 8B (F1 ∼ 0,61) estabelecem a fronteira de Pareto ótima, indicando que o refinamento do treinamento compensa o custo de inferência; (ii) o acréscimo de exemplos few-shot induz saturação atencional em arquiteturas menores, provocando colapsos de até 75% no F1-Score em densidades extremas (k = 32), fenômeno quantificado pela métrica de Estabilidade de Contexto (∆); e (iii) existe assimetria entre as classes, com Chemicals extraídas com alta precisão morfológica (F1 ∼ 0,79), enquanto Diseases (F1 ∼ 0,48) configuram a principal barreira de abstração semântica. O estudo oferece, assim, diretrizes para a implantação eficiente e escalável de LLMs em aplicações biomédicas.


MEMBROS DA BANCA:
Presidente - 2353000 - ELIAS JACOB DE MENEZES NETO
Interno - 2668551 - ANDRE MORAIS GURGEL
Interno - 2180207 - ITAMIR DE MORAIS BARROCA FILHO
Notícia cadastrada em: 18/05/2026 11:59
SIGAA | Superintendência de Tecnologia da Informação - (84) 3342 2210 | Copyright © 2006-2026 - UFRN - sigaa14-producao.info.ufrn.br.sigaa14-producao