Ementa/Descrição: |
1. Overview sobre os desafios de PLN. 2. Corpos linguísticos anotados para Inglês e Português, aprendizado supervisionado e avaliação da eficácia. 3. Módulos, componentes, tarefas de um sistema de PLN: pré-processamento; processamento ao nível das palavras; processamento ao nível das estruturas sintáticas ou de dependências; processamento ao nível semântico, pragmático, de discurso, resolução de correferência. 4. Técnicas de Aprendizado de Máquina para Processamento de Linguagem Natural 5. Representações distribuídas para palavras (vector space models, word embeddings) 6. Aplicações de PLN: os tópicos poderão variar a cada semestre; candidatos típicos são: NER (named-entity recognition), extração de tópicos relevantes e classificação de documentos, análise de sentimento, sistemas de recomendação, Q&A (perguntas e respostas), aconselhadores ortográficos e sintáticos, tradução (semi-) automática, sumarização, inferência textual, reconhecedores de estilo, outros tópicos Recuperação e Extração de Informações – IR/IE |