Códigos-fontes (Notebooks Python) e recursos de apoio para a disciplina CIC0269 - Processamento de Linguagem Natural (Natural Language Processing), do Departamento de Ciência da Computação da Universidade de Brasília.
Prof. Dr. Vinícius Ruela Pereira Borges
Matheus Stauffer Viana de Oliveira
-
Introdução ao Processamento de Linguagem Natural
-
Princípios de Linguística
-
3.1. Teste sua RegEx (ao vivo) aqui: RegExPal
-
Pré-processamento de Textos
4.1. Pré-processamento de Textos
4.2. LIWC em Língua Portuguesa
4.3. Aplicação: Part-of-Speech (PoS) Tagging utilizando Dicionários
-
Extração de Características de Textos
-
Similaridade entre Textos
6.1. Edit Distance
6.2. Similaridade Cosseno
6.3. Aplicação: Recuperação de Textos Baseada em Conteúdo (Text Retrieval)
-
Modelos de Linguagem Probabilísticos
-
Classificação de Textos
8.1. Regressão Logística
-
Redes Neurais Artificiais
9.1. Perceptron Simples
9.2. Multilayer Perceptron com Backpropagation (XOR)
9.3. Multilayer Perceptron via Keras (XOR)
9.4. Aplicação: Classificação de Polaridade em Tweets com Multilayer Perceptron (Keras)
-
Construção e Anotação de Corpos de Texto
10.1. Planejando um Processo de Anotação na Ferramenta TagTog
-
Redes Neurais Convolucionais
11.1. Princípios Básicos de Convolução
11.2. Implementando uma AlexNet para Classificação de Imagens de Documentos
11.3. Transferência de Aprendizado em uma ResNet para Classificação de Imagens de Documentos
-
Redes Neurais Recorrentes
12.1. Princípios de Redes Neurais Recorrentes
12.2. Modelos de Linguagem Baseados em RNNs
12.3. Aplicação 1: Inferência de Linguagem Natural
12.4. (Extra) Universal Language Modeling Fine-Tuning (ULMFiT)
-
Word Embeddings
13.1. Princípios de Word Embeddings utilizando word2vec
13.2. Aprendizado por Transferência via word2vec
-
Reconhecimento de Entidades Nomeadas (Named Entity Recognition - NER)
14.1. BiLSTM
-
Arquitetura Encoder-Decoder (Seq2Seq)
15.1. Fundamentos de Encoder-Decoder
-
Mecanismo de Atenção
16.1. Fundamentos
-
Transformers
17.1. Arquitetura Transformer
17.2. Classificação de Reviews de Filmes utilizando BERT
17.3. Classificação de Reviews de Filmes utilizando GPT3
-
Modelos Generativos
18.1. Redes Adversárias Generativas (GAN)
18.2. Sequential GAN (SeqGAN)
https://web.stanford.edu/~jurafsky/slp3/
https://github.com/jacobeisenstein/gt-nlp-class/blob/master/notes/eisenstein-nlp-notes.pdf