Materiales del curso de verano de LinhdUned
José Manuel Fradejas Rueda Departamento de Lengua Española, Universidad de Valladolid
Antonio Robles Departamento de Sistemas de Comunicación y Control, UNED
En este repositorio se encuentran todos los materiales que se emplearán en este curso en el que introduciremos a los alumnos en el análisis de sentimientos aplicados a la literatura española. Se ejemplificará con textos literarios en español y se contrastarán con los resultados que arrojan los mismos textos en inglés (cuando sea posible). Para poder llegar a ello, en la Universidad de Valladolid, el proyecto 7PartidasDigital, ha estado trabajando en la creación / modificación / traducción de los diccionarios de sentimientos instalados o empleados en dos paquetes básicos para estos análisis: tidytext de Julia Silge y David Robinson y syuzhet de M.L. Jockers.
Lo mejor es descargar este repositorio como un zip
y dejarlo en el escritorio del ordenador, o reubicarlo en donde mejor convenga, pero se ha de tener en cuenta que los scripts buscarán los datos en la carpeta descargada, se llame como se llame y se ubique en donde se ubique.
Quienes sean nuevos en el manejo de R, y para ahorrar tiempos muertos durante la sesión de trabajo, lo mejor es que instalen el software según se explica en los vídeos que se indican un poco más abajo. Ha de hacerse en la secuencia indicada (la explicación de cada vídeo es inferior a cinco minutos, pero el tiempo necesario para instalar el software y los componentes necesarios es un poco más largo):
Este último vídeo necesita un fichero para instalar las librerías pertinentes que se llama instalar-paquetes.txt
. Pero también se puede hacer con esta línea de código (cópiala y pégala en la consola de RStudio):
install.packages(c("tidyverse","tidytext","scales","igraph","ggraph","wordcloud","syuzhet","stylo","XML","RCurl","tm","topicmodels"))
El orden en que se utilizarán los scripts en el curso es:
MdT-Linhuned_Final.R
Sentiment-1-Linhduned_Final.R
Sentiment-2-Linhduned_Final.R
AS-SHAPE-STORIES-NRC.R
Cada uno de estos scripts buscará en el directorio de trabajo los distintos componentes que necesite en cada momento, ya sean ficheros .rda
, .r
o .txt
.
Un último aviso. Todos los ficheros son UTF-8, quienes utilicen sistemas basados en Windows deberán convertir a la codificación windows los ficheros pertinentes.
En el sitio web de los Cursos de verano de la UNED hay una copia para máquinas Windows y se encuentran todos las presentaciones que se utilizarán.