-
Notifications
You must be signed in to change notification settings - Fork 0
8. Importar archivos o BDD externas
IMPORTANTE: Antes de empezar a trabajar con cualquier archivo, porfavor definir tu encoding a UTF-8. Esto se hace yendo a la barra superior, apretando donde dice 'Tools' > 'Global Options' > 'Code' y en la pestaña Saving.
Para importar un archivo, RStudio ofrece un asistente al cual podemos acceder, este se encuentra en el Panel Enviroment, botón Import Dataset (Tambien en la barra superior File > Import Dataset).
Es importante declarar que tipo de archivo es nuestra BDD para poder obtener los datos que queremos de forma correcta, para esto:
- Para archivos .txt o .csv, utilizar opción “From Text (base)"
- Para archivos Excel, elegir opción “From Excel"
Otra cosa importante, es que cuando estamos importando archivos .txt o .csv tenemos que definir algunos parametros para una correcta importación de los datos:
- Encoding: Dejenlo en Automatic
- Heading: Dejenlo en Yes
- Separator: Fijense bien en con que caracter se separa cada una de las columnas, por ejemplo:
1, Minero, 13
En este caso, nuestro separador seria la ',' ya que esta ultima separa cada columna una de otra
- Decimal: Define cual será el caracter que definira los decimales (El separador entre parte entera y decimal)
- Quote: Define entre que caracteres estan encerradas las strings
- Comment: Nada importante
- na.strings: Define cual es el valor de un objeto nulo, osea, si tenemos un item que es nulo (No existe), cual seria su terminologia.
Para importar un archivo a R, podemos usar los siguientes comandos
data <- read.table(direccion_del_archivo) # Importa .txt, .csv y .dat
data <- read.csv(direccion_del_archivo) # Importa .csv
data <- read_excel(file.choose())
- direccion_del_archivo es la RUTA ABSOLUTA de un archivo (Osea, parte desde C:/). Un ejemplo seria:
"C:/Usuario/Documentos/Tenis.txt"
- file.choose() permite reemplazar la lata de obtener la ruta absoluta de un archivo y simplemente seleccionar el archivo que queremos importar (Recomendado en caso de que no tengas mucha experiencia en programación)
Imaginemos que tenemos lo siguiente, primero, una BDD con las siguientes caracteristicas:
Dia | Trabajo | Horas_Trabajadas |
---|---|---|
1 | Minero | 13 |
2 | Agronomo | 5 |
7 | Contador | 10 |
Y la importamos como:
df <- read.csv(file.choose())
Despues de importar esta BDD, podemos realizar lo siguiente:
Queremos obtener diferentes operaciones de ciertas columnas de la BDD, en este caso de la columna 'Horas Trabajadas'. Entonces, para ejecutar una operación sobre una columna, se usa:
operacion(nombre_bdd$nombre_columna)
# En este caso
operacion(df$Horas_Trabajadas)
Estas serian todas las operaciones basicas que puedes hacer con BDD:
- mean(x) = Media
- var(x) = Varianza
- sd(x) = Desviacion estandar
- summary(x) = Resumen de un vector numerico
- quantile(x) = Cuantiles de una muestra
- min(x) = Minimo de una muestra
- max(x) = Maximo de una muestra
- range(x) = Rango de una muestra
- median(x) = Mediana de una muestra
- table(x) = Tabla de conteo de una muestra