Skip to content

8. Importar archivos o BDD externas

Maximiliano Militzer edited this page May 12, 2023 · 2 revisions

Encoding (IMPORTANTE)

IMPORTANTE: Antes de empezar a trabajar con cualquier archivo, porfavor definir tu encoding a UTF-8. Esto se hace yendo a la barra superior, apretando donde dice 'Tools' > 'Global Options' > 'Code' y en la pestaña Saving.

Importar un archivo o BDD (Con asistente)

Para importar un archivo, RStudio ofrece un asistente al cual podemos acceder, este se encuentra en el Panel Enviroment, botón Import Dataset (Tambien en la barra superior File > Import Dataset).

Es importante declarar que tipo de archivo es nuestra BDD para poder obtener los datos que queremos de forma correcta, para esto:

  • Para archivos .txt o .csv, utilizar opción “From Text (base)"
  • Para archivos Excel, elegir opción “From Excel"

Otra cosa importante, es que cuando estamos importando archivos .txt o .csv tenemos que definir algunos parametros para una correcta importación de los datos:

  • Encoding: Dejenlo en Automatic
  • Heading: Dejenlo en Yes
  • Separator: Fijense bien en con que caracter se separa cada una de las columnas, por ejemplo:
1, Minero, 13

En este caso, nuestro separador seria la ',' ya que esta ultima separa cada columna una de otra

  • Decimal: Define cual será el caracter que definira los decimales (El separador entre parte entera y decimal)
  • Quote: Define entre que caracteres estan encerradas las strings
  • Comment: Nada importante
  • na.strings: Define cual es el valor de un objeto nulo, osea, si tenemos un item que es nulo (No existe), cual seria su terminologia.

Importar BDD con comandos

Para importar un archivo a R, podemos usar los siguientes comandos

data <- read.table(direccion_del_archivo) # Importa .txt, .csv y .dat
data <- read.csv(direccion_del_archivo) # Importa .csv
data <- read_excel(file.choose())
  • direccion_del_archivo es la RUTA ABSOLUTA de un archivo (Osea, parte desde C:/). Un ejemplo seria:
"C:/Usuario/Documentos/Tenis.txt"
  • file.choose() permite reemplazar la lata de obtener la ruta absoluta de un archivo y simplemente seleccionar el archivo que queremos importar (Recomendado en caso de que no tengas mucha experiencia en programación)

Comandos basicos de probabilidad

Imaginemos que tenemos lo siguiente, primero, una BDD con las siguientes caracteristicas:

Dia Trabajo Horas_Trabajadas
1 Minero 13
2 Agronomo 5
7 Contador 10

Y la importamos como:

df <- read.csv(file.choose())

Despues de importar esta BDD, podemos realizar lo siguiente:

Queremos obtener diferentes operaciones de ciertas columnas de la BDD, en este caso de la columna 'Horas Trabajadas'. Entonces, para ejecutar una operación sobre una columna, se usa:

operacion(nombre_bdd$nombre_columna)
# En este caso
operacion(df$Horas_Trabajadas)

Estas serian todas las operaciones basicas que puedes hacer con BDD:

  • mean(x) = Media
  • var(x) = Varianza
  • sd(x) = Desviacion estandar
  • summary(x) = Resumen de un vector numerico
  • quantile(x) = Cuantiles de una muestra
  • min(x) = Minimo de una muestra
  • max(x) = Maximo de una muestra
  • range(x) = Rango de una muestra
  • median(x) = Mediana de una muestra
  • table(x) = Tabla de conteo de una muestra