Case técnico realizado pela Petlove para o estágio em Engenharia de Dados.
Instalar o Python de acordo com seu sistema operacional
- python
https://www.python.org/downloads/release/python-3113/
- com python instalado instalar todas as dependencias do projeto
pip install -m numpy pandas pyspark
Instalar o Java de acordo com seu sistema operacional
- java (o pyspark é uma API para o Apache Spark feita em Java)
https://adoptium.net/temurin/releases/
- Clone the repo
git clone https://github.com/hitomi1/case-petlove.git
Apenas execute todas as células do notebook, isso será o suficiente para realizar todas as operações pertinentes a limpeza dos dados.
Abrir o arquivo "data-viz.pbix" para interagir com os gráficos gerados e observar com clareza as correções apresentadas.
root
|-- data.csv (arquivos csv com dados já tratados)
|-- notebook.ipynb
|-- README.md
|-- data-viz.pbix
|-- data-viz.pdf
|-- initial_data
|--data-test-analytics.csv (dados crus)
Gustavo Hitomi - @Linkedin
Link do Projeto: https://github.com/hitomi1/case-petlove