Nesse repositório estou sendo introduzido ao spark, e utilizando o spark sql.
Está sendo utilizado o PySpark.
É necessário a instalação do Hadoop e do Spark para utilização deste notebook.
Os dados não podem ser disponibilizados por este repositório devido ao limite de dados, os dados estão disponíveis em um link no notenook e sua devida explicação.