Progetto in R realizzato per il corso di Calcolo delle Probabilità e Statistica Matematica presso l'Università degli Studi di Salerno. Il progetto analizza un dataset riguardante l'erogazione e immissione di acqua potabile nei comuni di Napoli (Italia) nel 2018. Viene eseguita un'analisi statistica sulle quantità di acqua erogata dai comuni, calcolando vari indici di posizione, variabilità e forma. Inoltre, vengono prodotti grafici per visualizzare le distribuzioni e le relazioni tra i dati.
Hanno contribuito a questo progetto:
Il progetto si articola nelle seguenti sezioni:
- Caricamento delle librerie
- Importazione del dataset e selezione dati opportuni
- Selezione di un campione unidimensionale con tabella delle frequenze assolute e relative su di esso
- Calcolo indici di posizione, variabilità e forma
- Raggruppamento in classi con calcolo frequenze assolute e relative
- Quartili, scarto interquartile e boxplot
- Intervalli di previsione
- Dati bivariati e coefficiente di correlazione campionario
Il dataset utilizzato (acqua.csv) è stato scaricato da istat.it e riguarda l'erogazione e immissione di acqua potabile nei comuni nel 2018.
- readxl
- tidyverse
.RData
: File di dati R contenente oggetti salvati..Rhistory
: File di cronologia delle operazioni eseguite in R.acqua.csv
: Dataset utilizzato per l'analisi.progetto_stats.html
: File HTML contenente i risultati dell'analisi.progetto_stats.Rmd
: File R Markdown contenente il codice sorgente e la descrizione dell'analisi.
Per eseguire il codice, è necessario avere installato R e le librerie readxl e tidyverse.
Per eseguire il progetto, aprire il file progetto_stats.Rmd
in RStudio e fare clic su "Run All" per eseguire tutte le sezioni. In alternativa, è possibile visualizzare direttamente i risultati aprendo il file progetto_stats.html
nel browser.
R project developed for the Probability Calculus and Mathematical Statistics course at the University of Salerno. The project analyzes a dataset concerning the supply and distribution of potable water in municipalities of Naples (Italy) in 2018. It performs a statistical analysis on the quantities of water supplied by the municipalities, calculating various indices of position, variability, and shape. In addition, it produces graphics to visualize distributions and relationships among the data.
Contributors to this project:
The project is divided into the following sections:
- Loading libraries
- Importing the dataset and selecting appropriate data
- Selecting a one-dimensional sample with a table of absolute and relative frequencies on it
- Calculating indices of position, variability, and shape
- Grouping into classes with calculation of absolute and relative frequencies
- Quartiles, interquartile range, and boxplot
- Forecast intervals
- Bivariate data and sample correlation coefficient
The dataset used (acqua.csv) was downloaded from istat.it and concerns the supply and distribution of drinking water in municipalities in 2018.
- readxl
- tidyverse
.RData
: R data file containing saved objects..Rhistory
: R history file of operations performed in R.acqua.csv
: Dataset used for the analysis.progetto_stats.html
: HTML file containing the results of the analysis.progetto_stats.Rmd
: R Markdown file containing the source code and description of the analysis.
To run the code, you need to have R and the readxl and tidyverse libraries installed.
To run the project, open the progetto_stats.Rmd
file in RStudio and click on "Run All" to execute all sections. Alternatively, you can directly view the results by opening the progetto_stats.html
file in your browser.