_main.Rmd

---
knit: "bookdown::render_book"
title: "The Epidemiologist R Handbook"  
description: "The Epi R Handbook est un manuel de référence sur l'utilisation de R en épidémiologie appliquée et santé publique."
author: "the handbook team"
date: "`r Sys.Date()`"
#url: 'https://github.com/appliedepi/epiRhandbook_fr'
#twitter-handle: 
#cover-image: images/R_Handbook_Logo.png
site: bookdown::bookdown_site
# output: bookdown::gitbook:
#      config:
#           sharing:
#                twitter: yes
#                facebook: yes
#                whatsapp: yes
#                github: yes
documentclass: book
---

# output: bookdown::gitbook:

Placeholder


## R pour l'épidémiologie appliquée et la santé publique {-}  
## Comment utiliser ce mannuel ? {-} 
## Remmerciements {-}  
### Auteurs et contributeurs {-}  
### Financements {-}  
### Inspirations {-}  
## Conditions d'utilisation et contribution {-}  
### License {.unnumbered} 
### Citation {.unnumbered}
### Contribuer {.unnumbered}  

<!--chapter:end:index.Rmd-->

# (PART) About this book {.unnumbered}
```{r include=FALSE, cache=FALSE}

# clear workspace
rm(list = ls(all = TRUE))

# clear all packages except base
#lapply(names(sessionInfo()$loadedOnly), require, character.only = TRUE)
#invisible(lapply(paste0('package:', names(sessionInfo()$otherPkgs)), detach, character.only=TRUE, unload=TRUE, force=TRUE))

# to ensure that tidyverse packages prevail
filter <- dplyr::filter
select <- dplyr::select
summarise <- dplyr::summarise
summary <- base::summary
incidence <- incidence2::incidence

#load core packages
pacman::p_load(
     rio,
     here,
     DT,
     stringr,
     lubridate,
     tidyverse
)

# import the cleaned ebola linelist
linelist <- rio::import(here::here("data", "case_linelists", "linelist_cleaned.rds"))

# import the count data - facility level
#count_data <- rio::import(here::here("data", "facility_count_data.rds"))

# Settings

options(scipen=1, digits=7)

# print only text (not code)
# library(knitr)
# opts_chunk$set(list(echo = FALSE, eval = FALSE))
```

<!--chapter:end:new_pages/cat_about_book.Rmd-->


# Notes techniques et choix éditoriaux {#editorial_notes}

Placeholder


## Approche et style
### Paquets R {.unnumbered}
### Choix d'yn style de code {.unnumbered}
### Nomenclature {.unnumbered}  
### Notes {.unnumbered} 
## Choix techniques
## Révisions majeures
## Information de session (R, RStudio, paquets)  

<!--chapter:end:new_pages/editorial_style.Rmd-->


# Télécharger le manuel et les données  {#download_book_data}

Placeholder


## Télécharger le manuel hors-ligne  {#download_offline}
### Utiliser le lien de téléchargement {.unnumbered}  
### Utiliser notre paquet R {.unnumbered}  
## Télécharger les données
### Utiliser notre paquet R {.unnumbered}  
### Téléchargement manuel {.unnumbered}  
#### Liste de cas (linelist) {.unnumbered}
#### Cas de paludisme {#data_malaria .unnumbered}  
#### Données sur l'échelle de Likert {.unnumbered}  
#### Flexdashboard {.unnumbered}  
#### recherche des contacts {.unnumbered} 
#### SIG {.unnumbered}  
#### Arbres phylogénétiques {.unnumbered}  
#### Standardization {.unnumbered} 
#### Séries temporelles et détection des épidémies {#data_outbreak .unnumbered}  
#### Analyse d'enquêtes {#data_survey .unnumbered}  
#### Shiny {#data_shiny .unnumbered}  

<!--chapter:end:new_pages/data_used.Rmd-->

# (PART) Basics {.unnumbered}
```{r include=FALSE, cache=FALSE}

# clear workspace
rm(list = ls(all = TRUE))

# clear all packages except base
#lapply(names(sessionInfo()$loadedOnly), require, character.only = TRUE)
#invisible(lapply(paste0('package:', names(sessionInfo()$otherPkgs)), detach, character.only=TRUE, unload=TRUE, force=TRUE))

# to ensure that tidyverse packages prevail
filter <- dplyr::filter
select <- dplyr::select
summarise <- dplyr::summarise
summary <- base::summary
incidence <- incidence2::incidence

#load core packages
pacman::p_load(
     rio,
     here,
     DT,
     stringr,
     lubridate,
     tidyverse
)

# import the cleaned ebola linelist
linelist <- rio::import(here::here("data", "case_linelists", "linelist_cleaned.rds"))

# import the count data - facility level
#count_data <- rio::import(here::here("data", "facility_count_data.rds"))

# Settings

options(scipen=1, digits=7)

# print only text (not code)
# library(knitr)
# opts_chunk$set(list(echo = FALSE, eval = FALSE))
```

<!--chapter:end:new_pages/cat_basics.Rmd-->

---
title: "EpiR handbook" 
subtitle: "R basics chapter"
output: html_document
---

# R - les bases {#rbasics}

```{r out.width = "100%", fig.align = "center", echo=F}
knitr::include_graphics(here::here("images", "basics_header_close.png"))
```

Bienvenue !

Cette page passe en revue les éléments essentiels de R. Elle n'a pas pour but d'être un tutoriel complet, mais elle fournit les bases et peut être utile pour rafraîchir votre mémoire. La section [Ressources pour l'apprentissage](#learning) renvoie à des didacticiels plus complets.

Certaines parties de cette page ont été adaptées avec l'autorisation du [projet R4Epis](https://r4epis.netlify.app/).

Voir la page $$Transition to R$$ pour des conseils sur le passage de STATA, SAS ou Excel à R.

```{r, echo=F}
# Importer la liste linéaire nettoyée d'ebola:
linelist <- rio::import(here::here("data", 
                                   "case_linelists", 
                                   "linelist_cleaned.rds"))

# Chargez le paquet apyramid (contient tableaux de données d'exemple):
pacman::p_load(apyramid)
```

<!-- ======================================================= -->

## Pourquoi utiliser R ?

Comme indiqué sur le [site Web du projet R](https://www.r-project.org/about.html), R est un langage de programmation et un environnement pour le calcul statistique et les graphiques. Il est très polyvalent, extensible et axé sur la communauté.

**Coût**

L'utilisation de R est gratuite ! Il existe une forte éthique dans la communauté du matériel gratuit et open-source.

**Reproductibilité**

La gestion et l'analyse de vos données par le biais d'un langage de programmation (par rapport à Excel ou à un autre outil essentiellement manuel) améliore la reproductibilité, facilite la détection des erreurs et allège votre charge de travail.

**Communauté**

La communauté des utilisateurs de R est énorme et collaborative. De nouveaux paquets et outils destinés à résoudre des problèmes concrets sont développés quotidiennement et approuvés par la communauté des utilisateurs. À titre d'exemple, [R-Ladies](https://rladies.org/) est une organisation mondiale dont la mission est de promouvoir la diversité des genres dans la communauté R, et c'est l'une des plus grandes organisations d'utilisateurs de R. Elle a probablement un chapitre près de chez vous !

## Termes clés

**RStudio** - RStudio est une interface utilisateur graphique (GUI) qui facilite l'utilisation de **R**. Pour en savoir plus, consultez la section [RStudio](#rstudio).

**Objets** - Tout ce que vous stockez dans R - les jeu de données, les variables, une liste de noms de villages, un population total d'habitants, et même les résultats tels que les graphiques - sont des *objets* auxquels on *attribue un nom* et qui *peuvent être référencés* dans des commandes ultérieures. Pour en savoir plus, consultez la section [Objets](#objects).

**Fonctions** - Une fonction est une opération de code qui accepte des entrées et renvoie une sortie transformée. Pour en savoir plus, consultez la section [Fonctions](#functions).

**Paquets** - Un paquet R est un ensemble de fonctions partageables. Pour en savoir plus, consultez la section [Packages](#packages).

**Scripts** - Un script est le fichier document qui contient vos commandes. Pour en savoir plus, consultez la section [Scripts](#scripts)

## Ressources pour l'apprentissage {#learning}

### Ressources au sein de RStudio {.unnumbered}

**Documentation d'aide**

Recherchez dans l'onglet "Aide" de RStudio la documentation sur les paquets R et les fonctions spécifiques. Cet onglet se trouve dans le volet qui contient également les fichiers, les graphiques et les paquets (généralement dans le volet inférieur à droit). Comme raccourci, vous pouvez également taper le nom d'un paquet ou d'une fonction dans la console R après un point d'interrogation pour ouvrir la page d'aide correspondante. N'incluez pas les parenthèses.

Par exemple : `?filter` ou `?diagrammeR`.

**Tutoriels interactifs**

Il existe plusieurs façons d'apprendre R de manière interactive *dans* RStudio.

RStudio lui-même offre un volet Tutoriel qui est alimenté par le paquet R [**learnr**](https://blog.rstudio.com/2020/02/25/rstudio-1-3-integrated-tutorials/). Il suffit d'installer ce paquet et d'ouvrir un tutoriel via le nouvel onglet "Tutorial" dans le volet supérieur droit de RStudio (qui contient également les onglets Environnement et Historique).

Le paquet R [**swirl**](https://swirlstats.com/) propose des cours interactifs dans la console R. Installez et chargez ce paquet, puis lancez la commande `swirl()` (parenthèses vides) dans la console R. Vous verrez apparaître des invites dans la console. Répondez en tapant dans la console. Elle vous guidera à travers un cours de votre choix.

### Fiches d'aide-mémoire {.unnumbered}

Il existe de nombreuses fiches d'aide-mémoire au format PDF disponibles sur le [site Web de RStudio](https://rstudio.com/resources/cheatsheets/), par exemple :

-   Facteurs avec le paquet **forcats**\
-   Dates et heures avec le paquet **lubridate**\
-   Chaînes de caractères avec le paquet **stringr**\
-   Opérations itératives avec le paquet **purrr**\
-   Importation de données\
-   Aide-mémoire pour la transformation des données avec le paquet **dplyr**\
-   R Markdown (pour créer des documents comme PDF, Word, Powerpoint...)\
-   Shiny (pour créer des applications Web interactives)\
-   Visualisation de données avec le paquet **ggplot2**\
-   Cartographie (SIG)\
-   Paquet **leaflet** (cartes interactives)\
-   Python avec R (paquet **reticulate**)

Il existe également une ressource R en ligne spécialement destinée aux [utilisateurs d'Excel](https://jules32.github.io/r-for-excel-users/).

### Twitter {.unnumbered}

R possède une communauté Twitter dynamique où vous pouvez apprendre des astuces, des raccourcis et des nouvelles - suivez ces comptes :

-   Suivez-nous ! [\@epiRhandbook](https://twitter.com/epirhandbook)\
-   R Function A Day [\@rfuntionaday](https://twitter.com/rfunctionaday) est une ressource *incroyable*\
-   R pour la science des données [\@rstats4ds](https://twitter.com/rstats4ds?lang=en)\
-   RStudio [\@RStudio](https://twitter.com/rstudio?lang=en)\
-   Conseils sur RStudio [\@rstudiotips](https://twitter.com/rstudiotips)\
-   R-Bloggers [\@Rbloggers](https://twitter.com/Rbloggers)\
-   R-ladies [\@RLadiesGlobal](https://twitter.com/RLadiesGlobal)\
-   Hadley Wickham [\@hadleywickham](https://twitter.com/hadleywickham?ref_src=twsrc%5Egoogle%7Ctwcamp%5Eserp%7Ctwgr%5Eauthor)

Aussi :

**#epitwitter** et **#rstats**

### Ressources gratuites en ligne {.unnumbered}

Un texte définitif est le livre [R for Data Science](https://r4ds.had.co.nz/) de Garrett Grolemund et Hadley Wickham.

Le site Web du projet [R4Epis](https://r4epis.netlify.app/) vise à "développer des outils standardisés de nettoyage, d'analyse et de rapport des données pour couvrir les types courants d'épidémies et d'enquêtes auprès de la population qui seraient menées dans le cadre d'une réponse d'urgence de MSF". Vous y trouverez des supports de formation aux bases de R, des modèles de rapports RMarkdown sur les épidémies et les enquêtes, ainsi que des tutoriels pour vous aider à les configurer.

### Langues autres que l'anglais {.unnumbered}

[Materiales de RStudio en Español](https://www.rstudio.com/collections/espanol/)

[Introduction à R et au tidyverse (Francais)](https://juba.github.io/tidyverse/index.html)

<!-- ======================================================= -->

## Installation

### R et RStudio {.unnumbered}

**Comment installer R**

Visitez ce site Web <https://www.r-project.org/> et téléchargez la dernière version de R adaptée à votre ordinateur.

**Comment installer RStudio**

Visitez ce site Web <https://rstudio.com/products/rstudio/download/> et téléchargez la dernière version de bureau gratuite de RStudio adaptée à votre ordinateur.

**Autorisations requises**\

Notez que vous devez installer R et RStudio sur un lecteur sur lequel vous avez des droits de lecture et d'écriture. Sinon, votre capacité à installer des paquets R (ce qui arrive fréquemment) sera affectée. Si vous rencontrez des problèmes, essayez d'ouvrir RStudio en faisant un clic droit sur l'icône et en sélectionnant "Exécuter en tant qu'administrateur". Vous trouverez d'autres conseils sur la page $$R sur les lecteurs réseau$$.

**Comment mettre à jour R et RStudio**

Votre version de R est imprimée dans la Console R au démarrage. Vous pouvez également exécuter `sessionInfo()`.

Pour mettre à jour R, allez sur le site web mentionné ci-dessus et réinstallez R. Alternativement, vous pouvez utiliser le paquet **installr** (sous Windows) en exécutant `installr::updateR()`. Cela ouvrira des boîtes de dialogue pour vous aider à télécharger la dernière version de R et à mettre à jour vos paquets vers la nouvelle version de R. Plus de détails peuvent être trouvés dans la [documentation de **installr**](https://www.r-project.org/nosvn/pandoc/installr.html).

Sachez que l'ancienne version de R existera toujours sur votre ordinateur. Vous pouvez temporairement exécuter une ancienne version (ancienne "installation") de R en cliquant sur "Outils" -\> "Options globales" dans RStudio et en choisissant une version de R. Cela peut être utile si vous voulez utiliser un paquet qui n'a pas été mis à jour pour fonctionner sur la version la plus récente de R.

Pour mettre à jour RStudio, vous pouvez aller sur le site Web ci-dessus et retélécharger RStudio. Une autre option consiste à cliquer sur "Aide" -\> "Vérifier les mises à jour" dans RStudio, mais cela peut ne pas montrer les toutes dernières mises à jour.

Pour savoir quelles versions de R, RStudio ou des paquets ont été utilisées lors de la réalisation de ce manuel, consultez la page sur $$Notes éditoriales et techniques$$.

### Autres logiciels que vous *pourriez* avoir besoin d'installer {.unnumbered}

-   TinyTeX (*pour la compilation d'un document RMarkdown au format PDF*)\
-   Pandoc (*pour compiler des documents RMarkdown*)\
-   RTools (*pour construire des paquets pour R*)\
-   phantomjs (*pour enregistrer des images fixes de réseaux animés, tels que des chaînes de transmission*)

#### TinyTex {.unnumbered}

TinyTex est une distribution LaTeX personnalisée, utile lorsqu'on essaie de produire des PDF à partir de R.\
Voir <https://yihui.org/tinytex/> pour plus d'informations.

Pour installer TinyTex à partir de R :

```{r, eval=F}

install.packages('tinytex')
tinytex::install_tinytex()

# pour désinstaller TinyTeX, lancez tinytex::uninstall_tinytex()
```

#### Pandoc {.unnumbered}

Pandoc est un convertisseur de document, un logiciel séparé de R. **Il est fourni avec RStudio et ne devrait pas avoir besoin d'être téléchargé.** Il aide le processus de conversion de documents Rmarkdown à des formats comme .pdf et ajoute des fonctionnalités complexes.

#### RTools {.unnumbered}

RTools est une collection de logiciels permettant de construire des paquets pour R.

Installer à partir de ce site web : <https://cran.r-project.org/bin/windows/Rtools/>

#### phantomjs {.unnumbered}

Cet outil est souvent utilisé pour faire des "captures d'écran" des pages web. Par exemple, lorsque vous faites une chaîne de transmission avec le paquet **epicontacts**, un fichier HTML interactif et dynamique est produit. Si vous voulez une image statique, il peut être utile d'utiliser le paquet [**webshot**](https://wch.github.io/webshot/articles/intro.html) pour automatiser ce processus. Cela nécessite le programme externe "phantomjs". Vous pouvez installer phantomjs via le paquet **webshot** avec la commande `webshot::install_phantomjs()`.

<!-- ======================================================= -->

### RStudio {#rstudio}

### Orientation de RStudio {.unnumbered}

**D'abord, ouvrez RStudio.** Comme leurs icônes peuvent être très similaires, assurez-vous que vous ouvrez bien *RStudio* et non pas R.

Pour que RStudio fonctionne, vous devez également avoir R installé sur l'ordinateur (voir ci-dessus pour les instructions d'installation).

**RStudio** est une interface (GUI) pour une utilisation plus facile de **R**. Vous pouvez considérer R comme le moteur d'un véhicule, qui effectue le travail crucial, et RStudio comme le corps du véhicule (avec les sièges, les accessoires, etc.) qui vous aide à utiliser le moteur pour avancer ! Vous pouvez consulter la fiche technique complète de l'interface utilisateur de RStudio (PDF) [ici](https://www.rstudio.com/wp-content/uploads/2016/01/rstudio-IDE-cheatsheet.pdf)

Par défaut, RStudio affiche quatre volets rectangulaires.

```{r out.width = "100%", fig.align = "center", echo=F}
knitr::include_graphics(here::here("images", "RStudio_overview.png"))
```

[***TIP:*** Si votre RStudio n'affiche qu'un seul volet gauche, c'est parce que vous n'avez pas encore de scripts ouverts.]{style="color: black;"}

**Le volet source**

Ce volet, par défaut en haut à gauche, est un espace pour éditer, exécuter et enregistrer vos [scripts](#scripts). Les scripts contiennent les commandes que vous souhaitez exécuter. Ce volet peut également afficher des ensembles de données (cadres de données) pour les visualiser.

Pour les utilisateurs de Stata, ce volet est similaire aux fenêtres Do-file et Data Editor.

**Le volet Console R**

La console R, qui est par défaut le volet gauche ou inférieur gauche de R Studio, est le siège du "moteur" R. C'est là que les commandes sont réellement exécutées et que les sorties non graphiques et les messages d'erreur/d'avertissement apparaissent. Vous pouvez saisir et exécuter directement des commandes dans la console R, mais sachez que ces commandes ne sont pas enregistrées comme c'est le cas lorsque vous exécutez des commandes à partir d'un script.

Si vous êtes familier avec Stata, la console R ressemble à la fenêtre de commande et à la fenêtre des résultats.

**Le volet Environnement**

Ce volet, situé par défaut en haut à droite, est le plus souvent utilisé pour afficher de brefs résumés des [objets](#objets) de l'environnement R dans la session en cours. Ces objets peuvent inclure des ensembles de données importés, modifiés ou créés, des paramètres que vous avez définis (par exemple, une semaine épi spécifique pour l'analyse), ou des vecteurs ou des listes que vous avez définis pendant l'analyse (par exemple, les noms des régions). Vous pouvez cliquer sur la flèche à côté du nom d'un cadre de données pour voir ses variables.

Dans Stata, cette fenêtre est très similaire à celle du gestionnaire de variables.

Ce volet contient également l'onglet "Historique" où vous pouvez voir les commandes que vous avez exécutées précédemment. Il comporte également un onglet "Tutoriel" où vous pouvez suivre des tutoriels R interactifs si vous avez installé le paquet **learnr**. En outre, il existe un volet "Connexions" pour les connexions aux bases de données externes. Si vous avez lié le répertoire actif à un dépôt sur Github, il y aura également un volet "Git".

**Volets Graphiques, visionneuse, paquets et aide**

Le volet inférieur droit comprend plusieurs onglets importants. Les graphiques de tracé typiques, y compris les cartes, s'affichent dans le volet Tracé. Les sorties interactives ou HTML s'affichent dans le volet Visionneuse. Le volet Aide permet d'afficher la documentation et les fichiers d'aide. Le volet Fichiers est un navigateur qui peut être utilisé pour ouvrir ou supprimer des fichiers. Le volet Paquets vous permet de voir, d'installer, de mettre à jour, de supprimer, de charger/décharger des paquets R et de voir quelle version du paquet vous avez. Pour en savoir plus sur les paquets, consultez la [section paquets](#packages) ci-dessous.

Ce volet contient les équivalents Stata des fenêtres Plots Manager et Project Manager.

### Paramètres RStudio {.unnumbered}

Modifiez les paramètres et l'apparence de RStudio dans le menu déroulant *Outiles*, en sélectionnant *Options globales*. Vous pouvez y modifier les paramètres par défaut, y compris l'apparence/couleur de fond.

```{r out.width = c('50%'), fig.show='hold', echo=F}
knitr::include_graphics(here::here("images", "RStudio_tools_options_1.png"))

knitr::include_graphics(here::here("images", "RStudio_tools_options.png"))
```

**Redémarrage**

Si votre R se fige, vous pouvez redémarrer R en allant dans le menu Session et en cliquant sur "Redémarrer R". Cela vous évite de devoir fermer et ouvrir RStudio. Tout ce qui se trouve dans votre environnement R sera supprimé lorsque vous ferez cela.

### Raccourcis clavier {.unnumbered}

Vous trouverez ci-dessous quelques raccourcis clavier très utiles. Vous trouverez tous les raccourcis clavier pour Windows, Max et Linux sur la deuxième page de ce [fichier technique](https://www.rstudio.com/wp-content/uploads/2016/01/rstudio-IDE-cheatsheet.pdf) par RStudio.

+-----------------------------------------+------------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| Windows/Linux                           | Mac                    | Action                                                                                                                                                              |
+=========================================+========================+=====================================================================================================================================================================+
| Esc                                     | Esc                    | Interrompre la commande en cours (utile si vous avez accidentellement lancé une commande incomplète et que vous ne pouvez pas éviter de voir "+" dans la console R) |
+-----------------------------------------+------------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| Ctrl+s                                  | Cmd+s                  | Sauvegarder (script)                                                                                                                                                |
+-----------------------------------------+------------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| Tab                                     | Tab                    | Autocomplétion                                                                                                                                                      |
+-----------------------------------------+------------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| Ctrl + Enter                            | Cmd + Enter            | Exécuter la ou les ligne(s) courante(s)/sélection(s) de code                                                                                                        |
+-----------------------------------------+------------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| Ctrl + Shift + C                        | Cmd + Shift + c        | commenter/dé-commenter les lignes souslignées                                                                                                                       |
+-----------------------------------------+------------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| Alt + -                                 | Option + -             | Insérer `<-`                                                                                                                                                        |
+-----------------------------------------+------------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| Ctrl + Shift + m                        | Cmd + Shift + m        | Insérer `%>%`                                                                                                                                                       |
+-----------------------------------------+------------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| Ctrl + l                                | Cmd + l                | Effacer le contenu de la console R                                                                                                                                  |
+-----------------------------------------+------------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| Ctrl + Alt + b                          | Cmd + Option + b       | Exécuter du début à la ligne courante                                                                                                                               |
+-----------------------------------------+------------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| Ctrl + Alt + t                          | Cmd + Option + t       | Exécuter la section de code actuelle (R Markdown)                                                                                                                   |
+-----------------------------------------+------------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| Ctrl + Alt + i                          | Cmd + Shift + r        | Insérer un morceau de code (en R Markdown)                                                                                                                          |
+-----------------------------------------+------------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| Ctrl + Alt + c                          | Cmd + Option + c       | Exécuter le morceau de code actuel (en R Markdown)                                                                                                                  |
+-----------------------------------------+------------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| Flèches haut/bas dans la console R      |     Idem               |     Basculer entre les commandes récemment exécutées                                                                                                                |
+-----------------------------------------+------------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| Shift + flèches haut/bas dans le script | Idem                   |     Sélectionner plusieurs lignes de code                                                                                                                           |
+-----------------------------------------+------------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| Ctrl + f                                | Cmd + f                | Rechercher et remplacer dans le script actuel                                                                                                                       |
+-----------------------------------------+------------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| Ctrl + Shift + f                        | Cmd + Shift + f        | Rechercher dans les dossiers (rechercher/remplacer dans plusieurs scripts)                                                                                          |
+-----------------------------------------+------------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| Alt + l                                 | Cmd + Option + l       | Plier le code sélectionné                                                                                                                                           |
+-----------------------------------------+------------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| Shift + Alt + l                         | Cmd + Shift + Option+l | Déplier le code sélectionné                                                                                                                                         |
+-----------------------------------------+------------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------+

[***TIP:*** Utilisez votre touche de tabulation lorsque vous tapez pour activer la fonctionnalité de complétion automatique de RStudio. Cela peut éviter les fautes d'orthographe. Appuyez sur la touche Tab pendant la saisie pour produire un menu déroulant de fonctions et d'objets probables, en fonction de ce que vous avez tapé jusqu'à présent.]{style="color: darkgreen;"}

<!-- ======================================================= -->

## Fonctions {#functions}

Les fonctions sont au cœur de l'utilisation de R. Les fonctions vous permettent d'effectuer des tâches et des opérations. De nombreuses fonctions sont installées avec R, beaucoup d'autres sont disponibles à télécharger dans des *paquets* (expliqués dans la section [paquets](#packages)), et vous pouvez même écrire vos propres fonctions personnalisées !

Cette section de base sur les fonctions explique :

-   Ce qu'est une fonction et comment elle fonctionne\
-   Ce que sont les *paramètres* des fonctions\
-   Comment obtenir de l'aide pour comprendre une fonction

*Une note rapide sur la syntaxe :* Dans ce manuel, les fonctions sont écrites en code-texte avec des parenthèses vides, comme ceci : `filter()`. Comme expliqué dans la section [paquets](#packages), les fonctions sont téléchargées dans des *paquets*. Dans ce manuel, les noms de paquets sont écrits en **gras**, comme **dplyr**. Parfois, dans le code d'exemple, vous pouvez voir le nom de la fonction lié explicitement au nom de son paquet avec deux points de suspension (`::`) comme ceci : `dplyr::filter()`. Le but de ce lien est expliqué dans la section sur les paquets.

<!-- ======================================================= -->

### Fonctions simples {.unnumbered}

**Une fonction est comme une machine qui reçoit des entrées, effectue une action avec ces entrées, et produit une sortie.** La nature de la sortie dépend de la fonction.

**Les fonctions opèrent généralement sur un objet placé entre les parenthèses de la fonction**. Par exemple, la fonction `sqrt()` calcule la racine carrée d'un nombre :

```{r basics_function_sqrt}
sqrt(49)
```

L'objet fourni à une fonction peut également être une colonne dans un jeu de données (voir la section [Objets](#objects) pour plus de détails sur tous les types d'objets). Comme R peut stocker plusieurs jeux de données, vous devrez spécifier à la fois le jeu de données et la colonne. Une façon de le faire est d'utiliser la notation `$` pour lier le nom du jeu de données et le nom de la colonne (`dataset$column`). Dans l'exemple ci-dessous, la fonction `summary()` est appliquée à la colonne numérique `age` du jeu de données `linelist`, et la sortie est un résumé des valeurs numériques et manquantes de la colonne.

```{r basics_functions_summary}
# Imprimez les statistiques sommaires de la colonne 'age' dans le jeu de données 'linelist'.
summary(linelist$age)
```

[***NOTE:*** En coulisses, une fonction représente un code supplémentaire complexe qui a été regroupé pour l'utilisateur dans une seule commande simple.]{style="color: black;"}

<!-- ======================================================= -->

### Fonctions à paramètres multiples {.unnumbered}

Les fonctions demandent souvent plusieurs entrées, appelées ***paramètres***, situées entre les parenthèses de la fonction, généralement séparées par des virgules.

-   Certains paramètres sont obligatoires pour que la fonction fonctionne correctement, d'autres sont facultatifs\
-   Les paramètres facultatifs ont des valeurs par défaut\
-   Les paramètres peuvent prendre des entrées de type caractère, numérique, logique (VRAI/FAUX) et autres.

Voici une fonction fictive amusante, appelée `oven_bake()` (cuisson au four), comme exemple d'une fonction typique. Elle prend un objet comme entrée (par exemple un jeu de données, ou dans cet exemple "pâte") et effectue des opérations sur celui-ci comme spécifié par des paramètres supplémentaires (`minutes =` et `température =`). La sortie peut être imprimée sur la console, ou sauvegardée comme un objet en utilisant l'opérateur d'affectation `<-`.

```{r basics_functions_image, echo=F, out.width = "75%", fig.align = "center"}
knitr::include_graphics(here::here("images", "Function_Bread_Example.png"))
```

**Dans un exemple plus réaliste**, la commande `age_pyramid()` ci-dessous produit un graphique de pyramide des âges basé sur des groupes d'âge définis et une colonne de division binaire, comme le genre `gender`. La fonction reçoit trois paramètres entre parenthèses, séparés par des virgules. Les valeurs fournies aux paramètres établissent `linelist` comme le cadre de données à utiliser, `age_cat5` comme la colonne à compter, et `gender` comme la colonne binaire à utiliser pour diviser la pyramide par couleur.

```{r basics_functions_arguments, include=FALSE, results='hide', message=FALSE, warning=FALSE,}
## Créer une variable de groupe d'âge en spécifiant des ruptures catégorielles
linelist$age_group <- cut(linelist$age, breaks = c(0, 5, 10, 15, 20, 30, 45, 60))
```

```{r message=FALSE, warning=FALSE,  out.width = "75%", out.height="75%"}
# Créer une pyramide des âges
age_pyramid(data = linelist, age_group = "age_cat5", split_by = "gender")
```

La commande ci-dessus peut être écrite de manière équivalente comme ci-dessous, dans un style plus long avec une nouvelle ligne pour chaque argument. Ce style peut être plus facile à lire, et plus facile d'écrire des "commentaires" avec `#` pour expliquer chaque partie (commenter abondamment est une bonne pratique !). Pour exécuter cette commande plus longue, vous pouvez souligner la commande entière et cliquer sur "Run", ou simplement placer votre curseur sur la première ligne et appuyer simultanément sur les touches `Ctrl` et `Enter`.

```{r message=FALSE, warning=FALSE,  out.width = "75%", out.height="75%"}
# Créer une pyramide des âges
age_pyramid(
  data = linelist,        # utiliser la liste linéaire des cas
  age_group = "age_cat5", # fournir une colonne de groupe d'âge
  split_by = "gender"     # utiliser la colonne genre pour les deux côtés de la pyramide
  )
```

La première moitié d'une affectation de paramètre (par exemple `data =`) n'a pas besoin d'être spécifiée si les paramètres sont écrits dans un ordre spécifique (spécifié dans la documentation de la fonction). Le code ci-dessous produit exactement la même pyramide que ci-dessus, parce que la fonction attend l'ordre des paramètres : cadre de données, le variable `age_group`, puis le variable `split_by`.

```{r, basics_functions_pyramid2, eval = FALSE, warning=FALSE, message=FALSE, , out.width = "75%", out.height="75%", eval=F}
# Cette commande produira exactement le même graphique que ci-dessus
age_pyramid(linelist, "age_cat5", "gender")
```

**Une commande `age_pyramid()` plus complexe pourrait inclure les paramètres *optionnels* pour :**

-   Afficher les proportions au lieu des nombres (définissez `proportional = TRUE` (vrai) quand la valeur par défaut est `FALSE` (faux))\`\
-   Spécifier les deux couleurs à utiliser (`pal =` est l'abréviation de "palette" et est fourni avec un vecteur de deux noms de couleurs. Voir la page [objets](#objectstructure) pour savoir comment la fonction `c()` fabrique un vecteur).

[***NOTE:*** Pour les paramètres que vous spécifiez avec les deux parties du paramètre (par exemple `proportional = TRUE`), leur ordre parmi tous les paramètres n'a pas d'importance.]{style="color: black;"}

```{r message=FALSE, warning=FALSE, out.width = "75%", out.height="75%"}
age_pyramid(
  linelist,                    # utiliser la liste linéaire des cas
  "age_cat5",                  # colonne de groupe d'âge
  "gender",                    # répartition par genre
  proportional = TRUE,         # pourcentage au lieu du nombre
  pal = c("orange", "purple")  # couleurs
  )
```

<!-- ======================================================= -->

### Ecrire des fonctions {.unnumbered}

R est un langage orienté autour des fonctions, vous devez donc vous sentir capable d'écrire vos propres fonctions. La création de fonctions présente plusieurs avantages :

-   Faciliter la programmation modulaire - la séparation du code en morceaux indépendants et gérables\
-   Remplacer le copier-coller répétitif, qui peut être source d'erreurs\
-   Donner des noms mémorisables aux morceaux de code

L'écriture d'une fonction est traitée en détail à la page [Écriture de fonctions].

<!-- ======================================================= -->

## Paquets {#packages}

**Les paquets contiennent des fonctions.**

Un paquet en R est un ensemble partageable de code et de documentation qui contient des fonctions prédéfinies. Les utilisateurs de la communauté R développent en permanence des packages répondant à des problèmes spécifiques; donc il est probable que l'un d'entre eux puisse vous aider dans votre travail ! Vous allez installer et utiliser des centaines de paquets dans votre utilisation de R.

À l'installation, R contient des paquets et des fonctions **"de base "** qui effectuent des tâches élémentaires communes. Mais de nombreux utilisateurs de R créent des fonctions spécialisées, qui sont vérifiées par la communauté R et que vous pouvez télécharger en tant que **paquet** pour votre propre usage. Dans ce manuel, les noms des paquets sont écrits en **gras**. L'un des aspects les plus difficiles de R est qu'il existe souvent de nombreuses fonctions ou paquets parmi lesquels on peut choisir pour effectuer une tâche donnée.

### Installer et charger {.unnumbered}

Les *fonctions* sont contenues dans des **paquets** qui peuvent être téléchargés ("installés") sur votre ordinateur à partir d'Internet. Une fois qu'un paquet est téléchargé, il est stocké dans votre "bibliothèque". Vous pouvez alors accéder aux fonctions qu'il contient pendant votre séance R actuelle en "chargeant" le paquet.

*Pensez à R comme votre bibliothèque personnelle* : Lorsque vous téléchargez un paquet, votre bibliothèque gagne un nouveau livre de fonctions, mais chaque fois que vous voulez utiliser une fonction de ce livre, vous devez emprunter ("charger") ce livre dans votre bibliothèque.

En résumé : pour utiliser les fonctions disponibles dans un paquet R, deux étapes doivent être mises en œuvre :

1)  Le paquet doit être **installé** (une fois), *et*\
2)  Le paquet doit être **chargé** (à chaque séance R)

#### Votre bibliothèque {.unnumbered}

Votre "bibliothèque" est en fait un dossier sur votre ordinateur, contenant un dossier pour chaque paquet qui a été installé. Déterminez où R est installé sur votre ordinateur, et cherchez un dossier appelé "win-library". Par exemple : `R\win-library\4.0` (4.0 est la version de R). Notez que vous aurez une bibliothèque différente pour chaque version de R que vous avez téléchargée.

Vous pouvez imprimer le chemin d'accès à votre bibliothèque en entrant `.libPaths()` (parenthèses vides). Ceci devient particulièrement important si vous travaillez avec $$R sur des lecteurs réseau$$.

#### Installer à partir du CRAN {.unnumbered}

Le plus souvent, les utilisateurs de R téléchargent des paquets depuis CRAN. CRAN (Comprehensive R Archive Network) est un entrepôt public en ligne de paquets R qui ont été publiés par des membres de la communauté R.

Vous vous inquiétez des virus et de la sécurité lorsque vous téléchargez un paquet depuis CRAN ? Lisez [cet article](https://support.rstudio.com/hc/en-us/articles/360042593974-R-and-R-Package-Security) à ce sujet.

#### Comment installer et charger {.unnumbered}

Dans ce manuel, nous suggérons d'utiliser le paquet **pacman** (abréviation de "package manager" en anglais). Il offre une fonction pratique `p_load()` qui installera un paquet si nécessaire *et* le chargera pour l'utiliser dans la séance R actuelle.

La syntaxe est assez simple. Il suffit de lister les noms des paquets entre les parenthèses de `p_load()`, séparés par des virgules.

La commande ci-dessous installera les paquets **rio**, **tidyverse**, et **here** s'ils ne sont pas encore installés, et les chargera pour les utiliser. Cela rend l'approche `p_load()` pratique et concise si vous partagez des scripts avec d'autres personnes. Notez que les noms des paquets sont sensibles à la casse.

```{r}
# Installer (si nécessaire) et charger les paquets pour l'utilisation
pacman::p_load(rio, tidyverse, here)
```

Notez que nous avons utilisé la syntaxe `pacman::p_load()` qui écrit explicitement le nom du paquet (**pacman**) avant le nom de la fonction (`p_load()`), reliés par deux deux points `::`. Cette syntaxe est utile car elle charge également le paquet **pacman** (en supposant qu'il soit déjà installé).

Il existe d'autres fonctions R **de base** que vous verrez souvent. La fonction R **de base** pour installer un paquet est `install.packages()`. Le nom du paquet à installer doit être fourni entre les parenthèses et *entre guillemets*. Si vous voulez installer plusieurs paquets en une seule commande, ils doivent être listés dans un vecteur de caractères `c()`.

Remarque : cette commande *installe* un paquet, mais ne le charge *pas* pour l'utiliser dans la séance en cours.

```{r, eval=F}
# Installer un seul paquet avec la base R
install.packages("tidyverse")

# Installer plusieurs paquets avec la base R
install.packages(c("tidyverse", "rio", "here"))
```

L'installation peut également être effectuée par pointer-cliquer en allant dans le panneau "Packages" de RStudio, en cliquant sur "Installer" et en recherchant le nom du paquet souhaité.

La fonction **base** de R pour **charger** un paquet à utiliser (après qu'il ait été installé) est `library()`. Elle ne peut charger qu'un seul paquet à la fois (une autre raison d'utiliser `p_load()`). Vous pouvez fournir le nom du paquet avec ou sans guillemets.

```{r, eval=F}
# Charger des paquets à utiliser, avec la base R
library(tidyverse)
library(rio)
library(here)
```

Pour vérifier si un paquet est installé et/ou chargé, vous pouvez afficher le panneau des paquets dans RStudio. Si le paquet est installé, il est affiché avec son numéro de version. Si sa case est cochée, il est chargé pour la séance en cours.

**Installation depuis Github**

Parfois, vous avez besoin d'installer un paquet qui n'est pas encore disponible sur CRAN. Ou peut-être que le paquet est disponible sur CRAN mais que vous voulez la *version de développement* avec de nouvelles fonctionnalités qui ne sont pas encore proposées dans la version CRAN publiée, plus stable. Ces versions sont souvent hébergées sur le site Web [github.com](https://github.com/) dans un "dépôt" de code libre et public. Pour en savoir plus sur Github, consultez la page du manuel intitulée $$Version control and collaboration with GitHub$$.

Pour télécharger des paquets R depuis Github, vous pouvez utiliser la fonction `p_load_gh()` de **pacman**, qui installera le paquet si nécessaire, et le chargera pour l'utiliser dans votre séance R actuelle. Les alternatives à l'installation incluent l'utilisation des paquets **remotes** ou **devtools**. Pour en savoir plus sur toutes les fonctions de **pacman**, consultez la [documentation du paquet](https://cran.r-project.org/web/packages/pacman/pacman.pdf).

Pour installer à partir de Github, vous devez fournir plus d'informations. Vous devez fournir :

1)  L'ID Github (nom d'utilisateur) du propriétaire du dépôt.
2)  Le nom du dépôt qui contient le paquet.
3)  *(facultatif) Le nom de la "branche" (version de développement spécifique) que vous souhaitez télécharger*.

Dans les exemples ci-dessous, le premier mot entre guillemets est l'ID Github du propriétaire du dépôt. Après la barre oblique est le nom du dépôt (typiquement le nom du paquet).

```{r, eval=F}
# Installer/charger le paquet epicontacts depuis son dépôt Github
p_load_gh("reconhub/epicontacts")
```

Si vous voulez installer à partir d'une "branche" (version) autre que la branche principale, ajoutez le nom de la branche après un "\@", après le nom du dépôt.

```{r, eval=F}
# Installer la branche "timeline" du paquet epicontacts depuis Github
p_load_gh("reconhub/epicontacts@timeline")
```

S'il n'y a pas de différence entre la version Github et la version sur votre ordinateur, aucune action ne sera entreprise. Vous pouvez "forcer" une réinstallation en utilisant `p_load_current_gh()` avec le paramètre `update = TRUE`. Lisez plus sur **pacman** dans cette [vignette en ligne](http://trinker.github.io/pacman/vignettes/Introduction_to_pacman.html)

**Installation à partir d'un ZIP ou d'un TAR**

Vous pouvez installer le paquet à partir d'une URL :

```{r, eval=F}
packageurl <- "https://cran.r-project.org/src/contrib/Archive/dsr/dsr_0.2.2.tar.gz"
install.packages(packageurl, repos = NULL, type = "source")
```

Ou bien, le télécharger sur votre ordinateur dans un fichier zippé :

Option 1 : utiliser `install_local()` du paquet **remotes**.

```{r, eval=F}
remotes::install_local("~/Downloads/dplyr-master.zip")
```

Option 2 : en utilisant `install.packages()` du R de **base**, en fournissant le chemin d'accès au fichier ZIP et en définissant `type = "source"` et `repos = NULL`.

```{r, eval=F}
install.packages("~/Downloads/dplyr-master.zip", 
                 type = "source", 
                 repos = NULL)
```

### Syntaxe du code {.unnumbered}

Pour plus de clarté dans ce manuel, les fonctions sont parfois précédées du nom de leur paquet en utilisant le symbole `::` de la manière suivante : `nom_du_paquet::nom_de_la_fonction()`.

Une fois qu'un paquet est chargé pour une séance, ce style explicite n'est plus nécessaire. On peut simplement utiliser `nom_de_la_fonction()`. Cependant, écrire le nom du paquet est utile lorsqu'un nom de fonction est commun et peut exister dans plusieurs paquets (par exemple, `plot()`). L'écriture du nom du paquet chargera également le paquet s'il n'est pas déjà chargé.

```{r eval=FALSE}
# Cette commande utilise le paquet "rio" et sa fonction "import()" pour importer un jeu de données
linelist <- rio::import("linelist.xlsx", which = "Sheet1")
```

### Aide sur les fonctions {.unnumbered}

Pour en savoir plus sur une fonction, vous pouvez la rechercher dans l'onglet Aide du RStudio en bas à droite. Vous pouvez également lancer une commande comme `?thefunctionname` (mettez le nom de la fonction après un point d'interrogation) et la page d'aide apparaîtra dans le volet d'aide. Enfin, essayez de rechercher des ressources en ligne.

### Mettre à jour les paquets {.unnumbered}

Vous pouvez mettre à jour les paquets en les réinstallant. Vous pouvez également cliquer sur le bouton vert "Update" dans votre panneau "RStudio Packages" pour voir quels paquets ont de nouvelles versions à installer. Sachez que votre ancien code peut avoir besoin d'être mis à jour s'il y a une révision majeure du fonctionnement d'une fonction !

### Supprimer des paquets {.unnumbered}

Utilisez `p_delete()` de **pacman**, ou `remove.packages()` de **base** R. Alternativement, allez chercher le dossier qui contient votre bibliothèque et supprimez manuellement le dossier.

### Dépendances {.unnumbered}

Les paquets dépendent souvent d'autres paquets pour fonctionner. Ceux-ci sont appelés dépendances. Si une dépendance ne s'installe pas, le paquet qui en dépend peut également ne pas s'installer.

Voir les dépendances d'un paquet avec `p_depends()`, et voir quels paquets en dépendent avec `p_depends_reverse()`.

### Fonctions masquées {.unnumbered}

Il n'est pas rare que deux paquets ou plus contiennent le même nom de fonction. Par exemple, le paquet **dplyr** possède une fonction `filter()`, mais le paquet **stats** aussi. La fonction `filter()` par défaut dépend de l'ordre dans lequel ces paquets sont chargés pour la première fois dans la séance R - le dernier sera la fonction par défaut de la commande `filter()`.

Vous pouvez vérifier l'ordre dans votre panneau Environnement de R Studio - cliquez sur la liste déroulante pour "Global Environment" et voyez l'ordre des paquets. Les fonctions des paquets *inférieurs* dans cette liste déroulante masqueront les fonctions du même nom dans les paquets qui apparaissent plus haut dans la liste déroulante. Lors du premier chargement d'un paquet, R vous avertira dans la console si le masquage se produit, mais il est facile de ne pas le voir.

```{r out.width = "50%", fig.align = "center", echo=F}
knitr::include_graphics(here::here("images", "masking_functions.png"))
```

Voici comment vous pouvez corriger le masquage :

1)  Spécifiez le nom du paquet dans la commande. Par exemple, utilisez `dplyr::filter()`\
2)  Réorganisez l'ordre dans lequel les paquets sont chargés (par exemple, dans `p_load()`), et **démarrez une nouvelle séance R**.

### Détacher / décharger {.unnumbered}

Pour détacher (décharger) un paquet, utilisez cette commande, avec le nom correct du paquet et un seul deux-points. Notez que cela peut ne pas résoudre le masquage.

```{r, eval=F}
detach(package:NOM_DU_PAQUET_ICI, unload = TRUE)
```

### Installer une ancienne version {.unnumbered}

Consultez ce [guide](https://support.rstudio.com/hc/en-us/articles/219949047-Installing-older-versions-of-packages) pour installer une ancienne version d'un paquet particulier.

### Paquets suggérés {.unnumbered}

Voir la page [Paquets suggérés] pour une liste de paquets que nous recommandons pour l'épidémiologie quotidienne.

<!-- ======================================================= -->

## Scripts {#scripts}

Les scripts sont une partie fondamentale de la programmation. Ce sont des documents qui contiennent vos commandes (par exemple, des fonctions pour créer et modifier des jeux de données, imprimer des visualisations, etc). Vous pouvez sauvegarder un script et l'exécuter à nouveau ultérieurement. Le stockage et l'exécution de vos commandes à partir d'un script présentent de nombreux avantages (par rapport à la saisie des commandes une par une dans la "ligne de commande" de la console R) :

-   Portabilité : vous pouvez partager votre travail avec d'autres personnes en leur envoyant vos scripts\
-   Reproductibilité : pour que vous et les autres sachiez exactement ce que vous avez fait\
-   Contrôle de version : pour que vous puissiez suivre les modifications apportées par vous-même ou par vos collègues\
-   Commentaire/annotation : pour expliquer à vos collègues ce que vous avez fait

### Commentaire {.unnumbered}

Dans un script, vous pouvez également annoter ("commenter") votre code R. Les commentaires sont utiles pour expliquer à vous-même et aux autres lecteurs ce que vous faites. Vous pouvez ajouter un commentaire en tapant le symbole dièse (\#) et en écrivant votre commentaire après. Le texte commenté apparaîtra dans une couleur différente de celle du code R.

Tout code écrit après le \# ne sera pas exécuté. Par conséquent, placer un \# avant le code est également un moyen utile de bloquer temporairement une ligne de code ("commenter") si vous ne souhaitez pas la supprimer). Vous pouvez mettre en commentaire plusieurs lignes à la fois en les soulignant et en appuyant sur Ctrl+Shift+c (Cmd+Shift+c sur Mac).

```{r, eval = F}

# Un commentaire peut être sur une ligne par lui-même, ex.:
# Importer des données:
linelist <- import("linelist_raw.xlsx") %>% # un commentaire peut aussi venir après le code
     # filter(age > 50)
     # Il peut aussi être utilisé pour désactiver une ligne de code
count()

```

Vous trouverez ci-dessous quelques conseils essentiels pour commenter et annoter votre code :

-   Commentez *ce que vous faites* et *pourquoi* vous le faites\
-   Découpez votre code en sections logiques\
-   Accompagnez votre code d'une description textuelle étape par étape de ce que vous faites (par exemple, des étapes numérotées).

### Style {.unnumbered}

Il est important d'être conscient de votre style de codage, surtout si vous travaillez en équipe. Nous préconisons le **tidyverse** [guide de style](https://style.tidyverse.org/). Il existe également des paquets tels que **styler** et **lintr** qui vous aident à vous conformer à ce style.

Quelques points très basiques pour rendre votre code lisible pour les autres:\
\* Lorsque vous nommez des objets, n'utilisez que des lettres minuscules, des chiffres et des traits de soulignement `_`, par exemple `mes_donnees`\
\* Utilisez fréquemment des espaces, y compris autour des opérateurs, par exemple `n = 1` et `age_nouveau <- age_vieillesse + 3`.

### Exemple de script {.unnumbered}

Vous trouverez ci-dessous un exemple d'un court script R. N'oubliez pas que plus vous expliquerez succinctement votre code dans les commentaires, plus vos collègues vous apprécieront !

```{r out.width = "100%", fig.align = "center", echo=F}
knitr::include_graphics(here::here("images", "example_script.png"))
```

<!-- ======================================================= -->

### R markdown {.unnumbered}

Un script R markdown est un type de script R dans lequel le script lui-même *devient* un document de sortie (PDF, Word, HTML, Powerpoint, etc.). Ce sont des outils incroyablement utiles et polyvalents, souvent utilisés pour créer des rapports dynamiques et automatisés. Même ce site Web et ce manuel sont produits à l'aide de scripts R markdown !

Il convient de noter que les utilisateurs débutants de R peuvent également utiliser R Markdown - ne vous laissez pas intimider !Pour en savoir plus, consultez la page du manuel consacrée aux $$Reports with R Markdown documents$$.

<!-- ======================================================= -->

### Carnets de notes R {.unnumbered}

Il n'y a pas de différence entre écrire dans un Rmarkdown et un R notebook. Cependant, l'exécution du document diffère légèrement. Voir ce [site](http://uc-r.github.io/r_notebook) pour plus de détails.

<!-- ======================================================= -->

### Shiny {.unnumbered}

Les applications/sites web Shiny sont contenus dans un script, qui doit être nommé `app.R`. Ce fichier comporte trois éléments :

1)  Une interface utilisateur (ui)\
2)  Une fonction serveur\
3)  Un appel à la fonction `shinyApp`

Consultez la page du manuel sur $$Shiny dashboards$$, ou ce tutoriel en ligne : [Tutoriel Shiny](https://shiny.rstudio.com/tutorial/written-tutorial/lesson1/)

*Auparavant, le fichier ci-dessus était divisé en deux fichiers (`ui.R` et `server.R`)*.

### Repli du code {.unnumbered}

Vous pouvez replier des portions de code pour rendre votre script plus facile à lire.

Pour ce faire, créez un en-tête de texte avec #, écrivez votre en-tête, et faites-le suivre d'au moins 4 tirets (-), hachages (\#) ou égaux (=). Lorsque vous aurez fait cela, une petite flèche apparaîtra dans la "gouttière" à gauche (près du numéro de ligne). Vous pouvez cliquer sur cette flèche et sur le code situé en dessous jusqu'à ce que l'en-tête suivant se réduise et qu'une icône à double flèche apparaisse à sa place.

Pour développer le code, cliquez à nouveau sur la flèche dans la gouttière ou sur l'icône à double flèche. Il existe également des raccourcis clavier, comme expliqué dans la section [RStudio](#rstudio) de cette page.

En créant des en-têtes avec #, vous activerez également la table des matières au bas de votre script (voir ci-dessous) que vous pouvez utiliser pour naviguer dans votre script. Vous pouvez créer des sous-titres en ajoutant d'autres symboles, par exemple \# pour les titres primaires, \## pour les titres secondaires et \### pour les titres tertiaires.

Vous trouverez ci-dessous deux versions d'un exemple de script. À gauche, l'original avec des en-têtes commentés. À droite, quatre tirets ont été écrits après chaque en-tête, les rendant ainsi repliables. Deux d'entre eux ont été réduits, et vous pouvez voir que la table des matières en bas de page affiche maintenant chaque section.

```{r, out.width = c('50%'), fig.show='hold', echo=F}
knitr::include_graphics(here::here("images", "code_folding1.png"))
knitr::include_graphics(here::here("images", "code_folding2.png"))
```

D'autres zones de code qui sont automatiquement éligibles pour le pliage incluent les régions "accolées" avec des parenthèses `{ }` telles que les définitions de fonctions ou les blocs conditionnels (instructions "if else"). Vous pouvez en savoir plus sur le pliage du code sur le [site RStudio](https://support.rstudio.com/hc/en-us/articles/200484568-Code-Folding-and-Sections).

<!-- ======================================================= -->

<!-- ======================================================= -->

<!-- ======================================================= -->

## Répertoire de travail

Le répertoire de travail est l'emplacement du dossier racine utilisé par R pour votre travail - où R recherche et enregistre les fichiers par défaut. Par défaut, il enregistrera de nouveaux fichiers et sorties à cet emplacement et recherchera ici des fichiers (par exemple, des ensembles de données).

Le répertoire de travail apparaît dans le texte gris en haut du volet de la console RStudio. Vous pouvez également imprimer le répertoire de travail actuel en exécutant `getwd()` (laissez les parenthèses vides).

```{r out.width = "100%", fig.align = "center", echo=F}
knitr::include_graphics(here::here("images", "working_directory_1.png"))
```

### Approche recommandée {.unnumbered}

**Voir la page sur** $$R Projects$$ pour plus de détails sur notre approche recommandée pour gérer votre répertoire de travail.\

Un moyen commun, efficace et sans problème de gérer votre répertoire de travail et vos chemins de fichier consiste à combiner ces trois éléments dans un flux de travail du $$R projects$$ orienté comme expliqué ci-dessous:

1.  Un projet R pour stocker tous vos fichiers (voir page sur $$R projects$$)\
2.  Le paquet **here** pour localiser les fichiers (voir page sur $$Import and export$$)\
3.  Le paquet **rio** pour importer ou exporter des fichiers (voir page sur $$Import and export$$)

<!-- ======================================================= -->

### Définir le répertoire de travail par commande {.unnumbered}

Jusqu'à récemment, de nombreuses personnes apprenant R ont appris à commencer leurs scripts avec une commande `setwd()`. Veuillez plutôt envisager d'utiliser un flux de travail orienté par $$R Projects$$ et lire les [raisons de ne pas utiliser `setwd()`](https://www.tidyverse.org/blog/2017/12/workflow-vs-script/).

En bref, votre travail devient spécifique à votre ordinateur, les chemins de fichier utilisés pour importer et exporter des fichiers deviennent "cassants", ce qui entrave gravement la collaboration et l'utilisation de votre code sur tout autre ordinateur. Heureusement il existe des alternatives faciles!

Comme indiqué ci-dessus, bien que nous ne recommandons pas cette approche dans la plupart des cas, vous pouvez utiliser la commande `setwd()` avec le chemin du fichier de dossier souhaité dans les citations, par exemple:

```{r, eval=F}
setwd("C:/Documents/R Files/My analysis")
```

[***DANGER:*** Définition d'un répertoire de travail avec `setwd()` *peut* être "cassant" si le chemin de fichier est spécifique à un ordinateur. Au lieu de cela, utilisez des chemins de fichier par rapport à un répertoire racine du projet R (avec le paquet **here**).]{style="color:red;"}

<!-- ======================================================= -->

### Définir manuellement le répertoire de travail {.unnumbered}

Pour définir le répertoire de travail manuellement (l'équivalent graphique du `setwd()`), cliquez sur le menu déroulant "Session" et accédez à "Set Working Directory", puis "Choose Directory". Cela définira le répertoire de travail pour cette scéance spécifique de R. Remarque: Si vous utilisez cette approche, vous devrez le faire manuellement chaque fois que vous ouvrez Rstudio.

<!-- ======================================================= -->

### Définir le répertoire de travail dans un projet R {.unnumbered}

Si vous utilisez un projet R, le répertoire de travail sera par défaut dans le dossier racine du projet R qui contient le fichier `.rproj`. Cela s'appliquera si vous ouvrez RStudio en cliquant sur le projet R (le fichier avec l'extension `.rproj`).

<!-- ======================================================= -->

### Répertoire de travail dans un script R Markdown {.Unnumbered}

Dans un script R Markdown, le répertoire de travail par défaut est le dossier ou le fichier RMarkdown (`.rmd`) est enregistré. Si vous utilisez un projet R et le paquet **here**, cela ne s'applique pas et le répertoire de travail sera `here()`, comme expliqué dans la page $$R projets$$.

Si vous souhaitez modifier le répertoire de travail d'une dossier RMarkdown autonome (qui ne fait pas partie d'un projet R), et vous utilisez `setwd()`, cela ne s'appliquera qu'à ce morceau de code spécifique. Pour modifier tous les morceaux de code dans une dossier RMarkdown, modifiez le morceau de configuration pour ajouter le paramètre `root.dir =`, comme ci-dessous:

```{r, eval=F}
knitr::opts_knit$set(root.dir = 'desired/directorypath')
```

Il est beaucoup plus facile d'utiliser simplement le script RMarkdown dans un projet R et d'utiliser le paquet **here**.

<!-- ======================================================= -->

### Fournir des chemins de fichier {.unnumbered}

La source de frustration la plus commune pour un débutant R (au moins sur un ordinateur avec Windows) est de saisir un chemin de fichier pour importer ou exporter des données. Il existe une explication approfondie sur la meilleure façon de saisir les chemins de fichier de saisie dans la page $$Import and export$$, mais voici quelques points clés:

**Chemins cassés**

Vous trouverez ci-dessous un exemple de chemin de fichier "absolute" avec un "adresse complète". Ceux-ci se casseront probablement s'ils sont utilisés par un autre ordinateur. Une exception est si vous utilisez un dossier sur un réseau partagé.

    C:/Utilisateurs/Nom/Document/Logiciels analytiques/R/Projets/Analyse2019/data/mars2019.csv

**Direction de la barre oblique**

*Si vous saisissez un chemin de fichier, soyez conscient de la direction des barres obliques.* Utilisez *des barres obliques vers l'avant* (`/`) pour séparer les composants, par exemple `Data/Provincial.csv`. Le défaut pour les ordinateurs avec Windows est de séparer les composants du chemin avec *des barres obliques en arrière* (`\\`). Vous devrez donc modifier la direction de chaque barre oblique. Si vous utilisez le paquet **here** comme décrit dans la page $$R projects$$, la direction des barres obliques n'est pas un problème.

**Chemins de fichiers relatifs**

Nous recommandons généralement de utiliser des fichiers avec chemins "relatifs" - c'est-à-dire le chemin *par rapport à* la racine de votre projet R. Vous pouvez le faire en utilisant le paquet **here** comme expliqué dans la page $$R projects$$. Un chemin de fichiers relatif peut ressembler à ceci:

```{r, eval=F}

# Importer csv Linelist à partir de données/listes linéare/propres/sous-dossiers d'un projet R

linelist <- import(here("data", "clean", "linelists", "marin_country.csv"))
```

Même si vous utilisez des chemins de fichiers relatifs dans un projet R, vous pouvez toujours utiliser des chemins absolus pour importer/exporter des données en dehors de votre projet R.

<!-- ======================================================= -->

## Objets {#objets}

Tout dans R est un objet, et R est une langue "orienté sur l'objet". Les sections suivantes expliquent:

-   Comment créer des objets (`<-`)
-   Types d'objets (par exemple, trames de données, vecteurs ..)\
-   Comment accéder à des sous-parties d'objets (par exemple, des variables dans un jeu de données)\
-   Classes d'objets (ex. numérique, logique, nombres entieres, double, caractère, facteur)

<!-- ======================================================= -->

### Tout est un objet {.unnumbered}

*Cette section est adaptée du [projet R4Epis](https://r4epis.netlify.app/training/r_basics/objects/).*\
Tout ce que vous stockez dans R - des ensembles de données, des variables, une liste de noms de villages, un nombre total de population, même des sorties telles que des graphiques - sont des **objets** qui sont **attribués à un nom** et **peuvent être référencés** dans les commandes ultérieures.

Un objet existe lorsque vous lui avez attribué une valeur (voir la section d'attribution ci-dessous). Lorsqu'une valeur lui est attribuée, l'objet apparaît dans l'environnement (voir le volet supérieur droit de RStudio). Il peut alors être exploité, manipulé, modifié et redéfini.

<!-- ======================================================= -->

### Définir des objets (`<-`) {.unnumbered}

**Créez des objets *en leur attribuant une valeur* avec l'opérateur `<-`.** Vous pouvez considérer l'opérateur d'affectation`<-` comme les mots "est défini comme". Les commandes d'affectation suivent généralement un ordre standard:

**`nom_objet <- valeur`** (ou processus/calcul qui produit une valeur)

Par exemple, vous souhaiterez peut-être enregistrer la semaine de rapport épidémiologique en cours en tant qu'objet de référence dans le code ultérieur. Dans cet exemple, l'objet `semaine_en_cours` est créé lorsqu'il reçoit la valeur `"2018-W10"` (les guillemets en font une valeur de caractère). L'objet `semaine_en_cours` apparaîtra alors dans le volet Environnement de RStudio (en haut à droite) et pourra être référencé dans les commandes ultérieures.

Voir les commandes R et leur sortie dans les cases ci-dessous.

```{r basics_objects_assignment}

# Créer l'objet semaine_en_cours en lui attribuant une valeur:
semaine_en_cours <- "2018-W10"   

# Imprime la valeur actuelle de l'objet semaine_en_cours dans la console:
semaine_en_cours

```

[***NOTE:*** Notez que le `[1]` dans la sortie de la console R indique simplement que vous visualisez le premier élément de la sortie]{style="color: black;"}

[***ATTENTION:*** **La valeur d'un objet peut être écrasée** à tout moment en exécutant une commande d'affectation pour redéfinir sa valeur. Ainsi, **l'ordre d'exécution des commandes est très important**.]{style="color: orange;"}

La commande suivante redéfinira la valeur de `semaine_en_cours`:

```{r basics_objects_reassignment}

# Attribuer une NOUVELLE valeur à l'objet semaine_en_cours:
semaine_en_cours <- "2018-W51"

# Afficher la valeur actuelle de semaine_en_cours dans la console:
semaine_en_cours

```

**Signe égal `=`**

Vous verrez également des signes égal dans le code R:

-   Un double signe égal `==` entre deux objets ou valeurs pose une *question* logique: "est-ce égal à cela?".
-   Vous verrez également des signes égal dans les fonctions utilisées pour spécifier les valeurs des arguments d'un fonction (lisez-les dans les sections ci-dessous), par exemple `max(age, na.rm = TRUE)`.
-   Vous *pouvez* utiliser un seul signe égal `=` à la place de `<-` pour créer et définir des objets, mais cela est déconseillé. Vous pouvez lire pourquoi cela est déconseillé [ici](https://renkun.me/2014/01/28/difference-between-assignment-operators-in-r/).

**Ensembles de données**

Les ensembles de données sont également des objets (généralement des « dataframes ») et doivent recevoir des noms lors de leur importation. Dans le code ci-dessous, l'objet `linelist` est créé et reçoit la valeur d'un fichier CSV importé avec le paquet **rio** et sa fonction `import()`.

```{r basics_objects_dataframes, eval=FALSE}

# <<linelist>> est créée et reçoit la valeur du fichier CSV importé:
linelist <- import("my_linelist.csv")

```

Vous pouvez en savoir plus sur l'importation et l'exportation d'ensembles de données dans la section sur $$Import and export$$.

[***ATTENTION:*** Une note rapide sur la dénomination des objets:]{style="color: orange;"}

-   Les noms d'objets ne doivent pas contenir d'espaces, mais vous devez utiliser un trait de soulignement (\_) ou un point (.) au lieu d'un espace.
-   Les noms d'objets sont sensibles à la casse (lettres majuscules et minuscules; ce qui signifie que **D**ataset_A est différent de **d**ataset_A).
-   Les noms d'objets doivent commencer par une lettre (ne peuvent pas commencer par un chiffre comme 1, 2 ou 3).

**Les sorties**

Les sorties telles que les tableaux et les tracés fournissent un exemple de la façon dont les sorties peuvent être enregistrées en tant qu'objets ou simplement imprimées sans être enregistrées. Un tableau croisé du sexe et du résultat à l'aide de la fonction R **base** `table()` peut être imprimé directement sur la console R (*sans* être enregistré).

```{r}

# Imprimé sur la console R uniquement:
table(linelist$gender, linelist$outcome)

```

La même table peut également être enregistrée en tant qu'objet nommé. Ensuite, éventuellement, il peut être imprimé.

```{r}

# Enregistrer:
gen_out_table <- table(linelist$gender, linelist$outcome)

# Imprimer:
gen_out_table

```

**Colonnes**

Les colonnes d'un ensemble de données sont également des objets et peuvent être définies, écrasées et créées comme décrit ci-dessous dans la section sur les colonnes.

Vous pouvez utiliser l'opérateur d'affectation de **base** R pour créer une nouvelle colonne. Ci-dessous, la nouvelle colonne `bmi` (indice de masse corporelle) est créée, et pour chaque ligne la nouvelle valeur est le résultat d'une opération mathématique sur la valeur de la ligne dans les colonnes `wt_kg` et `ht_cm`.

```{r, eval=F}

# Créer une nouvelle colonne "bmi" en utilisant la syntaxe de base R:
linelist$bmi <- linelist$wt_kg / (linelist$ht_cm/100)^2

```

Cependant, dans ce manuel, nous mettons l'accent sur une approche différente de la définition des colonnes, qui utilise la fonction `mutate()` du package **dplyr** et *piping* avec l'opérateur pipe (`%>%`). La syntaxe est plus facile à lire et il y a d'autres avantages expliqués dans la page $$Cleaning data and core functions$$

Vous pouvez lire plus sur *piping* dans la section "Piping" ci-dessous.

```{r, eval=F}

# Créer une nouvelle colonne "bmi" en utilisant la syntaxe dplyr:
linelist <- linelist %>% 
  mutate(bmi = wt_kg / (ht_cm/100)^2)

```

<!-- ======================================================= -->

### Structure d'objet {.unnumbered}

**Les objets peuvent être une seule donnée (par exemple, "mon_numéro \<- 24"), ou ils peuvent être constitués de données structurées.**

Le graphique ci-dessous est emprunté à [ce tutoriel R en ligne](http://venus.ifca.unican.es/Rintro/dataStruct.html). Il montre certaines structures de données courantes et leurs noms. Les données spatiales ne sont pas incluses dans cette image, qui sont abordées dans la page $$GIS basics$$

```{r basics_objects_structures, echo=F, out.width = "75%", out.height="50%", fig.align = "center"}
knitr::include_graphics(here::here("images", "R_data_structures.png"))
```

En épidémiologie (et en particulier en épidémiologie de terrain), vous rencontrerez *le plus souvent* des trames de données et des vecteurs:

+-------------------+----------------------------------------------------------------------------------------------------------------+-------------------------------------------------------------------------------------------------------------------+
| Structure commune | Explication                                                                                                    | Exemple                                                                                                           |
+===================+================================================================================================================+===================================================================================================================+
| Vecteurs          | Un conteneur pour une séquence d'objets singuliers, tous de la même classe (par exemple numérique, caractère). | **Les "variables" (colonnes) dans les blocs de données sont des vecteurs** (par exemple, la colonne `age_years`). |
+-------------------+----------------------------------------------------------------------------------------------------------------+-------------------------------------------------------------------------------------------------------------------+
| Trames de données | Vecteurs (par exemple, des colonnes) qui sont liés ensemble et qui ont tous le même nombre de lignes.          | `linelist` est une trame de données.                                                                              |
+-------------------+----------------------------------------------------------------------------------------------------------------+-------------------------------------------------------------------------------------------------------------------+

Notez que pour créer un vecteur "autonome" (ne faisant pas partie d'un bloc de données), la fonction `c()` est utilisée pour combiner les différents éléments. Par exemple, si vous créez un vecteur de couleurs à appliquer à l'échelle de couleurs d'un tracé:

`vector_of_colors <- c("blue", "red2", "orange", "grey")`

<!-- ======================================================= -->

### Classes d'objets {.unnumbered}

Tous les objets stockés dans R ont une *classe* qui indique à R comment gérer l'objet. Il existe de nombreuses classes possibles, mais les plus courantes incluent:

+------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+--------------------------------------------------------------------------------------------------------------------+
| Classe     | Explication                                                                                                                                                                                                                      | Exemples                                                                                                           |
+============+==================================================================================================================================================================================================================================+====================================================================================================================+
| Caractère  | Ce sont des textes/mots/phrases **"entre guillemets"**. Les mathématiques ne peuvent pas être effectuées sur ces objets.                                                                                                         | "Les objets caractères sont entre guillemets"                                                                      |
+------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+--------------------------------------------------------------------------------------------------------------------+
| Entier     | Nombres **entiers uniquement** (pas de décimales)                                                                                                                                                                                | -5, 14 ou 2000                                                                                                     |
+------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+--------------------------------------------------------------------------------------------------------------------+
| Numérique  | Ce sont des nombres et **peuvent inclure des décimales**. S'ils sont entre guillemets, ils seront considérés comme une classe de caractères.                                                                                     | 23.1 ou 14                                                                                                         |
+------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+--------------------------------------------------------------------------------------------------------------------+
| Facteur    | Ce sont des vecteurs qui ont un **ordre spécifié** ou une hiérarchie de valeurs                                                                                                                                                  | Une variable de statut économique à valeurs ordonnées                                                              |
+------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+--------------------------------------------------------------------------------------------------------------------+
| Des dates  | **Une fois que R est informé que certaines données sont des dates**, ces données peuvent être manipulées et affichées de manière spéciale. Voir la page sur [Working with dates] pour plus d'informations.                       | 2018-04-12 ou                                                                                                      |
|            |                                                                                                                                                                                                                                  |                                                                                                                    |
|            |                                                                                                                                                                                                                                  | 15/3/1954 ou                                                                                                       |
|            |                                                                                                                                                                                                                                  |                                                                                                                    |
|            |                                                                                                                                                                                                                                  | mer 4 janv 1980                                                                                                    |
+------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+--------------------------------------------------------------------------------------------------------------------+
| Logique    | Les valeurs doivent être l'une des deux valeurs spéciales `TRUE` ou `FALSE` (notez qu'elles ne sont **pas** "TRUE" et "FALSE" entre guillemets)                                                                                  | TRUE ou FALSE                                                                                                      |
+------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+--------------------------------------------------------------------------------------------------------------------+
| data.frame | Une trame de données est la façon dont R stocke un **ensemble de données typique**. Il se compose de vecteurs (colonnes) de données liés entre eux, qui ont tous le même nombre d'observations (lignes).                         | L'exemple de jeu de données AJS nommé `linelist_raw` contient 68 variables avec 300 observations (lignes) chacune. |
+------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+--------------------------------------------------------------------------------------------------------------------+
| tibble     | Les tibbles sont une variante du cadre de données; la principale différence opérationnelle étant qu'ils s'impriment mieux sur la console (affichent les 10 premières lignes et uniquement les colonnes qui tiennent sur l'écran) | Tout cadre de données, liste ou matrice peut être converti en tibble avec `as_tibble()`                            |
+------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+--------------------------------------------------------------------------------------------------------------------+
| liste      | Une liste est comme un vecteur, mais contient d'autres objets qui peuvent être d'autres classes différentes                                                                                                                      | Une liste peut contenir un seul nombre, une trame de données, un vecteur et même une autre liste à l'intérieur!    |
+------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+--------------------------------------------------------------------------------------------------------------------+

**Vous pouvez tester la classe d'un objet en fournissant son nom à la fonction `class()`**. Remarque : vous pouvez référencer une colonne spécifique dans un jeu de données en utilisant la notation «\$» pour séparer le nom du jeu de données et le nom de la colonne.

```{r, echo=TRUE,}

# La classe doit être une trame de données ou un tibble:
class(linelist)         

# La classe doit être numérique:
class(linelist$age)

# La classe doit être caractère:
class(linelist$gender)

```

Parfois, une colonne sera automatiquement convertie dans une classe différente par R. Attention à cela ! Par exemple, si vous avez un vecteur ou une colonne de nombres, mais qu'une valeur de caractère est insérée; toute la colonne deviendra un caractère de classe.

```{r}

# Définir le vecteur avec des numéros:
num_vector <- c(1,2,3,4,5) 

# Le vecteur est de classe "numérique":
class(num_vector)          

# Convertir le troisième élément en caractère:
num_vector[3] <- "three"   

# Le vecteur est maintenant de classe "caractère"
class(num_vector)          

```

Un exemple courant de ceci est lors de la manipulation d'un bloc de données afin d'imprimer un tableau. Si vous faites une ligne totale et essayez de coller/coller ensemble des pourcentages dans la même cellule que des nombres (par exemple `23 (40%)`), le toute la colonne numérique ci-dessus sera convertie en caractère et ne pourra plus être utilisée pour des calculs mathématiques. **Parfois, vous devrez convertir des objets ou des colonnes dans une autre classe.**

+------------------+------------------------------------------------------------------------------------------------------+
| Fonction         | Action                                                                                               |
+==================+======================================================================================================+
| `as.character()` | Convertit en classe "caractère"                                                                      |
+------------------+------------------------------------------------------------------------------------------------------+
| `as.numeric()`   | Convertit en classe "numérique"                                                                      |
+------------------+------------------------------------------------------------------------------------------------------+
| `as.integer()`   | Convertit en classe "entière"                                                                        |
+------------------+------------------------------------------------------------------------------------------------------+
| `as.Date()`      | Convertit en classe "Date"                                                                           |
|                  |                                                                                                      |
|                  | *Remarque:* voir la section sur les $$Dates$$ pour plus de détails                                   |
+------------------+------------------------------------------------------------------------------------------------------+
| `factor()`       | Convertit en classe "facteur"                                                                        |
|                  |                                                                                                      |
|                  | *Remarque:* la redéfinition de l'ordre des niveaux de valeur nécessite des arguments supplémentaires |
+------------------+------------------------------------------------------------------------------------------------------+

De même, il existe des fonctions **base** R pour vérifier si un objet EST d'une classe spécifique, comme `is.numeric()`, `is.character()`, `is.double()`, `is .facteur()`, `is.integer()`

Voici [plus de matériel en ligne sur les classes et les structures de données dans R](https://swcarpentry.github.io/r-novice-inflammation/13-supp-data-structures/).

<!-- ======================================================= -->

### Colonnes/Variables (`$`) {.unnumbered}

**Une colonne dans un bloc de données est techniquement un "vecteur" (voir tableau ci-dessus)** - une série de valeurs qui doivent toutes être de la même classe (caractère, numérique, logique, etc.).

Un vecteur peut exister indépendamment d'un bloc de données, par exemple un vecteur de noms de colonnes que vous souhaitez inclure en tant que variables explicatives dans un modèle. Pour créer un vecteur "autonome", utilisez la fonction `c()` comme ci-dessous:

```{r, warning=F, message=F}

# Définir le vecteur autonome des valeurs de classe caractère:
var_explicatives <- c("gender", "fever", "chills", "cough", "aches", "vomit")

# Affiche les valeurs dans ce vecteur nommé:
var_explicatives

```

**Les colonnes d'un bloc de données sont également des vecteurs et peuvent être appelées, référencées, extraites ou créées à l'aide du symbole `$`.** Le symbole `$` relie le nom de la colonne au nom de son bloc de données. Dans ce manuel, nous essayons d'utiliser le mot "colonne" au lieu de "variable".

```{r basics_objects_call, eval=F}

# Récupérer la longueur du vecteur age:
length(linelist$age) # (l'âge est une colonne dans le bloc de données nomé "linelist")

```

En tapant le nom de la trame de données suivi de `$`, vous verrez également un menu déroulant de toutes les colonnes de la trame de données. Vous pouvez les faire défiler à l'aide de votre touche fléchée, en sélectionner une avec votre touche Entrée et éviter les fautes d'orthographe !

```{r echo=F, out.width = "100%", fig.align = "center"}
knitr::include_graphics(here::here("images", "Calling_Names.gif"))
```

[***CONSEIL AVANCÉ:*** Certains objets plus complexes (par exemple, une liste ou un objet `epicontacts`) peuvent avoir plusieurs niveaux accessibles via plusieurs signes dollar. Par exemple `epicontacts$linelist$date_onset`]{style="color: darkgreen;"}

<!-- ======================================================= -->

### Accès/index avec crochets (`[ ]`) {.unnumbered}

Vous devrez peut-être afficher des parties d'objets, également appelées "indexation", ce qui se fait souvent à l'aide des crochets `[ ]`. L'utilisation de `$` sur une trame de données pour accéder à une colonne est également un type d'indexation.

```{r}

# Définir le vecteur:
mon_vecteur <- c("a", "b", "c", "d", "e", "f")

# Imprimer le 5ème élément:
mon_vecteur[5]

```

Les crochets fonctionnent également pour renvoyer des parties spécifiques d'une sortie renvoyée, comme la sortie d'une fonction `summary()`:

```{r}

# Tout le résumé
summary(linelist$age)

# Juste le deuxième élément du résumé, avec le nom (en utilisant uniquement des crochets simples)
summary(linelist$age)[2]

# Juste le deuxième élément, sans nom (en utilisant des doubles crochets)
summary(linelist$age)[[2]]

# Extraire un élément par son nom, sans afficher le nom
summary(linelist$age)[["Median"]]

```

Les crochets fonctionnent également sur les blocs de données pour afficher des lignes et des colonnes spécifiques. Vous pouvez le faire en utilisant la syntaxe `dataframe[lignes, colonnes]`:

```{r basics_objects_access, eval=F}

# Afficher une ligne spécifique (2) du jeu de données, avec toutes les colonnes 
# (n'oubliez pas la virgule!)
linelist[2,]

# Afficher toutes les lignes, mais une seule colonne:
linelist[, "date_onset"]

# Afficher les valeurs de la ligne 2 et des colonnes 5 à 10:
linelist[2, 5:10]

# Afficher les valeurs de la ligne 2 et des colonnes 5 à 10 et 18:
linelist[2, c(5:10, 18)]

# Afficher les lignes 2 à 20 et des colonnes spécifiques:
linelist[2:20, c("date_onset", "outcome", "age")]

# Afficher les lignes et les colonnes en fonction de critères
# *** Notez que le dataframe doit toujours être nommé dans les critères!
linelist[linelist$age > 25 , c("date_onset", "outcome", "age")]

# Utilisez View() pour voir les sorties dans le volet RStudio Viewer (plus facile à lire)
# *** Notez le "V" majuscule dans la fonction View()
View(linelist[2:20, "date_onset"])

# Enregistrer en tant que nouvel objet:
new_table <- linelist[2:20, c("date_onset")]

```

Notez que vous pouvez également réaliser l'indexation des lignes/colonnes ci-dessus sur les blocs de données et les tibbles en utilisant la syntaxe **dplyr** (fonctions `filter()` pour les lignes et `select()` pour les colonnes). Pour en savoir plus sur ces fonctions principales, consultez la page $$Cleaning data and core functions$$.

Pour filtrer en fonction du "numéro de ligne", vous pouvez utiliser la fonction **dplyr** `row_number()` avec des parenthèses ouvertes dans le cadre d'une instruction de filtrage logique. Vous utiliserez souvent l'opérateur `%in%` et une plage de nombres dans le cadre de cette instruction logique, comme indiqué ci-dessous. Pour voir les *premières* N lignes, vous pouvez également utiliser la fonction spéciale **dplyr** `head()`.

```{r, eval=F}

# Afficher les 100 premières lignes:
linelist %>% 
     head(100)

# Afficher la ligne 5 uniquement:
linelist %>% 
     filter(row_number() == 5)

# Afficher les lignes 2 à 20 et trois colonnes spécifiques 
# (notez qu'aucun guillemet n'est nécessaire sur les noms de colonne)
linelist %>% 
     filter(row_number() %in% 2:20) %>% 
     select(date_onset, issue, age)

```

Lors de l'indexation d'un objet de classe **list**, les crochets simples retournent toujours avec la classe list, même si un seul objet est retourné. Les crochets doubles, cependant, peuvent être utilisés pour accéder à un seul élément et renvoyer une classe différente de la liste.\
Les parenthèses peuvent également être écrites les unes après les autres, comme illustré ci-dessous.

Cette [explication visuelle de l'indexation des listes, avec des poivrières](https://r4ds.had.co.nz/vectors.html#lists-of-condiments) est humoristique et utile.

```{r}

# définir la liste des démos
ma_liste <- list(
   # Le premier élément de la liste est un vecteur de caractères:
   hopitaux = c("Central", "Empire", "Santa Anna"),
  
   # Le deuxième élément de la liste est une trame de données d'adresses:
   adresses = data.frame(
     rue = c("145 Medical Way", "1048 Brown Ave", "999 El Camino"),
     ville = c("Andover", "Hamilton", "El Paso")
     )
   )

```

Voici à quoi ressemble la liste lorsqu'elle est imprimée sur la console. Voyez comment il y a deux éléments nommés:

-   `hôpitaux`, un vecteur de caractères\
-   `adresses`, une trame de données d'adresses

```{r}
ma_liste
```

Maintenant, nous extrayons, en utilisant diverses méthodes:

```{r}

# Cela renvoie l'élément dans la classe "list" - le nom de l'élément est toujours affiché:
ma_liste[1] 

# Cela ne renvoie que le vecteur de caractères (sans nom):
ma_liste[[1]]

# Vous pouvez également indexer par le nom de l'élément de la liste:
ma_liste[["hopitaux"]]

# Cela renvoie le troisième élément du vecteur de caractères "hôpitaux":
ma_liste[[1]][3] 

# Cela renvoie la première colonne ("rue") de la trame de données d'adresse:
ma_liste[[2]][1]

```

<!-- ======================================================= -->

### Supprimer des objets {.unnumbered}

Vous pouvez supprimer des objets individuels de votre environnement R en mettant le nom dans la fonction `rm()` (sans guillemets):

```{r, eval=F}
rm(nom_objet)
```

Vous pouvez supprimer tous les objets (vider votre espace de travail) en exécutant:

```{r, eval=F}
rm(list = ls(all = TRUE))
```

<!-- ======================================================= -->

<!-- ======================================================= -->

<!-- ======================================================= -->

## Tuyauterie / "Piping" (`%>%`)

**Deux approches générales pour travailler avec des objets sont:**

1)  **Pipes/tidyverse** - les tuyaux envoient un objet d'une fonction à l'autre - l'accent est mis sur *l'action*, pas sur l'objet\
2)  **Définir les objets intermédiaires** - un objet est redéfini encore et encore - l'accent est mis sur l'objet

<!-- ======================================================= -->

### **Tuyaux / Pipes** {.unnumbered}

\*\* Expliqué simplement, l'opérateur pipe (`%>%`) passe une sortie intermédiaire d'une fonction à la suivante. \*\*\
Vous pouvez penser que cela signifie "alors". De nombreuses fonctions peuvent être liées avec `%>%`.

-   **Le tuyau met l'accent sur une séquence d'actions, et non sur l'objet sur lequel les actions sont effectuées**\
-   Les tuyaux sont plus efficaces lorsqu'une séquence d'actions doit être effectuée sur un objet\
-   Les tuyaux proviennent du paquet **magrittr**, qui est automatiquement inclus dans les paquets **dplyr** et **tidyverse**
-   Les tuyaux peuvent rendre le code plus propre et plus facile à lire, plus intuitif

En savoir plus sur cette approche dans le tidyverse [guide de style](https://style.tidyverse.org/pipes.html)

Voici un faux exemple de comparaison, utilisant des fonctions fictives pour "faire un gâteau". Tout d'abord, la méthode du tuyau:

```{r piping_example_pipe, eval=F}

# Un faux exemple de comment faire cuire un gâteau en utilisant la syntaxe de tuyauterie:

gateau <- farine %>% # pour définir le gâteau, commencez par la farine, puis...
     # ajouter des oeufs
     add(oeufs) %>% 
     # ajouter de l'huile
     add(huile) %>% 
     # ajouter de l'eau
     add(eau) %>% 
     # mélanger ensemble avec cuillère pour 2 minutes:
     mix_together(
          ustensil = "spoon",
          minutes = 2) %>%
     # cuire à 200 degrés centigrade pour 35 minutes:
     bake(
          degrees = 200, 
          system = "centigrade",
          minute = 35) %>%
     # laissez-le refroidir
     let_cool() 


```

Voici un autre [lien](https://cfss.uchicago.edu/notes/pipes/#:~:text=Pipes%20are%20an%20extremely%20useful,code%20and%20combine%20multiple%20operations) décrivant l'utilitaire de tuyaux.

La tuyauterie n'est pas une fonction de **base** en R. Pour utiliser la tuyauterie, le paquet **magrittr** doit être installé et chargé (cela se fait généralement en chargeant le paquet **tidyverse** ou **dplyr** qui l'inclut). Vous pouvez [en savoir plus sur la tuyauterie dans la documentation de magrittr](https://magrittr.tidyverse.org/).

Notez que, tout comme les autres commandes R, les tuyaux peuvent être utilisés pour afficher simplement le résultat ou pour enregistrer/réenregistrer un objet, selon que l'opérateur d'affectation `<-` est impliqué ou non. Voir les deux exemplaires ci-dessous:

```{r, eval=F}

# Créer ou écraser un objet, en le définissant sous 
# forme de nombres agrégés par catégorie d'âge (non imprimé)
linelist_summary <- linelist %>% 
  count(age_cat)

```

```{r}

# Imprimez le tableau des comptes dans la console, mais ne l'enregistrez pas:
linelist %>% 
  count(age_cat)

```

**`%<>%`**\
Il s'agit d'un "tuyau d'affectation" du paquet **magrittr**, qui *transmet un objet en avant et redéfinit également l'objet*. Il doit être le premier opérateur pipe de la chaîne. C'est un raccourci. Les deux commandes ci-dessous sont équivalentes:

```{r, eval=F}

# Utilisez l'opérateur d'affectation:
linelist <- linelist %>%
  filter(age > 50)

# Utilisez le tuyau d'affectation:
linelist %<>% filter(age > 50)

```

<!-- ======================================================= -->

### Définir les objets intermédiaires {.unnumbered}

Cette approche de modification des objets ou trammes de données peut être meilleure si:

-   Vous devez manipuler plusieurs objets\
-   Il y a des étapes intermédiaires qui sont significatives et méritent des noms d'objets séparés

**Des risques:**

-   Créer de nouveaux objets pour chaque étape signifie créer beaucoup d'objets. Si vous utilisez le mauvais, vous ne vous en rendrez peut-être pas compte!\
-   Nommer tous les objets peut prêter à confusion\
-   Les erreurs peuvent ne pas être facilement détectables

Soit nommer chaque objet intermédiaire, soit écraser l'original, soit combiner toutes les fonctions ensemble. Tous viennent avec leurs propres risques.

Vous trouverez ci-dessous le même exemple de faux "gâteau" que ci-dessus, mais en utilisant ce style:

```{r piping_example_redefine, eval=F}

# un faux exemple de comment faire un gâteau en utilisant cette méthode 
# (définissant des objets intermédiaires):

# Ajouter le farine et les oeufs:
pate_1 <- left_join(farine, oeufs)

# Ajouter l'huile:
pate_2 <- left_join (pate_1, huile)

# Ajouter l'eau:
pate_3 <- left_join(pate_2, eau)

# Melange tous ensemble:
pate_4 <- mix_together(object = pate_3, 
                       ustensil = "spoon", 
                       minutes = 2)

# Cuire le gâteau dans le four:
gateau <-bake(object = pate_4, 
              degrees = 200, 
              system = "centigrade", 
              minutes = 35)

# Laissez-le à refroidir:
gateau <- let_cool(gateau)

```

Combinez toutes les fonctions ensemble - c'est difficile à lire :

```{r eval=F}

# Un exemple de combinaison/imbrication de plusieurs fonctions - difficile à lire:
gateau <- let_cool(bake(mix_together(pate_3, 
                                     utensil = "spoon", 
                                     minutes = 2), 
                        degrees = 200, 
                        system = "centigrade",
                        minutes = 35))

```

<!-- ======================================================= -->

## Opérateurs clés et fonctions {#operators}

Cette section détaille les opérateurs dans R, tels que:

-   Opérateurs définitionnels\
-   Opérateurs relationnels (inférieur à, égal aussi..)\
-   Opérateurs logiques (et, ou...)\
-   Gestion des valeurs manquantes\
-   Opérateurs et fonctions mathématiques (+/-, \>, sum(), median(), ...)\
-   L'opérateur `%in%`

<!-- ======================================================= -->

### Opérateurs d'affectation {.unnumbered}

**`<-`**

L'opérateur d'affectation de base dans R est `<-`. Tel que `nom_objet <- valeur`.\
Cet opérateur d'affectation peut également être écrit comme `=`. Nous vous conseillons d'utiliser `<-` pour une utilisation générale de R.\
Nous conseillons également d'entourer ces opérateurs d'espaces, pour plus de lisibilité.

**`<<-`**

Si [Fonctions d'écriture], ou si vous utilisez R de manière interactive avec des scripts sourcés, vous devrez peut-être utiliser cet opérateur d'affectation `<<-` (de **base** R). Cet opérateur est utilisé pour définir un objet dans un environnement R « parent » supérieur. Voir ceci [référence en ligne](https://stat.ethz.ch/R-manual/R-devel/library/base/html/assignOps.html).

**`%<>%`**

Il s'agit d'un "tuyau d'affectation" du paquet **magrittr**, qui dirige un objet vers l'avant et *redéfinit également l'objet*. Il doit être le premier opérateur pipe de la chaîne. Il s'agit d'un raccourci.

**`%<+%`**

Ceci est utilisé pour ajouter des données aux arbres phylogénétiques avec le package **ggtree**. Voir la page sur les $$Phylogenetic trees$$ ou ce [livre de ressources en ligne](https://yulab-smu.top/treedata-book/).

<!-- ======================================================= -->

### Opérateurs relationnels et logiques {.unnumbered}

Les opérateurs relationnels comparent les valeurs et sont souvent utilisés lors de la définition de nouvelles variables et de sous-ensembles des blocs de données. Voici les opérateurs relationnels courants dans R:

+----------------------+------------+--------------+------------------------------------------------------------------------------------------------------------------+
| Sens                 | Opérateur  | Exemple      | Exemple de résultat                                                                                              |
+======================+============+==============+==================================================================================================================+
| Égal à               | `==`       | `"A" == "a"` | `FALSE` (parce que R est sensible à la casse)                                                                    |
|                      |            |              |                                                                                                                  |
|                      |            |              | *Notez que `==` (double égal) est différent de `=` (simple égal), qui agit comme l'opérateur d'affectation `<-`* |
+----------------------+------------+--------------+------------------------------------------------------------------------------------------------------------------+
| Non égal à           | `!=`       | `2 != 0`     | `TRUE`                                                                                                           |
+----------------------+------------+--------------+------------------------------------------------------------------------------------------------------------------+
| Supérieur à          | `>`        | `4 > 2`      | `TRUE`                                                                                                           |
+----------------------+------------+--------------+------------------------------------------------------------------------------------------------------------------+
| Moins de             | `<`        | `4 < 2`      | `FALSE`                                                                                                          |
+----------------------+------------+--------------+------------------------------------------------------------------------------------------------------------------+
| Supérieur ou égal à  | `>=`       | `6 >= 4`     | `TRUE`                                                                                                           |
+----------------------+------------+--------------+------------------------------------------------------------------------------------------------------------------+
| Inférieur ou égal à  | `<=`       | `6 <= 4`     | `FALSE`                                                                                                          |
+----------------------+------------+--------------+------------------------------------------------------------------------------------------------------------------+
| Valeur manquante     | `is.na()`  | `is.na(7)`   | `FALSE`                                                                                                          |
|                      |            |              |                                                                                                                  |
|                      |            |              | (voir page sur $$Missing data$$)                                                                                 |
+----------------------+------------+--------------+------------------------------------------------------------------------------------------------------------------+
| Valeur ne manque pas | `!is.na()` | `!is.na(7)`  | `TRUE`                                                                                                           |
+----------------------+------------+--------------+------------------------------------------------------------------------------------------------------------------+

Les opérateurs logiques, tels que ET et OU, sont souvent utilisés pour connecter des opérateurs relationnels et créer des critères plus complexes. Les instructions complexes peuvent nécessiter des parenthèses ( ) pour le regroupement et l'ordre d'application.

+-------------+-------------------------------------------------------------------------------+
| Sens        | Opérateur                                                                     |
+=============+===============================================================================+
| ET          | `&`                                                                           |
+-------------+-------------------------------------------------------------------------------+
| OU          | `|` (barre verticale)                                                         |
+-------------+-------------------------------------------------------------------------------+
| Parenthèses | `( )` Utilisé pour regrouper les critères et clarifier l'ordre des opérations |
+-------------+-------------------------------------------------------------------------------+

Par exemple, ci-dessous, nous avons une liste linéaire avec deux variables que nous voulons utiliser pour créer notre définition de cas, `resultat_tdr`, un résultat d'un test rapide, et `autres_cas_menage`, qui nous dira s'il y a d'autres cas dans le ménage. La commande ci-dessous utilise la fonction `case_when()` pour créer la nouvelle variable `case_def` telle que:

```{r eval=FALSE}
linelist_propre <- linelist %>%
  mutate(case_def = case_when(
    is.na(resultat_tdr) & is.na(autres_cas_menage)            ~ NA_character_,
    resultat_tdr == "Positive"                                 ~ "Confirmé",
    resultat_tdr != "Positive" & other_cases_in_home == "Oui"  ~ "Probable",
    TRUE                                                     ~ "Suspect"
  ))
```

+--------------------------------------------------------------------------------+------------------------+
| Critères dans l'exemple ci-dessus                                              | Valeur dans "case_def" |
+================================================================================+========================+
| Si la valeur des variables `resultat_tdr` et `autres_cas_menage` est manquante | `NA` (manquante)       |
+--------------------------------------------------------------------------------+------------------------+
| Si la valeur dans `resultat_tdr` est "Positive"                                | "Confirmé"             |
+--------------------------------------------------------------------------------+------------------------+
| Si la valeur dans `resultat_tdr` n'est pas "Positive" **ET**                   | "Probable"             |
|                                                                                |                        |
| la valeur dans `autres_cas_menage` est "Oui"                                   |                        |
+--------------------------------------------------------------------------------+------------------------+
| Si l'un des critères ci-dessus n'est pas rempli                                | "Suspect"              |
+--------------------------------------------------------------------------------+------------------------+

*Notez que R est sensible à la casse, donc "Positif" est différent de "positif"...*

<!-- ======================================================= -->

### Valeurs manquantes {.unnumbered}

Dans R, les valeurs manquantes sont représentées par la valeur spéciale `NA` (une valeur "réservée") (lettres majuscules N et A - pas entre guillemets). Si vous importez des données qui enregistrent des données manquantes d'une autre manière (par exemple, 99, "Missing" ou .), vous pouvez recoder ces valeurs en "NA". La procédure à suivre est expliquée dans la page $$Import and export$$.

**Pour tester si une valeur est `NA`, utilisez la fonction spéciale `is.na()`**, qui renvoie `TRUE` ou `FALSE`.

```{r basics_operators_missing}

# 2 cas positives, un suspect et un inconnu:
resultat_tdr <- c("Positive", "Suspect", "Positive", NA)   

# Verifier si il y' a des valeurs manquantes:
is.na(resultat_tdr)

```

En savoir plus sur les valeurs manquantes, infinies, `NULL` et impossibles dans la page sur les $$Missing data$$. Découvrez comment convertir les valeurs manquantes lors de l'importation de données dans la page sur $$Import and export$$.

<!-- ======================================================= -->

### Mathématiques et statistiques {.unnumbered}

Tous les opérateurs et fonctions de cette page sont automatiquement disponibles en utilisant **base** R.

#### Opérateurs mathématiques {.unnumbered}

Ceux-ci sont souvent utilisés pour effectuer des additions, des divisions, pour créer de nouvelles colonnes, etc. Vous trouverez ci-dessous des opérateurs mathématiques courants dans R. Que vous mettiez des espaces autour des opérateurs n'est pas important.

| Objectif             | Exemple en R |
|----------------------|--------------|
| addition             | 2 + 3        |
| soustraction         | 2 - 3        |
| multiplication       | 2 \* 3       |
| division             | 30 / 5       |
| exposant             | 2\^3         |
| ordre des opérations | ( )          |

#### Fonctions mathématiques {.unnumbered}

+--------------------------------+---------------------------------------+
| Objectif                       | Fonction                              |
+================================+=======================================+
| arrondir                       | round(x, digits = n)                  |
+--------------------------------+---------------------------------------+
| arrondir                       | janitor::round_half_up(x, digits = n) |
+--------------------------------+---------------------------------------+
| plafond (arrondi)              | ceiling(x)                            |
+--------------------------------+---------------------------------------+
| étage (arrondir à l'inférieur) | floor(x)                              |
+--------------------------------+---------------------------------------+
| valeur absolue                 | abs(x)                                |
+--------------------------------+---------------------------------------+
| racine carrée                  | sqrt(x)                               |
+--------------------------------+---------------------------------------+
| exposant                       | exponent(x)                           |
+--------------------------------+---------------------------------------+
| un algorithme naturel          | log(x)                                |
+--------------------------------+---------------------------------------+
| log à la base 10               | log10(x)                              |
+--------------------------------+---------------------------------------+
| log à la base 2                | log2(x)                               |
+--------------------------------+---------------------------------------+

Remarque: pour `round()`, les `digits =` spécifient le nombre de décimales placées. Utilisez `signif()` pour arrondir à un nombre de chiffres significatifs.

#### Notation scientifique {.unnumbered}

La probabilité d'utilisation de la notation scientifique dépend de la valeur de l'option "scipen".

D'après la documentation de `?options`: scipen est une pénalité à appliquer lors de la décision d'imprimer des valeurs numériques en notation fixe ou exponentielle. Les valeurs positives tendent vers la notation fixe et négatives vers la notation scientifique: la notation fixe sera préférée à moins qu'elle ne soit plus large de plus de 'scipen'.

S'il est réglé sur un nombre faible (par exemple 0), il sera toujours "allumé". Pour "désactiver" la notation scientifique dans votre session R, définissez-la sur un nombre très élevé, par exemple:

```{r, eval=F}
# Désactiver la notation scientifique
options(scipen = 999)
```

#### Arrondi {.unnumbered}

[***DANGER:*** `round()` utilise "l'arrondi du banquier" qui arrondit à partir de 0,5 uniquement si le nombre supérieur est pair. Utilisez `round_half_up()` de **janitor** pour arrondir systématiquement les moitiés au nombre entier le plus proche. Voir [cette explication](https://cran.r-project.org/web/packages/janitor/vignettes/janitor.html#explore-records-with-duplicated-values-for-specific-combinations-of-variables-%20with-get_dupes)]{style="color: rouge;"}

```{r}

# Fonction d'arrondi avec R de base:
round(c(2.5, 3.5))

# Fonction d'arrondi du paquet "janitor":
janitor::round_half_up(c(2.5, 3.5))

```

#### Fonctions statistiques {.unnumbered}

[***ATTENTION:*** Les fonctions ci-dessous incluront par défaut les valeurs manquantes dans les calculs. Les valeurs manquantes entraîneront une sortie de `NA`, sauf si l'argument `na.rm = TRUE` est spécifié. Cela peut être écrit en raccourci comme `na.rm = T`.]{style="color: orange;"}

| Objective                   | Fonction           |
|-----------------------------|--------------------|
| moyen                       | mean(x, na.rm=T)   |
| médian                      | median(x, na.rm=T) |
| écart-type                  | sd(x, na.rm=T)     |
| quantiles\*                 | quantile(x, probs) |
| somme                       | sum(x, na.rm=T)    |
| valeur minimum              | min(x, na.rm=T)    |
| valeur maximum              | max(x, na.rm=T)    |
| plage de valeurs numériques | range(x, na.rm=T)  |
| sommaire\*\*                | summary(x)         |

Remarques:

-   `*quantile()`: `x` est le vecteur numérique à examiner et `probs =` est un vecteur numérique avec des probabilités comprises entre 0 et 1,0, par exemple `c(0,5, 0,8, 0,85)`
-   `**summary()`: donne un résumé sur un vecteur numérique comprenant la moyenne, la médiane et les centiles communs

[***DANGER:*** Si vous fournissez un vecteur de nombres à l'une des fonctions ci-dessus, assurez-vous d'envelopper les nombres dans `c()`.]{style="color: red;"}

```{r}
# Si vous fournissez des nombres bruts à une fonction, 
# enveloppez-les dans c():

# !!! ERREUR !!!
mean(1, 6, 12, 10, 5, 0)      

# CORRECT
mean(c(1, 6, 12, 10, 5, 0)) 

```

#### Autres fonctions utiles {.unnumbered}

+----------------------------------+-------------------+-------------------------------------------------+
| Objectif                         | Fonction          | Exemple                                         |
+==================================+===================+=================================================+
| créer une séquence               | seq(from, to, by) | `seq(1, 10, 2)`                                 |
+----------------------------------+-------------------+-------------------------------------------------+
| répéter x, n fois                | rep(x, ntimes)    | `rep(1:3, 2)` or `rep(c("a", "b", "c"), 3)`     |
+----------------------------------+-------------------+-------------------------------------------------+
| subdiviser un vecteur numérique  | cut(x, n)         | `cut(linelist$age, 5)`                          |
+----------------------------------+-------------------+-------------------------------------------------+
| prendre un échantillon au hasard | sample(x, size)   | `sample(linelist$id, size = 5, replace = TRUE)` |
+----------------------------------+-------------------+-------------------------------------------------+

<!-- ======================================================= -->

### `%in%` {.unnumbered}

Un opérateur très utile pour faire correspondre les valeurs et pour évaluer rapidement si une valeur se trouve dans un vecteur ou une trame de données:

```{r}
mon_vecteur <- c("a", "b", "c", "d")
```

```{r}
"a" %in% mon_vecteur
"h" %in% mon_vecteur
```

Pour demander si une valeur n'est **pas** `%in%` un vecteur, placez un point d'exclamation (!) **devant** l'instruction logique:

```{r}
# Pour nier, mettre une exclamation devant:
!"a" %in% mon_vecteur
!"h" %in% mon_vecteur
```

`%in%` est très utile lors de l'utilisation de la fonction **dplyr** `case_when()`. Vous pouvez définir un vecteur précédemment, puis le référencer ultérieurement. Par exemple:

```{r eval=F}
affirmative <- c("1", "Yes", "YES", "yes", "y", "Y", "oui", "Oui", "Si")

linelist <- linelist %>% 
  mutate(enfant_hospitalise = case_when(
    hospitalise %in% affirmative & age < 18 ~ "Hospitalized Child",
    TRUE                                    ~ "Not"))
```

Remarque: Si vous souhaitez détecter une chaîne partielle, en utilisant peut-être `str_detect()` de **stringr**, il n'acceptera pas un vecteur de caractères tel que `c("1", "Oui", "oui", "y ")`. Au lieu de cela, il doit recevoir une *expression régulière* - une chaîne condensée avec des barres OU, telle que "1\|Oui\|oui\|y". Par exemple, `str_detect(hospitalisé, "1|Oui|oui|y")`. Voir la page sur les $$Characters and strings$$ pour plus d'informations.

Vous pouvez convertir un vecteur de caractères en une expression régulière nommée avec cette commande:

```{r}
affirmative <- c("1", "Yes", "YES", "yes", "y", "Y", "oui", "Oui", "Si")
affirmative

# Condenser à: 
affirmative_str_search <- paste0(affirmative, collapse = "|")  # option avec R de base
affirmative_str_search <- str_c(affirmative, collapse = "|")   # option avec le paquet stringr

affirmative_str_search
```

<!-- ======================================================= -->

<!-- ======================================================= -->

<!-- ======================================================= -->

## Erreurs et avertissements

Cette section explique :

-   La différence entre les erreurs et les avertissements\
-   Conseils généraux de syntaxe pour l'écriture de code R\
-   Aides au code

Les erreurs et avertissements courants ainsi que des conseils de dépannage sont disponibles sur la page $$Errors and help$$.

<!-- ======================================================= -->

### Erreur contre avertissement {.unnumbered}

Lorsqu'une commande est exécutée, la console R peut afficher des messages d'avertissement ou d'erreur en texte rouge.

-   Un **avertissement** signifie que R a terminé votre commande, mais a dû prendre des mesures supplémentaires ou a produit une sortie inhabituelle dont vous devez être conscient.

-   Une **erreur** signifie que R n'a pas pu terminer votre commande.

Cherchez des indices:

-   Le message d'erreur/d'avertissement inclura souvent un numéro de ligne pour le problème.

-   Si un objet "est inconnu" ou "introuvable", vous l'avez peut-être mal orthographié, vous avez oublié d'appeler un package avec library() ou vous avez oublié de relancer votre script après avoir apporté des modifications.

Si tout le reste échoue, copiez le message d'erreur dans Google avec quelques termes clés - il y a de fortes chances que quelqu'un d'autre ait déjà travaillé dessus!

<!-- ======================================================= -->

### Conseils généraux sur la syntaxe {.unnumbered}

Quelques points à retenir lors de l'écriture de commandes dans R, pour éviter les erreurs et les avertissements:

-   Fermez toujours les parenthèses - astuce: comptez le nombre de "(" et de parenthèses fermantes ")" pour chaque bloc de code
-   Évitez les espaces dans les noms de colonnes et d'objets. Utilisez le trait de soulignement ( \_ ) ou les points ( . ) à la place
-   Gardez une trace et n'oubliez pas de séparer les arguments d'une fonction par des virgules
-   R est sensible à la casse, ce qui signifie que `Variable_A` est *différent* de `Variable_a`

<!-- ======================================================= -->

### Aides au code {.unnumbered}

N'importe quel script (RMarkdown ou autre) donnera des indices lorsque vous avez fait une erreur. Par exemple, si vous avez oublié d'écrire une virgule là où c'est nécessaire, ou de fermer une parenthèse, RStudio lèvera un drapeau sur cette ligne, sur le côté droit du script, pour vous avertir.
```{r include=FALSE, cache=FALSE}

# clear workspace
rm(list = ls(all = TRUE))

# clear all packages except base
#lapply(names(sessionInfo()$loadedOnly), require, character.only = TRUE)
#invisible(lapply(paste0('package:', names(sessionInfo()$otherPkgs)), detach, character.only=TRUE, unload=TRUE, force=TRUE))

# to ensure that tidyverse packages prevail
filter <- dplyr::filter
select <- dplyr::select
summarise <- dplyr::summarise
summary <- base::summary
incidence <- incidence2::incidence

#load core packages
pacman::p_load(
     rio,
     here,
     DT,
     stringr,
     lubridate,
     tidyverse
)

# import the cleaned ebola linelist
linelist <- rio::import(here::here("data", "case_linelists", "linelist_cleaned.rds"))

# import the count data - facility level
#count_data <- rio::import(here::here("data", "facility_count_data.rds"))

# Settings

options(scipen=1, digits=7)

# print only text (not code)
# library(knitr)
# opts_chunk$set(list(echo = FALSE, eval = FALSE))
```

<!--chapter:end:new_pages/basics.Rmd-->


# Transition to R { }  

Placeholder


## From Excel  
### Benefits {.unnumbered}  
### Tidy data {.unnumbered}  
### Functions {.unnumbered}  
### Scripts {.unnumbered}  
### Excel-to-R resources {.unnumbered}
### R-Excel interaction {.unnumbered}  
## From Stata  
## From SAS  
## Data interoperability  

<!--chapter:end:new_pages/transition_to_R.Rmd-->


# Paquets conseillés {#suggested_packages}

Placeholder


## Paquets disponibles sur le CRAN
## Paquets hébergés sur Github 

<!--chapter:end:new_pages/packages_suggested.Rmd-->


# R projects {}  

Placeholder


## Suggested use  
## Creating an R project {}
### Switch projects {.unnumbered}
### Settings {.unnumbered}  
### Organization {.unnumbered}  
### Version control {.unnumbered}  
## Examples  
## Resources {}

<!--chapter:end:new_pages/r_projects.Rmd-->


# Importer et exporter des données {#import_export}

Placeholder


## Overview
## The **rio** package {}  
## The **here** package {#here}
## File paths  
### "Relative" file paths {.unnumbered}
### "Absolute" file paths {.unnumbered}  
### Select file manually {.unnumbered}
## Import data  
### Specific Excel sheets {.unnumbered}
### Missing values {#import_missing .unnumbered} 
### Skip rows {.unnumbered} 
### Manage a second header row {.unnumbered}  
#### Remove the second header row {.unnumbered}  
#### Make a data dictionary {.unnumbered}  
#### Combine the two header rows {.unnumbered}  
### Google sheets {.unnumbered}
## Multiple files - import, export, split, combine  
## Import from Github {#import_github}
### CSV files {.unnumbered}  
### XLSX files {.unnumbered}  
### Shapefiles {.unnumbered} 
## Manual data entry {}
### Entry by rows {.unnumbered}  
### Entry by columns {.unnumbered}  
### Pasting from clipboard {.unnumbered}  
## Import most recent file  
### Dates in file name {.unnumbered}  
### Use the file info {.unnumbered}  
## APIs {#import_api}
### HTTP request {.unnumbered}  
### Packages {.unnumbered}  
### Publicly-available data {.unnumbered}  
### Authentication required {.unnumbered}  
## Export {}  
### With **rio** package {.unnumbered}
### To clipboard {.unnumbered}
## RDS files {#import_rds}
## Rdata files and lists {#import_rdata}
## Saving plots {} 
## Resources {} 

<!--chapter:end:new_pages/importing.Rmd-->

# (PART) Data Management {.unnumbered}
```{r include=FALSE, cache=FALSE}

# clear workspace
rm(list = ls(all = TRUE))

# clear all packages except base
#lapply(names(sessionInfo()$loadedOnly), require, character.only = TRUE)
#invisible(lapply(paste0('package:', names(sessionInfo()$otherPkgs)), detach, character.only=TRUE, unload=TRUE, force=TRUE))

# to ensure that tidyverse packages prevail
filter <- dplyr::filter
select <- dplyr::select
summarise <- dplyr::summarise
summary <- base::summary
incidence <- incidence2::incidence

#load core packages
pacman::p_load(
     rio,
     here,
     DT,
     stringr,
     lubridate,
     tidyverse
)

# import the cleaned ebola linelist
linelist <- rio::import(here::here("data", "case_linelists", "linelist_cleaned.rds"))

# import the count data - facility level
#count_data <- rio::import(here::here("data", "facility_count_data.rds"))

# Settings

options(scipen=1, digits=7)

# print only text (not code)
# library(knitr)
# opts_chunk$set(list(echo = FALSE, eval = FALSE))
```

<!--chapter:end:new_pages/cat_data_management.Rmd-->


# Nettoyer les données et fonctions essentielles {#cleaning_data}

Placeholder


### Core functions {.unnumbered}  
### Nomenclature {.unnumbered}  
## Cleaning pipeline {#cleaning_pipeline}
## Load packages  
## Import data  
### Import {.unnumbered}  
### Review {.unnumbered}  
## Column names {} 
### Labels {.unnumbered}  
### Automatic cleaning {.unnumbered}  
### Manual name cleaning {.unnumbered}  
#### Rename by column position {.unnumbered} 
#### Rename via `select()` and `summarise()` {.unnumbered}  
### Other challenges {.unnumbered}  
#### Empty Excel column names {.unnumbered} 
#### Merged Excel column names and cells {.unnumbered}  
## Select or re-order columns {} 
### Keep columns {.unnumbered}  
### "tidyselect" helper functions {#clean_tidyselect .unnumbered}  
### Remove columns {.unnumbered} 
### Standalone {.unnumbered}
#### Add to the pipe chain {.unnumbered}  
## Deduplication
## Column creation and transformation { }
### New columns {.unnumbered}
### Convert column class {.unnumbered}
### Grouped data {.unnumbered}  
### Transform multiple columns {#clean_across .unnumbered}
#### `across()` column selection {.unnumbered}  
#### `across()` functions {.unnumbered}
### `coalesce()` {.unnumbered}  
### Cumulative math {.unnumbered}
### Using **base** R {.unnumbered}  
### Add to pipe chain {.unnumbered}  
## Re-code values
### Specific values {.unnumbered}  
### By logic {.unnumbered}
### Simple logic {.unnumbered}  
#### `replace()` {.unnumbered}  
#### `ifelse()` and `if_else()` {.unnumbered}  
### Complex logic {#clean_case_when .unnumbered}  
### Missing values {.unnumbered} 
### Cleaning dictionary {.unnumbered}
#### Add to pipe chain {.unnumbered}  
## Numeric categories {#num_cats}
### Review distribution {.unnumbered}
### `age_categories()` {.unnumbered}
### `cut()` {.unnumbered}
### Quantile breaks {.unnumbered}  
### Evenly-sized groups {.unnumbered}  
### `case_when()` { .unnumbered}
### Add to pipe chain {.unnumbered}  
## Add rows  
### One-by-one {.unnumbered}  
### Bind rows {.unnumbered}  
## Filter rows {  }
### Simple filter {.unnumbered} 
### Filter out missing values {.unnumbered}  
### Filter by row number {.unnumbered}  
### Complex filter {.unnumbered} 
#### Examine the data  {.unnumbered}  
#### How filters handle missing numeric and date values {.unnumbered}  
#### Design the filter {.unnumbered}  
### Standalone {.unnumbered}  
### Quickly review records {.unnumbered} 
#### Add to pipe chain {.unnumbered}  
## Row-wise calculations  
## Arrange and sort  

<!--chapter:end:new_pages/cleaning.Rmd-->


# Manipuler les dates {#working_dates}

Placeholder


## Preparation
### Load packages {.unnumbered}  
### Import data {.unnumbered}  
## Current date  
## Convert to Date  
### **base** R {.unnumbered}  
### **lubridate** {.unnumbered}  
### Combine columns {.unnumbered}  
## Excel dates
## Messy dates  
## Working with date-time class  
### Convert dates with times {.unnumbered}  
### Convert times alone {.unnumbered}  
### Extract time {.unnumbered}  
## Working with dates   
### Extract date components {.unnumbered}  
### Date math {.unnumbered}  
### Date intervals {.unnumbered}  
## Date display  
### `format()` {.unnumbered}  
### Month-Year {.unnumbered}  
## Epidemiological weeks {#dates_epi_wks}
### **lubridate** {.unnumbered}  
### Weekly counts {.unnumbered}  
### Epiweek alternatives {.unnumbered}  
## Converting dates/time zones
## Lagging and leading calculations  
## Resources  

<!--chapter:end:new_pages/dates.Rmd-->


# Characters and strings {#character_strings}  

Placeholder


## Preparation { }
### Load packages {.unnumbered}  
### Import data  {.unnumbered}  
## Unite, split, and arrange { }
### Combine strings {.unnumbered}
### Dynamic strings {.unnumbered}
### Unite columns  {#str_unite .unnumbered}
### Split {.unnumbered}  
### Split columns {.unnumbered}  
### Arrange alphabetically {.unnumbered} 
### base R functions {.unnumbered}
## Clean and standardise  
### Change case {.unnumbered}
### Pad length  {#str_pad .unnumbered}
### Truncate {.unnumbered} 
### Standardize length {.unnumbered}
### Remove leading/trailing whitespace {.unnumbered}  
### Remove repeated whitespace within {.unnumbered}  
### Wrap into paragraphs {.unnumbered}  
## Handle by position { }
### Extract by character position {.unnumbered}  
### Extract by word position {.unnumbered} 
### Replace by character position {.unnumbered} 
### Evaluate length  {.unnumbered}
## Patterns { }
### Detect a pattern {.unnumbered}
#### Convert commas to periods {.unnumbered}  
### Replace all {.unnumbered}  
### Detect within logic {.unnumbered}
### Locate pattern position {.unnumbered}  
### Extract a match {.unnumbered}  
### Subset and count {.unnumbered}  
### Regex groups {.unnumbered}
## Special characters  
## Regular expressions (regex) 
## Regex and special characters { } 
## Resources { }

<!--chapter:end:new_pages/characters_strings.Rmd-->


# Factors {}

Placeholder


## Preparation  
### Load packages {.unnumbered}  
### Import data {.unnumbered}  
### New categorical variable {#fct_newcat .unnumbered}  
#### Create column {.unnumbered}  
#### Default value order {.unnumbered}  
## Convert to factor  
## Add or drop levels  
### Add {#fct_add .unnumbered}
### Drop {.unnumbered}  
## Adjust level order {#fct_adjust} 
### Manually {.unnumbered} 
### Within a plot {.unnumbered}  
### Reverse {.unnumbered}  
### By frequency {.unnumbered}  
### By appearance {.unnumbered}  
### By summary statistic of another column {.unnumbered}  
### By "end" value {.unnumbered}  
## Missing values {#fct_missing}  
## Combine levels  
### Manually {.unnumbered}  
### Reduce into "Other" {.unnumbered}  
### Reduce by frequency {.unnumbered}
## Show all levels  
### In plots {.unnumbered}  
### In tables {.unnumbered}  
## Epiweeks  
### Epiweeks in a plot {.unnumbered}  
### Epiweeks in the data {.unnumbered}  
## Resources {} 

<!--chapter:end:new_pages/factors.Rmd-->


# Restructurer les données {#pivoting_data}

Placeholder


## Étapes préliminaires {#pivot_prep_data}
### Importation des paquets {.unnumbered}  
### Importation des données {.unnumbered}
### Cas de Malaria {-}  
### Linelist des cas {-}  
## Transformation du format large vers long {}
### Le format "large" {.unnumbered}
### `pivot_longer()` {.unnumbered}
### Transformation simple {.unnumbered}  
### Transformer les données de plusieurs classes {.unnumbered}
## Transformation du format long en large {}
### Données utilisées {.unnumbered}
### `pivot_wider()` {.unnumbered}  
## Remplissage des colonnes 
### Données {.unnumbered}
### `fill()` {.unnumbered}
## Resources  

<!--chapter:end:new_pages/pivoting.Rmd-->


# Travailler sur des données groupées {#grouping_data}  

Placeholder


## Étapes préliminaires {  }
### Importation des paquets {.unnumbered}  
### Import des données {.unnumbered}
## Grouper des données {  }
### Groupes distincts {.unnumbered}  
### Nouvelle colonne {.unnumbered} 
### Grouper selon plus ou moins de colonnes {.unnumbered}  
### Conserver tous les groupes {.unnumbered} 
## Dégrouper les données
## Résumer les données par groupe {#group_summarise} 
## Comptes et additions  
### `tally()` {.unnumbered}  
### `count()`  {.unnumbered}  
### Ajouter des colonnes contenant les décomptes {.unnumbered}  
### Ajouter les totaux {.unnumbered} 
## Grouper par date 
### Grouper par jours (linelist) {.unnumbered}  
### Grouper par semaines (linelist) {.unnumbered}  
### Grouper par mois (linelist){.unnumbered}
### Comptes journaliers en semaines (données agrégées) {.unnumbered}
#### Comptes journaliers en mois (données agrégées) {.unnumbered}
## Trier les données groupées
## Filtrer les données groupées
### `filter()` {.unnumbered}
### `slice()` {.unnumbered} 
### Filtrer sur la taille des groupes {#group_filter_grp_size .unnumbered} 
## `mutate()` 
## `select()` sur les données groupées
## Resources {  }

<!--chapter:end:new_pages/grouping.Rmd-->


# Joining data { }  

Placeholder


## Preparation { }
### Load packages {.unnumbered}
### Import data {.unnumbered}
### Example datasets {.unnumbered}
#### "Miniature" case linelist {#joins_llmini .unnumbered}  
#### Hospital information data frame {#joins_hosp_info .unnumbered}  
### Pre-cleaning {.unnumbered}
## **dplyr** joins { }
### General syntax {.unnumbered}
### Left and right joins {.unnumbered}  
#### "Should I use a right join, or a left join?" {.unnumbered}  
### Full join {.unnumbered} 
### Inner join {.unnumbered} 
### Semi join {.unnumbered} 
### Anti join {.unnumbered} 
#### Simple `anti_join()` example {.unnumbered}  
#### Complex `anti_join()` example {.unnumbered}  
## Probabalistic matching { }
### Probabilistic matching {.unnumbered}  
### Probabilistic deduplication {.unnumbered}  
## Binding and aligning  
### Bind rows {.unnumbered}
### Bind columns {.unnumbered}
#### Use `match()` to align ordering {.unnumbered}  
## Resources { }

<!--chapter:end:new_pages/joining_matching.Rmd-->


# De-duplication {#deduplication}  

Placeholder


## Preparation { }
### Load packages {.unnumbered}
### Import data {.unnumbered}
#### Here is the data frame {#dedup_data .unnumbered}  
## Deduplication { }
### Examine duplicate rows {.unnumbered}  
### Keep only unique rows  {.unnumbered}
### Deduplicate elements in a vector {.unnumbered}  
### Using **base** R {.unnumbered}
## Slicing { }
### Slice with groups  {.unnumbered}
### Keep all but mark them  {.unnumbered}
### Calculate row completeness {.unnumbered} 
## Roll-up values {#str_rollup}
### Roll-up values into one row {.unnumbered}  
### Overwrite values/hierarchy {.unnumbered} 
## Probabilistic de-duplication  
## Resources { }

<!--chapter:end:new_pages/deduplication.Rmd-->


# Iteration, loops, and lists { }  

Placeholder


## Preparation {  }
### Load packages {.unnumbered}  
### Import data {.unnumbered}  
## *for loops* {  }
### *for loops* in R {#iter_loops .unnumbered}  
### Core components {.unnumbered}   
### Sequence {.unnumbered}  
### Operations  {.unnumbered}  
### Container {.unnumbered}
### Printing {.unnumbered}  
### Testing your for loop {.unnumbered}
### Looping plots {.unnumbered}
### Tracking progress of a loop {.unnumbered} 
## **purrr** and lists {#iter_purrr}
### Load packages {.unnumbered}  
### `map()` {.unnumbered}  
#### Example - import and combine Excel sheets {#iter_combined .unnumbered}  
### Split dataset and export {.unnumbered}  
#### Split dataset {.unnumbered}  
##### More than one `group_split()` column {.unnumbered}  
#### Export as Excel sheets {.unnumbered}  
#### Export as CSV files {.unnumbered}  
### Custom functions {.unnumbered}  
### Mapping a function across columns {.unnumbered}  
### Extract from lists {.unnumbered}  
#### Names of elements {.unnumbered}  
#### Elements by name or position {.unnumbered}  
#### `pluck()` {.unnumbered}  
### Convert list to data frame {.unnumbered}  
### Discard, keep, and compact lists {.unnumbered}  
### `pmap()` {.unnumbered}
## Apply functions  
## Resources { }

<!--chapter:end:new_pages/iteration.Rmd-->

# (PART) Analysis {.unnumbered}

```{r include=FALSE, cache=FALSE}

# clear workspace
rm(list = ls(all = TRUE))

# clear all packages except base
#lapply(names(sessionInfo()$loadedOnly), require, character.only = TRUE)
#invisible(lapply(paste0('package:', names(sessionInfo()$otherPkgs)), detach, character.only=TRUE, unload=TRUE, force=TRUE))

# to ensure that tidyverse packages prevail
filter <- dplyr::filter
select <- dplyr::select
summarise <- dplyr::summarise
summary <- base::summary
incidence <- incidence2::incidence

#load core packages
pacman::p_load(
     rio,
     here,
     DT,
     stringr,
     lubridate,
     tidyverse
)

# import the cleaned ebola linelist
linelist <- rio::import(here::here("data", "case_linelists", "linelist_cleaned.rds"))

# import the count data - facility level
#count_data <- rio::import(here::here("data", "facility_count_data.rds"))

# Settings

options(scipen=1, digits=7)

# print only text (not code)
# library(knitr)
# opts_chunk$set(list(echo = FALSE, eval = FALSE))
```

<!--chapter:end:new_pages/cat_analysis.Rmd-->


# Descriptive tables {#descriptive_tables}

Placeholder


## Preparation {  }
### Load packages {.unnumbered}
### Import data {.unnumbered}
## Browse data {  }
### **skimr** package {.unnumbered}
### Summary statistics {.unnumbered} 
## **janitor** package {#tbl_janitor}  
### Simple tabyl {.unnumbered}  
### Cross-tabulation {.unnumbered}  
### "Adorning" the tabyl {#tbl_adorn .unnumbered}  
### Printing the tabyl {.unnumbered}
### Use on other tables {.unnumbered}  
### Saving the tabyl {.unnumbered}  
### Statistics {#janitor_age_out_stats .unnumbered}  
### Other tips {.unnumbered}  
## **dplyr** package   
### Get counts {.unnumbered}  
### Show all levels {.unnumbered}  
### Proportions {#tbl_dplyr_prop .unnumbered}  
### Plotting {.unnumbered}  
### Summary statistics {.unnumbered}  
### Conditional statistics {.unnumbered}  
### Glueing together {.unnumbered}  
#### Percentiles {.unnumbered}  
### Summarise aggregated data {.unnumbered}  
### `across()` multiple columns {.unnumbered}  
### Pivot wider {#tbls_pivot_wider .unnumbered}
### Total rows {#tbl_dplyr_totals .unnumbered}  
#### **janitor**'s `adorn_totals()` {.unnumbered}  
#### `summarise()` on "total" data and then `bind_rows()` {.unnumbered}  
## **gtsummary** package {#tbl_gt}   
### Summary table {.unnumbered}
### Adjustments {.unnumbered}  
### Multi-line stats for continuous variables {.unnumbered}  
## **base** R   
### Proportions {.unnumbered}  
### Totals {.unnumbered}  
### Convert to data frame {.unnumbered}  
## Resources {  }

<!--chapter:end:new_pages/tables_descriptive.Rmd-->


# Simple statistical tests { }

Placeholder


## Preparation {  }
### Load packages {.unnumbered}
### Import data {.unnumbered}
## **base** R {}
### T-tests {.unnumbered} 
### Shapiro-Wilk test {.unnumbered}  
### Wilcoxon rank sum test {.unnumbered}
### Kruskal-Wallis test {.unnumbered}
### Chi-squared test {.unnumbered} 
## **rstatix** package {}
### Summary statistics {.unnumbered}  
### T-test {.unnumbered}  
### Shapiro-Wilk test {.unnumbered}  
### Wilcoxon rank sum test {.unnumbered}  
### Kruskal-Wallis test {.unnumbered}  
### Chi-squared test {.unnumbered}  
## `gtsummary` package {#stats_gt}
### Chi-squared test {.unnumbered}
### T-tests {.unnumbered} 
### Wilcoxon rank sum test{.unnumbered}
### Kruskal-wallis test {.unnumbered}
## Correlations 
## Resources {  }

<!--chapter:end:new_pages/stat_tests.Rmd-->


# Univariate and multivariable regression { }

Placeholder


## Preparation {  }
### Load packages {.unnumbered}
### Import data {.unnumbered}
### Clean data {.unnumbered}
#### Store explanatory variables {.unnumbered}  
#### Convert to 1's and 0's  {.unnumbered}   
#### Drop rows with missing values {.unnumbered}  
## Univariate {  }
### **base** R {.unnumbered}
#### Linear regression {.unnumbered}  
#### Logistic regression {.unnumbered}  
#### Univariate `glm()` {.unnumbered}
#### Printing results {.unnumbered}
#### Looping multiple univariate models {.unnumbered}  
### **gtsummary** package {#reg_gt_uni .unnumbered}
## Stratified {  }
## Multivariable  
### Conduct multivariable {.unnumbered}  
#### Building the model {.unnumbered}  
### Combine univariate and multivariable {.unnumbered}
#### Combine with **gtsummary**  {.unnumbered}  
#### Combine with **dplyr** {.unnumbered}  
## Forest plot {  }
### **ggplot2** package {.unnumbered}
### **easystats** packages {.unnumbered}
## Resources {  }

<!--chapter:end:new_pages/regression.Rmd-->


# Données manquantes { }

Placeholder


## Étapes préliminaires { }
### Importation des paquets {.unnumbered}  
### Importation des données {.unnumbered}
### Conversion des données manquantes lors de l'import {.unnumbered}  
## Valeurs manquantes dans R { }
### `NA` {.unnumbered}  
### `NA` et ses dérivés {.unnumbered}  
### `NULL` {.unnumbered}  
### `NaN` {.unnumbered}  
### `Inf` {.unnumbered}  
### Exemples {.unnumbered}  
## Fonctions utiles { }
### `is.na()` et `!is.na()` {.unnumbered}  
### `na.omit()` {.unnumbered}  
### `drop_na()` {.unnumbered}  
### `na.rm = TRUE` {.unnumbered}  
## Identifier les valeurs manquantes dans un dataframe { }
### Quantifier les données manquantes {.unnumbered}
### Visualiser les données manquantes {.unnumbered}  
### Explorer et visualiser les relations entre données manquantes{.unnumbered} 
### Colonnes "fantômes" {.unnumbered}
## Using data with missing values  
### Filter out rows with missing values {.unnumbered}
### Handling `NA` in `ggplot()` {.unnumbered}
### `NA` in factors {.unnumbered}
## Imputation { }
### Types of missing data {.unnumbered}
### Useful packages {.unnumbered}
### Mean Imputation {.unnumbered}
### Regression imputation {.unnumbered}
### LOCF and BOCF {.unnumbered}
### Multiple Imputation {.unnumbered}
## Resources { }

<!--chapter:end:new_pages/missing_data.Rmd-->


# Standardised rates {#standardisation}  

Placeholder


## Overview  
## Preparation {  }
### Load packages {.unnumbered}
### Load population data {.unnumbered}  
### Load death counts {.unnumbered}  
### Clean populations and deaths {.unnumbered}  
### Load reference population {.unnumbered}  
### Clean reference population {.unnumbered}
### Create dataset with standard population {#standard_all .unnumbered}  
## **dsr** package {  }
### Standardized rates {.unnumbered}
### Standardized rate ratios {.unnumbered}
### Standardized rate difference {.unnumbered}
## **PHEindicatormethods** package {#standard_phe  }
### Directly standardized rates {.unnumbered}
### Indirectly standardized rates {#standard_indirect .unnumbered}
## Resources {  }

<!--chapter:end:new_pages/standardization.Rmd-->


# Moving averages { }  

Placeholder


## Preparation {  }
### Load packages {.unnumbered}
### Import data {.unnumbered}
## Calculate with **slider** {  }
### Rolling by date  {#roll_index .unnumbered}  
### Indexed data {.unnumbered}  
### Rolling by group {#roll_slider_group .unnumbered}  
## Calculate with **tidyquant** within `ggplot()` {  }
## Resources {  }

<!--chapter:end:new_pages/moving_average.Rmd-->


# Time series and outbreak detection {#time_series}  

Placeholder


## Overview {  }
## Preparation {  }
### Packages {.unnumbered}
### Load data {.unnumbered}
### Clean data {.unnumbered}
### Download climate data {.unnumbered} 
### Load climate data {.unnumbered}
## Time series data {  }
### Duplicates {.unnumbered}
### Missings {.unnumbered}
## Descriptive analysis {  }
### Moving averages {#timeseries_moving .unnumbered}
### Periodicity {.unnumbered}
### Decomposition {.unnumbered}
### Autocorrelation {.unnumbered}
## Fitting regressions {  }
### Fourier terms {.unnumbered}
### Negative binomial {.unnumbered}
### Residuals {.unnumbered}
## Relation of two time series {  }
### Merging datasets {.unnumbered}
### Descriptive analysis {.unnumbered}
### Lags and cross-correlation {.unnumbered}
### Negative binomial with two variables {.unnumbered}
#### Residuals {.unnumbered}
## Outbreak detection {  }
### **trending** package {.unnumbered}
#### Cut-off date { -}
#### Add rows {.unnumbered}
#### Fourier terms {.unnumbered}
#### Split data and fit regression {.unnumbered}
#### Prediction validation {.unnumbered}
### **surveillance** package {.unnumbered}
#### Farrington method {.unnumbered}
#### GLRNB method {.unnumbered}
## Interrupted timeseries {  }
## Resources {  }

<!--chapter:end:new_pages/time_series.Rmd-->


# Epidemic modeling { }  

Placeholder


## Overview {  }
## Preparation {  }
## Estimating R<sub>t</sub> {  }
### EpiNow2 vs. EpiEstim {.unnumbered}
### EpiNow2 {.unnumbered}
#### Estimating delay distributions {.unnumbered}
#### Running **EpiNow2** {.unnumbered}
#### Analysing outputs {.unnumbered}
### EpiEstim {.unnumbered}
#### Using serial interval estimates from the literature {.unnumbered}
#### Using serial interval estimates from the data {.unnumbered}
#### Specifying estimation time windows {.unnumbered}
#### Analysing outputs {.unnumbered}
## Projecting incidence {  }
### EpiNow2 {.unnumbered}
### projections {.unnumbered}
#### Using serial interval estimates from the literature {.unnumbered}
#### Using serial interval estimates from the data {.unnumbered}
#### Projecting incidence {.unnumbered}
## Resources {  }

<!--chapter:end:new_pages/epidemic_models.Rmd-->


# Contact tracing {#contact_tracing}

Placeholder


## Preparation
### Load packages {.unnumbered}  
### Import data {.unnumbered}
#### Case data {.unnumbered}  
#### Contacts data {.unnumbered}  
#### Follow-up data {.unnumbered}  
#### Relationships data {.unnumbered}  
## Descriptive analyses  
### Demographics {.unnumbered}  
#### Age and Gender of contacts {.unnumbered}  
### Contacts per case {.unnumbered}  
## Contact Follow Up  
### Data cleaning {.unnumbered}  
### Plot over time {.unnumbered}  
### Daily individual tracking  {.unnumbered}  
### Analyse by group {.unnumbered}  
## KPI Tables  
## Transmission Matrices  
## Resources  

<!--chapter:end:new_pages/contact_tracing.Rmd-->


# Survey analysis {#survey_analysis}  

Placeholder


## Overview {  }
## Preparation {  }
### Packages {.unnumbered}
### Load data {.unnumbered}
### Clean data {.unnumbered}
## Survey data {  }
## Observation time {  }
## Weighting {  }
## Survey design objects {  }
### **Survey** package  
### **Srvyr** package  
## Descriptive analysis {  }
### Sampling bias 
### Demographic pyramids 
### Alluvial/sankey diagram
## Weighted proportions {  }
### **Survey** package 
### **Srvyr** package 
### **Sitrep** package 
### **Gtsummary** package
## Weighted ratios {  }
### **Survey** package 
### **Srvyr** package 
## Resources {  }

<!--chapter:end:new_pages/survey_analysis.Rmd-->


# Survival analysis { }  

Placeholder


## Overview {}
## Preparation {  }
### Load packages {.unnumbered}  
### Import dataset {.unnumbered}  
### Data management and transformation {.unnumbered}
## Basics of survival analysis {}
### Building a surv-type object {.unnumbered}
### Running initial analyses {.unnumbered}
### Cumulative hazard {.unnumbered}  
### Plotting Kaplan-Meir curves  {.unnumbered}
## Comparison of survival curves 
### Log rank test {.unnumbered}
## Cox regression analysis {}
### Fitting a Cox model {.unnumbered}
### Forest plots {.unnumbered}
## Time-dependent covariates in survival models {}
### Time-dependent covariate setup {.unnumbered} 
#### Add unique patient identifier {.unnumbered}  
#### Expand patient rows {.unnumbered}  
### Cox regression with time-dependent covariates {.unnumbered} 
## Resources {  }

<!--chapter:end:new_pages/survival_analysis.Rmd-->


# GIS basics {#gis}  

Placeholder


## Overview {  }
## Key terms {}  
### GIS software {.unnumbered}
### Spatial data {.unnumbered}
### Visualizing spatial data {.unnumbered}
## Getting started with GIS  
### Types of maps for visualizing your data {.unnumbered}
## Preparation {  }
### Load packages {.unnumbered}  
### Sample case data {.unnumbered}
### Admin boundary shapefiles {.unnumbered}  
### Population data {.unnumbered}  
### Health Facilities {.unnumbered}
## Plotting coordinates {  }
## Spatial joins {}
### Points in polygon {.unnumbered}
### Nearest neighbor {.unnumbered}
### Buffers {.unnumbered} 
### Other spatial joins {.unnumbered}  
## Choropleth maps {}  
## Mapping with ggplot2
## Basemaps { }
### OpenStreetMap {.unnumbered} 
## Contoured density heatmaps {}
### Time series heatmap {.unnumbered}
## Spatial statistics
### Spatial relationships {.unnumbered}  
### Spatial autocorrelation {.unnumbered}  
### Spatial regression {.unnumbered}  
## Resources {  }

<!--chapter:end:new_pages/gis.Rmd-->

# (PART) Data Visualization {.unnumbered}
```{r include=FALSE, cache=FALSE}

# clear workspace
rm(list = ls(all = TRUE))

# clear all packages except base
#lapply(names(sessionInfo()$loadedOnly), require, character.only = TRUE)
#invisible(lapply(paste0('package:', names(sessionInfo()$otherPkgs)), detach, character.only=TRUE, unload=TRUE, force=TRUE))

# to ensure that tidyverse packages prevail
filter <- dplyr::filter
select <- dplyr::select
summarise <- dplyr::summarise
summary <- base::summary
incidence <- incidence2::incidence

#load core packages
pacman::p_load(
     rio,
     here,
     DT,
     stringr,
     lubridate,
     tidyverse
)

# import the cleaned ebola linelist
linelist <- rio::import(here::here("data", "case_linelists", "linelist_cleaned.rds"))

# import the count data - facility level
#count_data <- rio::import(here::here("data", "facility_count_data.rds"))

# Settings

options(scipen=1, digits=7)

# print only text (not code)
# library(knitr)
# opts_chunk$set(list(echo = FALSE, eval = FALSE))
```

<!--chapter:end:new_pages/cat_data_viz.Rmd-->


# Tables for presentation {#presentation_tables}  

Placeholder


## Preparation {  }
### Load packages {.unnumbered} 
### Import data {.unnumbered}  
### Prepare table {.unnumbered}  
## Basic flextable {  }
### Create a flextable {.unnumbered}  
### Column width {.unnumbered}
### Column headers {.unnumbered}
### Borders and background {.unnumbered}  
### Font and alignment {.unnumbered}
### Merge cells {.unnumbered}  
### Background color {.unnumbered}
## Conditional formatting {  }
## All code together {#tbl_pres_all}  
## Saving your table {  }
### Save single table {.unnumbered}
### Print table in R markdown {.unnumbered}  
## Resources {  }

<!--chapter:end:new_pages/tables_presentation.Rmd-->


# ggplot basics {#ggplot_basics}

Placeholder


## Preparation {}
### Load packages {.unnumbered}
### Import data {.unnumbered}  
### General cleaning {.unnumbered}
### Pivoting longer {.unnumbered}
## Basics of ggplot {}
## `ggplot()`  
## Geoms  
## Mapping data to the plot {#ggplot_basics_mapping}  
### Plot aesthetics {.unnumbered}  
### Set to a static value {.unnumbered}  
### Scaled to column values {.unnumbered}  
### Where to make mapping assignments {#ggplot_basics_map_loc .unnumbered}
### Groups {#ggplotgroups .unnumbered}  
## Facets / Small-multiples {#ggplot_basics_facet}  
### `facet_wrap()` {.unnumbered}
### `facet_grid()` {.unnumbered}  
### Free or fixed axes {.unnumbered}  
### Factor level order in facets {.unnumbered}  
## Storing plots  
### Saving plots {.unnumbered}
### Modifying saved plots {.unnumbered}  
### Exporting plots {.unnumbered}   
## Labels 
## Themes {#ggplot_basics_themes} 
### Complete themes {.unnumbered}  
### Modify theme {.unnumbered}  
## Colors  
## Piping into **ggplot2**   
## Plot continuous data
### Histograms {.unnumbered}
### Box plots {.unnumbered}
### Violin, jitter, and sina plots {.unnumbered}
### Two continuous variables  {.unnumbered}
### Three continuous variables {.unnumbered}  
## Plot categorical data  
### Preparation  {.unnumbered}
#### Data structure {.unnumbered}  
#### Column class and value ordering {.unnumbered}  
### `geom_bar()` {#ggplot_basics_bars .unnumbered}  
### `geom_col()` {.unnumbered}  
### `geom_histogram()` {.unnumbered}  
## Resources  

<!--chapter:end:new_pages/ggplot_basics.Rmd-->


# ggplot tips {}

Placeholder


## Preparation {}
### Load packages {.unnumbered}
### Import data {.unnumbered}  
## Scales for color, fill, axes, etc. {#ggplot_tips_colors}
### Color schemes
### Scales {#ggplot_tips_scales .unnumbered}  
### Scale arguments {.unnumbered}  
### Manual adjustments {.unnumbered}  
### Continuous axes scales {.unnumbered}  
#### Display percents {.unnumbered}  
#### Log scale {.unnumbered}  
### Gradient scales {.unnumbered}  
### Palettes {.unnumbered}  
#### Colorbrewer and Viridis {.unnumbered}
## Change order of discrete variables {}  
#### **ggthemr** {.unnnumbered}  
## Contour lines  
## Marginal distributions  
## Smart Labeling {}  
## Time axes {}
## Highlighting {}
## Plotting multiple datasets  
## Combine plots {}
### `plot_grid()` {.unnumbered}
### Combine legends {.unnumbered}  
### Inset plots {.unnumbered} 
## Dual axes {}
## Packages to help you  
### Point-and-click **ggplot2** with **equisse**  {.unnumbered}
## Miscellaneous  
### Numeric display {.unnumbered}  
## Resources

<!--chapter:end:new_pages/ggplot_tips.Rmd-->


# Epidemic curves { }  

Placeholder


## Preparation
### Packages {.unnumbered}  
### Import data {.unnumbered}
### Set parameters {.unnumbered}
### Verify dates {.unnumbered}
## Epicurves with **incidence2** package { }
### Simple example {.unnumbered}
### Change time interval of case aggregation {.unnumbered}  
### Groups {.unnumbered}
### Filtered data {.unnumbered}
### Aggregated counts {.unnumbered}
### Facets/small multiples {.unnumbered}  
### Modifications with `plot()` {.unnumbered} 
### Modifications with ggplot2 {.unnumbered}
### Change colors  {.unnumbered}  
#### Specify a palette {.unnumbered}  
#### Specify manually {.unnumbered}  
### Adjust level order {.unnumbered}  
### Vertical gridlines {.unnumbered}  
### Cumulative incidence {.unnumbered}  
### Rolling average  {.unnumbered}
## Epicurves with ggplot2 { }
### Specify case bins {.unnumbered}  
### Weekly epicurve example {.unnumbered}  
#### Sunday weeks {.unnumbered}  
### Group/color by value {.unnumbered}
### Adjust colors {.unnumbered}  
### Adjust level order {.unnumbered}  
### Adjust legend {.unnumbered}
### Bars side-by-side {.unnumbered}  
### Axis limits {.unnumbered}  
### Date-axis labels/gridlines {.unnumbered} 
#### Demonstrations {.unnumbered}
### Aggregated data {.unnumbered} 
#### Plotting daily counts {.unnumbered}  
#### Plotting weekly counts {.unnumbered}
### Moving averages {.unnumbered}
### Faceting/small-multiples {.unnumbered}
#### Total epidemic in facet background {.unnumbered}
#### One facet with data {.unnumbered}  
## Tentative data  
### Using `annotate()` {.unnumbered}
### Bars color {.unnumbered}  
## Multi-level date labels  
## Dual-axis { }  
## Cumulative Incidence {}
## Resources { }

<!--chapter:end:new_pages/epicurves.Rmd-->


# Demographic pyramids and Likert-scales {#age_pyramid}  

Placeholder


## Preparation {}
### Load packages {.unnumbered}
### Import data {.unnumbered}  
### Cleaning {.unnumbered}  
## **apyramid** package {}
### Linelist data {.unnumbered}  
#### Missing values {.unnumbered}  
#### Proportions, colors, & aesthetics {.unnumbered}  
### Aggregated data {.unnumbered}  
## `ggplot()` {#demo_pyr_gg}
### Preparation {.unnumbered}
### Constructing the plot {.unnumbered} 
### Compare to baseline  {.unnumbered} 
## Likert scale {}
## Resources {}

<!--chapter:end:new_pages/age_pyramid.Rmd-->


# Heat plots { }  

Placeholder


## Preparation { }
### Load packages {.unnumbered}  
## Transmission matrix  
### Data preparation {.unnumbered}  
#### Make cases data frame {.unnumbered} 
#### Make infectors data frame {.unnumbered}  
### Create heat plot {.unnumbered}  
## Reporting metrics over time { }
### Data preparation {.unnumbered}
#### Aggregate and summarize {.unnumbered}
### Create heat plot {.unnumbered}
### Basic {.unnumbered}  
### Cleaned plot {.unnumbered}
### Ordered y-axis {.unnumbered}  
### Display values {.unnumbered}  
## Resources { }

<!--chapter:end:new_pages/heatmaps.Rmd-->


# Diagrams and charts { }  

Placeholder


## Preparation { }
### Load packages {.unnumbered}  
### Import data {.unnumbered}  
## Flow diagrams { }
### Simple examples {.unnumbered} 
### Syntax  {.unnumbered}
### Complex examples  {.unnumbered}
### Outputs  {.unnumbered}
### Parameterized figures {.unnumbered} 
## Alluvial/Sankey Diagrams { }
### Load packages {.unnumbered}  
### Plotting from dataset {.unnumbered} 
## Event timelines { }
## DAGs { }
## Resources { }

<!--chapter:end:new_pages/diagrams.Rmd-->


# Combinations analysis { }  

Placeholder


## Preparation {  }
### Load packages {.unnumbered}
### Import data {.unnumbered}  
### Re-format values {.unnumbered}  
## **ggupset** {  }
## `UpSetR` {  }
## Resources {  }

<!--chapter:end:new_pages/combination_analysis.Rmd-->


# Transmission chains { }

Placeholder


## Overview {  }
## Preparation {  }
### Load packages {.unnumbered}  
### Import data {.unnumbered}
### Creating an epicontacts object {.unnumbered}
## Handling {  }
### Subsetting {.unnumbered}
### Accessing IDs {.unnumbered}
## Visualization {  }
### Basic plotting {.unnumbered}
#### Visualising node attributes {.unnumbered}
#### Visualising edge attributes {.unnumbered}
### Temporal axis {.unnumbered}
#### Specifying transmission tree shape {.unnumbered}
#### Saving plots and figures {.unnumbered}
### Timelines {.unnumbered}
## Analysis {  }
### Summarising {.unnumbered}
### Pairwise characteristics {.unnumbered}
### Identifying clusters {.unnumbered}
### Calculating degrees {.unnumbered}
## Resources {  }

<!--chapter:end:new_pages/transmission_chains.Rmd-->


# Phylogenetic trees {#phylogenetic_trees}  

Placeholder


## Overview {}
## Preparation {}
### Load packages {.unnumbered}  
### Import data {.unnumbered}  
### Clean and inspect {.unnumbered}  
## Simple tree visualization {}
### Different tree layouts {.unnumbered}  
### Simple tree plus sample data {.unnumbered}  
## Tree manipulation {}
### Zoom in {.unnumbered}  
### Collapsing branches {.unnumbered} 
### Subsetting a tree {.unnumbered} 
### Rotating nodes in a tree {.unnumbered} 
### Example subtree with sample data annotation {.unnumbered} 
## More complex trees: adding heatmaps of sample data {.unnumbered}
## Resources {}

<!--chapter:end:new_pages/phylogenetic_trees.Rmd-->


# Interactive plots { }  

Placeholder


## Preparation {  }
### Load packages {.unnumbered}  
### Start with a `ggplot()` {.unnumbered}  
### Import data {.unnumbered}
## Plot with `ggplotly()` {  }
## Modifications {  }
### File size {.unnumbered}  
### Buttons {.unnumbered}  
## Heat tiles {  }
## Resources {  }

<!--chapter:end:new_pages/interactive_plots.Rmd-->

# (PART) Reports and dashboards {.unnumbered}
```{r include=FALSE, cache=FALSE}

# clear workspace
rm(list = ls(all = TRUE))

# clear all packages except base
#lapply(names(sessionInfo()$loadedOnly), require, character.only = TRUE)
#invisible(lapply(paste0('package:', names(sessionInfo()$otherPkgs)), detach, character.only=TRUE, unload=TRUE, force=TRUE))

# to ensure that tidyverse packages prevail
filter <- dplyr::filter
select <- dplyr::select
summarise <- dplyr::summarise
summary <- base::summary
incidence <- incidence2::incidence

#load core packages
pacman::p_load(
     rio,
     here,
     DT,
     stringr,
     lubridate,
     tidyverse
)

# import the cleaned ebola linelist
linelist <- rio::import(here::here("data", "case_linelists", "linelist_cleaned.rds"))

# import the count data - facility level
#count_data <- rio::import(here::here("data", "facility_count_data.rds"))

# Settings

options(scipen=1, digits=7)

# print only text (not code)
# library(knitr)
# opts_chunk$set(list(echo = FALSE, eval = FALSE))
```

<!--chapter:end:new_pages/cat_reports_dashboards.Rmd-->


# Reports with R Markdown { }  

Placeholder


## Preparation {  }
## Getting started {  }
### Install rmarkdown R package {.unnumbered}
### Starting a new Rmd file {.unnumbered}
### Important to know {.unnumbered}
## R Markdown components {  }
### YAML metadata {.unnumbered}
### Text {.unnumbered}
#### New lines {.unnumbered}  
#### Case {.unnumbered}  
#### Color {.unnumbered}  
#### Titles and headings {.unnumbered}  
#### Bullets and numbering {.unnumbered}  
#### Comment out text {.unnumbered}
### Code chunks {.unnumbered}
#### In-text R code {.unnumbered}  
### Images {.unnumbered}  
### Tables {.unnumbered}  
### Tabbed sections {.unnumbered}  
## File structure {}
### Self-contained Rmd {.unnumbered}  
#### Source other files {.unnumbered}
### Runfile {.unnumbered}  
### Folder strucutre {.unnumbered}  
## Producing the document  
### Option 1: "Knit" button {.unnumbered}  
### Option 2: `render()` command {.unnumbered}
###  Options 3: **reportfactory**  package {.unnumbered}  
## Parameterised reports {  }
### Setting parameters {.unnumbered}
#### Option 1: Set parameters within YAML {.unnumbered}
#### Option 2: Set parameters within `render()` {.unnumbered}  
#### Option 3: Set parameters using a Graphical User Interface {.unnumbered}  
### Parameterized example {.unnumbered} 
### Parameterisation without `params` {.unnumbered}
## Looping reports  {  }
## Templates  
### Word documents {.unnumbered}
### Powerpoint documents {.unnumbered}
### Integrating templates into the YAML {.unnumbered}
### Formatting HTML files {.unnumbered}
## Dynamic content  
### Tables {.unnumbered}  
### HTML widgets {.unnumbered}
## Resources {  }

<!--chapter:end:new_pages/rmarkdown.Rmd-->


# Organizing routine reports {  }  

Placeholder


## Preparation
### Load packages {.unnumbered}  
## New factory  
## Create a report  
## Compile  
### Compile by name {.unnumbered}  
### Compile by number {.unnumbered}
### Compile all {.unnumbered}
### Compile from sub-folder {.unnumbered}  
### Parameterization {.unnumbered}
### Using a "run-file" {.unnumbered}  
## Outputs  
## Miscellaneous  
### Knit {.unnumbered} 
### Scripts {.unnumbered}  
### Extras {.unnumbered} 
## Resources {  }

<!--chapter:end:new_pages/reportfactory.Rmd-->


# Dashboards with R Markdown {#dashboards}

Placeholder


## Preparation
### Load packages {.unnumbered}  
### Import data {.unnumbered}  
## Create new R Markdown  
## The script  
### YAML {.unnumbered}  
### Code chunks {.unnumbered}  
### Narrative text {.unnumbered}  
### Headings {.unnumbered}  
## Section attributes  
## Layout {#layout}  
### Pages {.unnumbered}  
### Orientation {.unnumbered}  
### Tabs {.unnumbered} 
## Adding content  
### Text {.unnumbered}  
### Tables {.unnumbered}  
### Plots {.unnumbered}  
### Interactive plots {.unnumbered}  
### HTML widgets {.unnumbered}
## Code organization
## Shiny  
### Settings {.unnumbered}  
### Worked example {.unnumbered}  
### Other examples {.unnumbered}  
## Sharing  
## Resources  

<!--chapter:end:new_pages/flexdashboard.Rmd-->


# Dashboards with Shiny {#shiny}  

Placeholder


## Preparation  
### Load packages {.unnumbered}  
### Import data {.unnumbered}  
## The structure of a shiny app {  }
### Basic file structures {.unnumbered}  
### The server and the ui {.unnumbered}
### Before you start to build an app {.unnumbered}
## Building a UI 
## Loading data into our app
## Developing an app server
## Adding more functionality
### Adding static text {.unnumbered}  
### Adding a link {.unnumbered}
### Adding a download button {.unnumbered}
### Adding a facility selector {.unnumbered}  
### Adding another tab with a table {.unnumbered}
## Sharing shiny apps
## Further reading
## Recommended extension packages
## Recommended resources

<!--chapter:end:new_pages/shiny_basics.Rmd-->

# (PART) Miscellaneous {.unnumbered}
```{r include=FALSE, cache=FALSE}

# clear workspace
rm(list = ls(all = TRUE))

# clear all packages except base
#lapply(names(sessionInfo()$loadedOnly), require, character.only = TRUE)
#invisible(lapply(paste0('package:', names(sessionInfo()$otherPkgs)), detach, character.only=TRUE, unload=TRUE, force=TRUE))

# to ensure that tidyverse packages prevail
filter <- dplyr::filter
select <- dplyr::select
summarise <- dplyr::summarise
summary <- base::summary
incidence <- incidence2::incidence

#load core packages
pacman::p_load(
     rio,
     here,
     DT,
     stringr,
     lubridate,
     tidyverse
)

# import the cleaned ebola linelist
linelist <- rio::import(here::here("data", "case_linelists", "linelist_cleaned.rds"))

# import the count data - facility level
#count_data <- rio::import(here::here("data", "facility_count_data.rds"))

# Settings

options(scipen=1, digits=7)

# print only text (not code)
# library(knitr)
# opts_chunk$set(list(echo = FALSE, eval = FALSE))
```

<!--chapter:end:new_pages/cat_misc.Rmd-->


# Writing functions  

Placeholder


## Preparation {  }
### Load packages {-}
### Import data {-}
## Functions  
## Why would you use a function? 
## How does R  build functions?
## Basic syntax and structure
## Examples  
### Return proportion tables for several columns {.unnumbered}  
## Using **purrr**: writing functions that can be iteratively applied
### Modify class of multiple columns in a dataset {.unnumbered}  
### Iteratively produce graphs for different levels of a variable {.unnumbered}
### Iteratively produce tables for different levels of a variable {.unnumbered}
## Tips and best Practices for well functioning functions
### Naming and syntax {.unnumbered}
### Column names and tidy evaluation {.unnumbered}  
### Testing and Error handling {.unnumbered}
## Resources

<!--chapter:end:new_pages/writing_functions.Rmd-->


# Directory interactions { }  

Placeholder


## Preparation  
### **fs** package {.unnumbered}  
### Print directory as a dendrogram tree {.unnumbered}  
## List files in a directory  
## File information  
## Check if exists  
### R objects {.unnumbered}  
### Directories {.unnumbered}  
### Files {.unnumbered}  
## Create  
### Directories {.unnumbered}  
### Files {.unnumbered}  
### Create if does not exists {.unnumbered}  
## Delete
### R objects {.unnumbered}  
### Directories {.unnumbered}  
### Files {.unnumbered}  
## Running other files  
### `source()` {.unnumbered}  
### `render()` {.unnumbered}  
### Run files in a directory {.unnumbered}
### Import files in a directory  {.unnumbered}
## **base** R  
## Resources {  }

<!--chapter:end:new_pages/directories.Rmd-->


# Version control and collaboration with Git and Github

Placeholder


## What is Git?
## Why use the combo Git and Github?
### This sounds complicated, I am not a programmer {-}
## Setup
### Install Git {.unnumbered}
### Install an interface (optional but recommended) {.unnumbered}
### Github account {.unnumbered}
## Vocabulary, concepts and basic functions
### Repository {.unnumbered}
### Commits {.unnumbered}
### Branches {.unnumbered}
### Local and remote repositories {.unnumbered}
## Get started: create a new repository
### Start-up files {.unnumbered}
### Create a new repository in Github {.unnumbered}
### Clone from a Github repository {.unnumbered}
#### In Rstudio {.unnumbered}
#### In Github Desktop {.unnumbered}
### New Github repo from existing R project {.unnumbered}
### What does it look like now? {.unnumbered}
#### In RStudio {-}
#### In Github Desktop {-}
## Git + Github workflow
### Process overview {.unnumbered}
## Create a new branch
### In Rstudio Git pane {.unnumbered}
### In Github Desktop {.unnumbered}
### In console {.unnumbered}
## Commit changes
### In Rstudio {.unnumbered}
### In Github Desktop {.unnumbered}
### In console {.unnumbered}
### Amend a previous commit {.unnumbered}
## Pull and push changes up to Github
#### In Rstudio {.unnumbered}
#### In Github Desktop {.unnumbered}
#### Console {.unnumbered}
### I want to pull but I have local work {.unnumbered}
## Merge branch into Main 
### Locally in Github Desktop {.unnumbered}
### In console {.unnumbered}
### In Github: submitting pull requests {.unnumbered}
### Resolving conflicts {.unnumbered}
### Delete your branch {.unnumbered}
#### Github + Rstudio
#### In Github Desktop
### Forking {.unnumbered}
## What we learned
## Git commands {#git}
### Recommended learning {.unnumbered}
### Where to enter commands {.unnumbered}
### Sample commands {.unnumbered}
## Resources

<!--chapter:end:new_pages/collaboration.Rmd-->


# Common errors  

Placeholder


## Interpreting error messages  
## Common errors  
### Typo errors {.unnumbered}  
### Package errors {.unnumbered}  
### Object errors {.unnumbered}  
### Function syntax errors {.unnumbered}
### Logic errors {.unnumbered}  
### Factor errors {.unnumbered}  
### Plotting errors {.unnumbered}  
### R Markdown errors {.unnumbered}  
### Miscellaneous {.unnumbered}  
## Resources { }

<!--chapter:end:new_pages/errors.Rmd-->


# Getting help  

Placeholder


## Github issues  
## Reproducible example  
### The **reprex** package {.unnumbered}  
### Minimal data {.unnumbered}  
## Posting to a forum  
## Resources { }

<!--chapter:end:new_pages/help.Rmd-->


# R on network drives { }  

Placeholder


## Overview {  }
## RStudio as administrator  
## Useful commands 
## Troubleshooting common errors {  }

<!--chapter:end:new_pages/network_drives.Rmd-->


# Data Table { }  

Placeholder


## Intro to data tables {  }
## Load packages and import data { }
### Load packages {.unnumbered}  
### Import data {.unnumbered}
## The i argument: selecting and filtering rows{ }
### Using helper functions for filtering {.unnumbered}  
## The j argument: selecting and computing on columns{ }
### Selecting columns {.unnumbered} 
### Computing on columns {.unnumbered} 
## The by argument: computing by groups{ }
## Adding and updating to data tables { }
## Resources {  }

<!--chapter:end:new_pages/data_table.Rmd-->