Formation Langage R : Data Science

icon public

Public : Développeurs R

icon horloge

Durée : 2 jour(s)

Syllabus de la formation Langage R : Data Science

Pré-requis : Avoir suivi la formation Langage R : fondamentaux ou notions équivalentes

Objectifs : Acquérir les bases solides pour importer, nettoyer et manipuler des données avec R. Explorer et visualiser des données de façon efficace. Produire des analyses statistiques descriptives et inférentielles. Implémenter des algorithmes simples de machine learning supervisés et non supervisés. Savoir utiliser les principaux packages R pour la Data Science.

Sanction : Attestation de fin de formation mentionnant le résultat des acquis

Référence : PRO102048-F

Accessibilité : Si vous êtes en situation de handicap, nous sommes en mesure de vous accueillir, n'hésitez pas à nous contacter à referenthandicap@dawan.fr, nous étudierons ensemble vos besoins

Contact : commercial@dawan.fr

À partir de

1 075,00 € HT / jour

Tarif pour une personne à distance sans frais
+ 75,00 € HT par participant supplémentaire
+ frais en cas de formation présentielle

1 580,00 € HT

1 500,00 € HT

Pour 20 tickets de 30mn (10 heures) utilisables pendant 12 mois

1 975,00 € HT

Tarif plein :

  • Paiement à 60 jours
  • Report possible à J-3
  • 3 tickets d'assistance
Contacter Dawan
Langage R

Programme de Formation Langage R : Data Science

Importation et manipulation des données 

Importer des données de formats variés
CSV avec readr, base R
Excel avec readxl
JSON avec jsonlite
Connexion bases de données (dbplyr, DBI)
Aperçu des packages : haven (SPSS, Stata)

Atelier pratique : Importer différents formats de données

Maîtriser la manipulation des données dans R

Filtrage, sélection, mutation
Agrégation et group_by
Tri et réorganisation
Jointures (left_join, inner_join, etc.)
Gestion des valeurs manquantes : is.na, replace_na
Nettoyage des formats de colonnes (dates, facteurs, strings)

Atelier pratique : pipeline complet avec dplyr et tidyr

Visualisation des données 

Principes de la data visualisation
Importance de la visualisation exploratoire
Types de graphiques adaptés aux données
Représentations graphiques classiques et avancées
Création de graphiques avec ggplot2
Syntaxe de base
Types : histogrammes, boxplots, scatterplots, bar charts
Facets et thèmes

Atelier pratique : Créer des graphiques statiques avec ggplot2

Visualisations interactives

Introduction à plotly pour ggplot
Cartes interactives avec leaflet (optionnel)

Atelier pratique : Transformer un ggplot en graphique interactif

Statistiques descriptives et inférentielles 

Écrire des statistiques descriptives à l'aide de R
Moyenne, médiane, écart-type
Résumés et quantiles
Tableaux de fréquence
Outils pour la description statistique

Atelier pratique : Résumer un jeu de données réelles

Tests d’hypothèses

t-tests (une ou deux échantillons)
ANOVA
Test du chi-deux
Corrélation de Pearson et Spearman
Packages : base R, broom

Atelier pratique : Réaliser et interpréter des tests statistiques

Modélisation statistique et Machine Learning 

Analyse descriptive des datasets multivariés et techniques de réduction dimensionnelle
ACP (Analyse en Composantes Principales)
Packages : FactoMineR, factoextra
Analyse Factorielle des Correspondances (AFC)

Atelier pratique : Réaliser une ACP et interpréter les axes

Algorithmes supervisés avec études de cas sur R

Régression linéaire simple et multiple (lm)
Régression logistique (glm)
Analyse des résidus
Visualisation des résultats
Exemple pratique sur un jeu de données

Atelier pratique : Ajuster et interpréter des modèles supervisés

Algorithmes non supervisés avec études de cas sur R

K-means clustering
Préparation des données
Choix du nombre de clusters
Visualisation des clusters

Atelier pratique : Segmenter des données avec k-means

Introduction à l’Analyse des séries temporelles

Composantes d’une série
Modèles ARIMA, SARIMA avec forecast
Visualisation des prévisions

Atelier pratique : Prévoir des valeurs avec ARIMA

Délai d'accès :Le délai d’accès à la formation certifiante est de 7 jours après validation du dossier. Dans le cas d’un financement via votre CPF, la validation de votre dossier devra être réalisée 11 jours ouvrés avant le début de formation

Modalités d’évaluation : Les évaluations en cours de formations sont réalisées par les ateliers de mise en pratique et les échanges avec les formateurs

Data Science avec le langage R

  • Un support et les exercices du cours pour chaque stagiaire
  • Un formateur expert ayant suivi une formation à la pédagogie et ayant au minimum 3 années d'expériences dans le domaine visé
  • Boissons offertes pendant les pauses en inter-entreprises
  • Salles lumineuses et locaux facilement accessibles
  • Méthodologie basée sur l'Active Learning : 75% de pratique minimum
  • Matériel pour les formations présentielles informatiques : un PC par participant
  • Positionnement à l'entrée et à la sortie de la formation
  • Certification CPF quand formation éligible
  • Délai d’accès : D'une à trois semaines en fonction des sessions ouvertes

Suite de parcours et formations associées

Pour suivre une session à distance depuis l'un de nos centres, contactez-nous.

Lieu Date Remisé Actions
Distance Du 04/09/2025 au 05/09/2025 S'inscrire
Distance Du 30/10/2025 au 31/10/2025 S'inscrire

Nos centres de formation

  • Bruxelles

    Rue de la Loi, 23

    1040 Bruxelles

  • Distance

    32 Boulevard Vincent Gâche

    44000 Nantes

  • Luxembourg

    5 Rue Goethe

    L-1637 Luxembourg