Pré-requis : Avoir suivi la formation Langage R : fondamentaux ou notions équivalentes
Objectifs : Acquérir les bases solides pour importer, nettoyer et manipuler des données avec R. Explorer et visualiser des données de façon efficace. Produire des analyses statistiques descriptives et inférentielles. Implémenter des algorithmes simples de machine learning supervisés et non supervisés. Savoir utiliser les principaux packages R pour la Data Science.
Sanction : Attestation de fin de formation mentionnant le résultat des acquis
Référence : PRO102048-F
Accessibilité : Si vous êtes en situation de handicap, nous sommes en mesure de vous accueillir, n'hésitez pas à nous contacter à referenthandicap@dawan.fr, nous étudierons ensemble vos besoins
Contact : commercial@dawan.fr
1 975,00 € HT
Importer des données de formats variés
CSV avec readr, base R
Excel avec readxl
JSON avec jsonlite
Connexion bases de données (dbplyr, DBI)
Aperçu des packages : haven (SPSS, Stata)
Atelier pratique : Importer différents formats de données
Filtrage, sélection, mutation
Agrégation et group_by
Tri et réorganisation
Jointures (left_join, inner_join, etc.)
Gestion des valeurs manquantes : is.na, replace_na
Nettoyage des formats de colonnes (dates, facteurs, strings)
Atelier pratique : pipeline complet avec dplyr et tidyr
Principes de la data visualisation
Importance de la visualisation exploratoire
Types de graphiques adaptés aux données
Représentations graphiques classiques et avancées
Création de graphiques avec ggplot2
Syntaxe de base
Types : histogrammes, boxplots, scatterplots, bar charts
Facets et thèmes
Atelier pratique : Créer des graphiques statiques avec ggplot2
Introduction à plotly pour ggplot
Cartes interactives avec leaflet (optionnel)
Atelier pratique : Transformer un ggplot en graphique interactif
Écrire des statistiques descriptives à l'aide de R
Moyenne, médiane, écart-type
Résumés et quantiles
Tableaux de fréquence
Outils pour la description statistique
Atelier pratique : Résumer un jeu de données réelles
t-tests (une ou deux échantillons)
ANOVA
Test du chi-deux
Corrélation de Pearson et Spearman
Packages : base R, broom
Atelier pratique : Réaliser et interpréter des tests statistiques
Analyse descriptive des datasets multivariés et techniques de réduction dimensionnelle
ACP (Analyse en Composantes Principales)
Packages : FactoMineR, factoextra
Analyse Factorielle des Correspondances (AFC)
Atelier pratique : Réaliser une ACP et interpréter les axes
Régression linéaire simple et multiple (lm)
Régression logistique (glm)
Analyse des résidus
Visualisation des résultats
Exemple pratique sur un jeu de données
Atelier pratique : Ajuster et interpréter des modèles supervisés
K-means clustering
Préparation des données
Choix du nombre de clusters
Visualisation des clusters
Atelier pratique : Segmenter des données avec k-means
Composantes d’une série
Modèles ARIMA, SARIMA avec forecast
Visualisation des prévisions
Atelier pratique : Prévoir des valeurs avec ARIMA
Délai d'accès :Le délai d’accès à la formation certifiante est de 7 jours après validation du dossier. Dans le cas d’un financement via votre CPF, la validation de votre dossier devra être réalisée 11 jours ouvrés avant le début de formation
Modalités d’évaluation : Les évaluations en cours de formations sont réalisées par les ateliers de mise en pratique et les échanges avec les formateurs
Data Science avec le langage R
Pour suivre une session à distance depuis l'un de nos centres, contactez-nous.
Lieu | Date | Remisé | Actions |
---|---|---|---|
Distance | Du 04/09/2025 au 05/09/2025 | S'inscrire | |
Distance | Du 30/10/2025 au 31/10/2025 | S'inscrire |