Pré-requis : Maîtrise des bases du langage Python
Objectifs : Comprendre et choisir une méthode d'apprentissage automatique - Acquérir les bases du Machine Learning avec Python
Sanction : Attestation de fin de stage mentionnant le résultat des acquis
Taux de retour à l’emploi : Aucune donnée disponible
Référence : INT101603-F
Accessibilité : Nos formations sont accessibles aux personnes en situation de handicap
3 475,00 € HT
Machine Learning : définition, contextes d'utilisation, phases (apprentissage, mise en production)
Enjeux et limites
Approches mathématiques et statistiques
Application et types de données : graphes, arbres, courbes, vecteurs de caractéristiques Qualification de la phase d'apprentissage : classification, régression, renforcement, non supervision
Panorama d'algorithmes : régressions (linéaire ou logistique), machines à vecteurs, réseaux de neurones, k plus proches voisins (KNN), boosting,...
Facteurs de pertinence et d'efficacité : nombre d'exemples, qualité des attributs, pourcentage des données renseignées ou manquantes, bruit
Défintion du problème
Acquisition des données
Analyse et exploration des données
Préparation et nettoyage des données
Extraction de caractéristiques
Choix ou construction du modèle d'apprentissage
Entrainement, évaluation et optimisation
Test et vérification de surapprentissage Déploiement
NumPy : manipulation de matrices et fonctions
Pandas : lecture et manipulation de données
Jupyter et ses Notebook : utilisation de cahiers électroniques
Présentation d'une base de données
Régression linéaire (simple ou multiple) : étude, import, création et application d'un modèle, évaluation
Régression logistique : packages, création et application d'un modèle, évaluation et matrice de confusion
K plus proches voisins (KNN) : packages Python, Application et évaluation, amélioration
Support Vector Machine (SVM) : principe, découverte de la base de données, application et évaluation
Analyse en composante principale (PCA) : principe, création du modèle et visualisation des données en 2D
Decision Tree : principe, préparation des données, création du modèle et visualisation de l'arbre de décision
Random Forest : principe, implémentation en Python
Ré-échantillonnage
Représentativité des données d'apprentissage Interprétation de la matrice de confusion Sensibilité et spécificité d'un test : Receiver Operating Characteristic (ROC) et Area under the ROC Curve (AUC)
Pour suivre une session à distance depuis l'un de nos centres, contactez-nous.
Aucune date de programmée actuellement. Pour plus d'information sur les prochaines sessions, nous vous invitons à joindre le service commercial par téléphone au 02/318.50.01 (prix d'un appel local) ou depuis notre formulaire de contact.