L’environnement
Python est un langage clair, intuitif, massivement répandu, et devenu incontournable dans le traitement de données, l’ingénierie scientifique et l’intelligence artificielle.
Objectifs pédagogiques
À l’issue de la formation, les stagiaires seront capables de :
- Appliquer des algorithmes de machine learning
- Identifier les limites du machine learning
- Mesurer la fiabilité d’un modèle
- Comparer différents algorithmes
Public concerné
Techniciens, ingénieurs, développeurs, scientifiques, enseignants.
Prérequis
Maîtriser les librairies scientifiques NumPy et pandas ou avoir suivi la formation « Python Scientifique ». Un questionnaire de pré-formation est proposé pour valider l’adéquation entre le besoin et la formation.
Programme de la formation
Introduction
- Qu’est-ce que le machine learning ?
- Exemples d’application
- Pourquoi Python pour le machine learning ?
- Pourquoi utiliser le machine learning ?
- Apprentissage supervisé
- Apprentissage non-supervisé
- Apprentissage par renforcement
- Les défis du machine learning
- Tester et valider son modèle
Un projet machine learning avec pandas et scikit-learn
- Où récupérer des données ?
- Récupérer, analyser et visualiser des données
- Séparation des données d’entraînement et de test
- Préparer et nettoyer les données
- Pipeline
- Sélectionner et entraîner un modèle
- Mesurer la fiabilité d’un modèle
- Overfitting et underfitting
- Réglages des hyperparamètres
Modèles linaires
- Qu’est-ce qu’un modèle linéaire ?
- Régression linéaire
- Régression logistique pour la classification
- Modèles linéaires et régularisation
Arbres de décisions
- Qu’est-ce qu’un modèle d’arbre de décision ?
- Les arbres de décisions pour la classification
- Les arbres de décision pour la régression
- L’impact de la profondeur de l’arbre
D’autres algorithmes de machine learning : théorie et pratique
- Bootstrap
- Analyse en composantes principales
- Clustering avec k-moyennes