L’environnement

Python est un langage clair, intuitif, massivement répandu, et devenu incontournable dans le traitement de données, l’ingénierie scientifique et l’intelligence artificielle.

Objectifs pédagogiques

À l’issue de la formation, les stagiaires seront capables de :

  • Appliquer des algorithmes de machine learning
  • Identifier les limites du machine learning
  • Mesurer la fiabilité d’un modèle
  • Comparer différents algorithmes

Public concerné

Techniciens, ingénieurs, développeurs, scientifiques, enseignants.

Prérequis

Maîtriser les librairies scientifiques NumPy et pandas ou avoir suivi la formation « Python Scientifique ». Un questionnaire de pré-formation est proposé pour valider l’adéquation entre le besoin et la formation.

 

Programme de la formation

Introduction

  • Qu’est-ce que le machine learning ?
  • Exemples d’application
  • Pourquoi Python pour le machine learning ?
  • Pourquoi utiliser le machine learning ?
  • Apprentissage supervisé
  • Apprentissage non-supervisé
  • Apprentissage par renforcement
  • Les défis du machine learning
  • Tester et valider son modèle

Un projet machine learning avec pandas et scikit-learn

  • Où récupérer des données ?
  • Récupérer, analyser et visualiser des données
  • Séparation des données d’entraînement et de test
  • Préparer et nettoyer les données
  • Pipeline
  • Sélectionner et entraîner un modèle
  • Mesurer la fiabilité d’un modèle
  • Overfitting et underfitting
  • Réglages des hyperparamètres

Modèles linaires

  • Qu’est-ce qu’un modèle linéaire ?
  • Régression linéaire
  • Régression logistique pour la classification
  • Modèles linéaires et régularisation

Arbres de décisions

  • Qu’est-ce qu’un modèle d’arbre de décision ?
  • Les arbres de décisions pour la classification
  • Les arbres de décision pour la régression
  • L’impact de la profondeur de l’arbre

D’autres algorithmes de machine learning : théorie et pratique

  • Bootstrap
  • Analyse en composantes principales
  • Clustering avec k-moyennes