L’environnement

Le langage R est un langage très largement utilisé dans les do- maines de la statistique et de l’analyse de données. Le langage possède un écosystème riche de plusieurs milliers de librairies pour préparer des données, les analyser et communiquer les résultats.

Objectifs pédagogiques

À l’issue de la formation, le stagiaire sera capable de :

  • Utiliser des algorithmes de machine learning avec R
  • Sélectionner des algorithmes de machine learning
  • Évaluer la performance des algorithmes de machine learning
  • Maîtriser le processus complet d’un projet de machine learning

Public concerné

Techniciens, ingénieurs, développeurs, scientifiques, enseignants ou tout public souhaitant découvrir le langage R.

Prérequis

Connaître langage R ou avoir suivi la formation « R pour la science ».

Programme de la formation

Introduction

  • Installer R et RStudio
  • Environnement de développement et librairies
  • RStudio et son écosystème
  • Machine learning et enjeux
  • Les librairies de machine learning

Apprentissage supervisé

  • Régression linéaire
  • Régression multivariée
  • Régression logistique
  • Arbres de décision
  • Forêts aléatoires
  • GBM : Gradient Boosting Machine
  • Apprentissage non supervisé
  • Clustering : k-means et k-mode
  • Projet de machine learning
  • Évaluer les performances des algorithmes d’apprentissage
  • Utiliser le machine learning dans un workflow