L’environnement

Le langage R est un langage très largement utilisé dans les domaines de la statistique et de l’analyse de données. Le langage possède un écosystème riche de plusieurs milliers de librairies pour préparer des données, les analyser et communiquer les résultats.

Objectifs pédagogiques

À l’issue de la formation, les stagiaires seront capables de :

  • Utiliser des algorithmes de machine learning avec R
  • Sélectionner des algorithmes de machine learning
  • Évaluer la performance des algorithmes de machine learning
  • Maîtriser le processus complet d’un projet de machine learning

Public concerné

Techniciens, ingénieurs, développeurs, scientifiques, enseignants ou tout public souhaitant découvrir le langage R.

Prérequis

Connaître langage R ou avoir suivi la formation « R pour la data science ». Un questionnaire de pré-formation est proposé pour valider l’adéquation entre le besoin et la formation. Un questionnaire de pré-formation est proposé pour valider l’adéquation entre le besoin et la formation.

Programme de la formation

Introduction

  • Installer R et RStudio
  • Environnement de développement et librairies
  • RStudio et son écosystème
  • Machine learning et enjeux
  • Les librairies de machine learning

Apprentissage supervisé

  • Régression linéaire
  • Régression multivariée
  • Régression logistique
  • Arbres aléatoires
  • Forêts aléatoires
  • GBM : Gradient Boosting Machine

Apprentissage non supervisé

  • Clustering : k-means et k-mode
  • Détection de pattern – association rules

 Projet de machine learning

  • Évaluer les performances des algorithmes d’apprentissage
  • Utiliser le machine learning dans un workflow