L’environnement
Le langage R est un langage très largement utilisé dans les domaines de la statistique et de l’analyse de données. Le langage possède un écosystème riche de plusieurs milliers de librairies pour préparer des données, les analyser et communiquer les résultats.
Objectifs pédagogiques
À l’issue de la formation, les stagiaires seront capables de :
- Utiliser des algorithmes de machine learning avec R
- Sélectionner des algorithmes de machine learning
- Évaluer la performance des algorithmes de machine learning
- Maîtriser le processus complet d’un projet de machine learning
Public concerné
Techniciens, ingénieurs, développeurs, scientifiques, enseignants ou tout public souhaitant découvrir le langage R.
Prérequis
Connaître langage R ou avoir suivi la formation « R pour la data science ». Un questionnaire de pré-formation est proposé pour valider l’adéquation entre le besoin et la formation. Un questionnaire de pré-formation est proposé pour valider l’adéquation entre le besoin et la formation.
Programme de la formation
Introduction
- Installer R et RStudio
- Environnement de développement et librairies
- RStudio et son écosystème
- Machine learning et enjeux
- Les librairies de machine learning
Apprentissage supervisé
- Régression linéaire
- Régression multivariée
- Régression logistique
- Arbres aléatoires
- Forêts aléatoires
- GBM : Gradient Boosting Machine
Apprentissage non supervisé
- Clustering : k-means et k-mode
- Détection de pattern – association rules
Projet de machine learning
- Évaluer les performances des algorithmes d’apprentissage
- Utiliser le machine learning dans un workflow