L’environnement
Le langage R est un langage très largement utilisé dans les do- maines de la statistique et de l’analyse de données. Le langage possède un écosystème riche de plusieurs milliers de librairies pour préparer des données, les analyser et communiquer les résultats.
Objectifs pédagogiques
À l’issue de la formation, le stagiaire sera capable de :
- Utiliser des algorithmes de machine learning avec R
- Sélectionner des algorithmes de machine learning
- Évaluer la performance des algorithmes de machine learning
- Maîtriser le processus complet d’un projet de machine learning
Public concerné
Techniciens, ingénieurs, développeurs, scientifiques, enseignants ou tout public souhaitant découvrir le langage R.
Prérequis
Connaître langage R ou avoir suivi la formation « R pour la science ».
Programme de la formation
Introduction
- Installer R et RStudio
- Environnement de développement et librairies
- RStudio et son écosystème
- Machine learning et enjeux
- Les librairies de machine learning
Apprentissage supervisé
- Régression linéaire
- Régression multivariée
- Régression logistique
- Arbres de décision
- Forêts aléatoires
- GBM : Gradient Boosting Machine
- Apprentissage non supervisé
- Clustering : k-means et k-mode
- Projet de machine learning
- Évaluer les performances des algorithmes d’apprentissage
- Utiliser le machine learning dans un workflow