Contenu du cours

L'objectif de ce cours est de présenter les différentes composantes du Machine Learning en se focalisant l'apprentissage supervisé et l'apprentissage non supervisé. Après une présentation de la problématique, des données mais aussi des questions théoriques autour du Machine Learning, un deuxième cours sera consacré à la présentation d'algorithmes classiques dans ces deux composantes (k-NN, régression linéaire ou logistique, arbres de décisions, SVM ou encore des réseaux de neurones).

Des séances pratiques auront pour objectif de mettre en oeuvre les bonnes pratiques en apprentissage sur divers jeu de données. On profitera également de ces séances pour introduire les méthodes de sampling, cost-sensitive learning ou encore la combinaison de modèles.

Séance 1 : Cours

Cette première séance est un cours d'introduction au Machine Learning, présentant les problématiques qui y sont liés tant sur le plan théorique (bornes en généralisation) que sur le plan pratique en abordant les données et les algorithmes de façon générale.

Séance 2 : Cours

Cette séance est dédiée à la présentation de différents algorithmes plus ou moins complexes en Machine Learning : k-NN, SVM, Réseaux de Neurones, Modèles linéaire et logistique ainsi que les arbres de décisions.

Séance 3

Cette première pratique permet de mettre en oeuvre les bonnes pratiques expérimentales en Machine Learning. Le code développé pendant cette séance pourra être mobilisée pendant les autres séances pratiques.

Séance 4

Un deuxième TD où l'objectif est de travailler plus précisément sur un problème de régression et un problème de classification.

Séance 5

L'objectif de cette séance et de présenter quelques solutions pratiques pour traiter le problème de déséquilibre dans les jeux de données.

Séance 6

Dans cette avant dernière séance on va s'intéresser à deux façons de construire des algorithmes plus complexes : le boosting et le bagging.

Séance 7

Cette séance est dédiée à l'examen final et à un échange sur l'avancement du projet. Les examens sont disponibles dans la section dédiée, tout en bas de cette page.

Projet

Le projet proposé vous invite à tester les différents algorithmes vus en cours sur les jeux de données pendant les séances, afin de comparer les performances en suivant la procédure présentée en cours.

Examens

Vous retrouverez les sujets d'examen des différentes années. Il n'y a et il n'y aura jamais de corrections de ces examens, mais vous pouvez toujours poser des questions sur ces derniers.