Cours fondamentaux
Code et crédits : 5MS32, 18 ECTS
Période : septembre à décembre
Cours 1 : Apprentissage statistique
Responsable : G. Biau
Contact : gerard.biau@upmc.fr
Objectif : ce cours présente les grands principes de l'apprentissage statistique et les problématiques liées.
Prérequis : notions fondamentales de probabilités et statistique.
- Introduction au problème de la classification supervisée
- Principe de minimisation du risque empirique, théorie de Vapnik-Chervonenkis
- Bornes de performance, pertes convexes, sélection de modèle
- Classification non paramétrique, théorème de Stone, plus proches voisins, arbres
- Classification par réseaux neuronaux
- Quantification et clustering
Cours 2 : Réduction de dimension et apprentissage non-supervisé
Responsable : M. Sangnier
Contact : maxime.sangnier@upmc.fr
Objectif : ce cours présente les principales méthodes d'exploration et
d'analyse de données, de réduction de dimension et d'apprentissage
non-supervisé. Il introduit aussi les méthodes semi-supervisées ainsi
qu'une vision numérique de l'apprentissage supervisé. Ce cours sera
illustré par de nombreux travaux pratiques (en Python) ainsi que par un
challenge en science des données.
Prérequis : notions fondamentales de probabilités et statistique, algèbre linéaire, calcul scientifique en Python.
- Réduction de dimension et visualisation de données : décomposition en valeurs singulières, ACP, MDS, ISOMAP
- Apprentissage non-supervisé : classification hiérarchique, K-means, modèles de mélange gaussiens, clustering spectral
- Apprentissage semi-supervisé : induction/transduction, méthodes de faible densité, de graphes, de variétés, changement de représentation
- Apprentissage supervisé : algorithmes et approches numériques
- Page web du cours
Cours 3 : Théorèmes limites
Responsable : O. Lopez
Contact : olivier.lopez0@upmc.fr
Objectif : acquérir les méthodes fondamentales utilisées pour déterminer la convergence et la loi asymptotique d’estimateurs.
Prérequis : notions fondamentales de probabilités et statistique.
- Fonction de répartition empirique
- Théorèmes limites fonctionnels
- Mesures de complexité
- Application à l’estimation paramétrique
- Estimation non-paramétrique
- Introduction à l’estimation semi-paramétrique
- Page web du cours
Cours 4 : Méthodes Monte-Carlo
Responsable : A. Guyader
Contact : arnaud.guyader@upmc.fr
Objectif : introduire et appliquer les principales méthodes Monte-Carlo.
Prérequis : notions fondamentales de probabilités et statistique, logiciel R.
- Génération de variables aléatoires
- Intégration Monte-Carlo
- Monte-Carlo par Chaînes de Markov
- Page web du cours