Spécialité Statistique

Master Mathématiques et Applications
Sorbonne Université

Mise à niveau

Code et crédits : 5MS101, 12 ECTS
Période : de septembre à décembre

Cours 1 : Statistique mathématique et Outils d'optimisation

Responsables : C. Boyer et T. Rebafka
Contacts : claire.boyer@upmc.fr, tabea.rebafka@upmc.fr
Objectif : réviser les notions de statistique mathématique d'une part, introduire les outils de base de l'optimisation d'autre part.
Prérequis : notions fondamentales de probabilités, statistique, analyse et algèbre linéaire.

  1. Rappels de probabilités
  2. Méthodologie statistique : estimation, intervalles de confiance et tests
  3. Modèle linéaire, vecteurs gaussiens, modèle linaire gaussien
  4. Rappels de calcul différentiel et d'algèbre matricielle
  5. Minimisation de fonctions convexes via la dualité Lagrangienne
  6. Introduction à l’analyse convexe : sous-gradient, dualité de Fenchel-Legendre
  7. Descente de gradient, de sous-gradient, et gradient stochastique

Cours 2 : Logiciels R et Python

Responsables : M. Thomas et M. Sangnier
Contacts : maud.thomas@upmc.fr, maxime.sangnier@upmc.fr
Objectif : illustration de quelques notions classiques de statistique via les logiciels R et Python.
Prérequis : notions fondamentales de probabilités et statistique.

  1. Prises en main de R et Python
  2. Jeux de données : étude descriptive et représentations
  3. Intervalles de confiance et tests
  4. Régression linéaire, analyse de la variance

Cours 3 : Modèle linéaire et grande dimension

Responsable : E. Roquain
Contact : etienne.roquain@upmc.fr
Objectif : Rappels et compléments sur le modèle linéaire. Seuillage. Hypothèse de parcimonie. Sélection de modèles. Sélection ridge et LASSO. Régression logistique, régression Poisson, modèle linéaire généralisé. Validation croisée. Détection. Tests multiples. Randomization.
Prérequis : notions fondamentales de probabilités et statistique, logiciel R.

  1. Estimation dans le modèle de bruit blanc gaussien
  2. Estimation dans le modèle linéaire gaussien de grande dimension
  3. Modèles linéaires généralisés
  4. Détection et tests multiples
  5. Régions de confiance après sélection