STA201

Analyse multivariée approfondie


9 crédits N'deye NIANG et Giorgio RUSSOLILLO EPN06 - Mathématique et statistique Unité d'enseignement de type cours

Publié Du 01-09-2007 au 31-08-9999

Prérequis

Etre inscrit en M2 du master Statistique MR123 (ancien MR085) ou du master Actuariat MR126000A (ancien MR088) ou être agréé (niveau requis STA101 et STA102) .
 Pour obtenir l'agrément, les auditeurs adresseront par courrier électronique à l'enseignant responsable, Mme Niang (ndeye.niang_keita@cnam.fr ) un CV détaillé et une lettre de motivation indiquant les raisons de la demande et le projet pédagogique dans lequel elle s'inscrit.

Objectifs pédagogiques

Approfondir les méthodes statistiques d'analyse exploratoire, de régression et de classification

Contenu

Méthodes d’analyse exploratoire et confirmatoire :

  • Analyse factorielle exploratoire et confirmatoire
  • Codage optimal
  • Positionnement Multidimensionnel
  • Classification non supervisée et modèles de mélanges

Méthodes prédictives :

Méthodes de régression

  • Estimation des paramètres par ré-échantillonnage (Bootstrap, Jackknife)
  • Multicolinéarité et stabilité des estimations
  • Complexité du modèle, trade-off biais-variance et précision des prédictions
  • Méthodes de sélection des variables (Best subset regression, méthodes pas à pas)
  • Méthodes de régularisation par composantes : Régression sur Composantes Principales, Régression PLS
  • Méthodes de régularisation par contraintes : Régression Ridge, LASSO, Elastic Net
  • Sélection de modèle par procédures d'apprentissage statistique
  • Régression robuste
  • Régression non paramétrique

Méthodes de classification supervisée

  • Régression logistique binaire
  • Régression Logistique multinomiale et ordinale
  • Analyse factorielle discriminante
  • Discrimination sur variables qualitatives
  • Analyse discriminante probabiliste Linéaire et Quadratique
  • Approche non paramétrique : Méthode des noyaux, Méthode des k plus proches voisins

Traitement des données manquantes

 

Modalités de validation

  • Projet(s)

Description des modalités de validation

La validation repose sur la réalisation d'une note de lecture d'articles scientifiques ou l'étude d'un jeu de données en utilisant les méthodes vues en cours.

Bibliographie

TitreAuteur(s)
Analyse des données ( Hermes,2003)G.GOVAERT
Analyse discriminante (Dunod,2001)M.BARDOS
Statistique explicative appliquée (Technip, 2003)J.P.NAKACHE, J.CONFAIS
Probabilités, analyse des données, statistique 3ème édition (Technip,2010)G.SAPORTA
Data mining et statistique décisionnelle, 3ème édition (Technip, 2010)S.TUFFERY
The Elements of Statistical Learning (Springer 2009). Téléchargeable ici : http://www-stat.stanford.edu/~tibs/ElemStatLearn/download.htmlT.HASTIE, J.FRIEDMAN, F.TIBSHIRANI
Multivariate Analysis, Academic Press, 1979K.V. Mardia, J.T. Kent and J.M. Bibby

Thésaurus du Cnam :

  • Statistiques et applications
  • Analyse factorielle
  • Modèles à équations structurelles
  • Régression régularisée
  • fouille de donnees
  • Analyse discriminante
  • Algorithme d'apprentissage
  • Echantillonnage
  • Estimation non paramétrique
  • Statistique décisionnelle
  • Robustesse
  • Langage R
  • Modélisation statistique
  • Data mining
  • Régression multiple
  • Régression logistique
  • Logiciel SAS
  • big data
  • Analyse des données

Thésaurus Formacode :

  • 11057 - statistique inférentielle
  • 11006 - analyse factorielle
  • 31068 - méthode analyse
  • 11050 - mathématiques informatiques
  • 31032 - système exploitation informatique

Secrétariat

Libellé
EPN06 Mathématiques et statistiques
Nom du contact
Sabine Glodkowski
Numéros de téléphone
Aucun numéro de téléphone
Adresse postale
2 rue conté Accès 35 3 ème étage porte 19
Paris 75003