STA102

Modèles linéaires


6 crédits Giorgio RUSSOLILLO EPN06 - Mathématique et statistique Unité d'enseignement de type cours

Publié Du 01-09-2007 au 31-08-9999

Prérequis

Bases d'inférence statistique : variables aléatoire, statistiques et distributions d'échantillonnage, estimation ponctuelle et par intervalle, tests d'hypothèses. Notions de calcul matriciel.

Les UE STA104 et STA101 donnent toutes les connaissances nécessaires pour intégrer le cours.

Objectifs pédagogiques

Le cours présente des méthodes pour décrire, expliquer ou prédire une variables à l'aide d'un ou plusieurs caractères quantitatifs et/ou qualitatifs. Ces méthodes, fondées sur le modèle linéaire, sont illustrées par des sorties SAS.

Contenu

Régression linéaire simple :

  • analyses des données, ajustement linéaire par le critère des moindres carrés, décomposition de la somme des carrés totale, qualité de l'ajustement, points leviers
  • hypothèses du modèle, estimation des paramètres par la méthode des moindres carrés et de maximum de vraisemblance
  • ajustement du modèle
  • validation du modèle : test d'hypothèses et intervalles de confiance sur les coefficients, test de la signification globale du modèle, intervalle de confiance pour la droite, intervalle de prédiction
  • diagnostic du modèle
  • détection d'observations aberrantes et d'observation influentes

Régression linéaire multiple :

  • analyses des données, ajustement linéaire par le critère des moindres carrés, décomposition de la somme des carrés totale, qualité de l'ajustement, points leviers
  • hypothèses du modèle, estimation des paramètres par la méthode des moindres carrés 
  • la géométrie du modèle de régression multiple
  • théorème de Gauss - Markov
  • ajustement du modèle
  • validation du modèle : test d'hypothèses et intervalles de confiance sur les coefficients, théorème de Cochran, test de la signification globale du modèle, intervalle de confiance pour la droite, intervalle de prédiction
  • diagnostic du modèle
  • détection d'observations aberrantes et d'observation influentes
  • multicolinéarité : diagnostic et remèdes
  • sélection de variables
  • détection d'observations aberrantes et d'observation influentes

Analyse de la variance - modèle à un facteur :

  • l'analyse de la variance a un facteur comme modèle linéaire
  • estimation des paramètres (dispositif équilibré et déséquilibré) 
  • décomposition de la somme des carrées totale et qualité de l'ajustement du modèle
  • test de l'effet du facteur
  • validation des hypothèses de normalité et de homoscédasticité
  • tests post hoc pour les comparaisons multiples de moyennes
  • analyse de la variance non paramétrique

Analyse de la variance - modèle à deux facteurs :

  • l'analyse de la variance à deux facteurs comme modèle linéaire
  • estimation des paramètres et qualité du modèle
  • test d'hypothèses et intervalles de confiance sur les coefficients
  • étude de l'interaction
  • décomposition de la somme des carrés totale
  • décomposition de la somme des carrées du modèle
  • test de la significativité globale du modèle
  • tests des effets
  • test de comparaison des moyennes pour chaque facteur
  • test de comparaison des moyennes par traitements

Analyse de la covariance :

  • le modèle d'analyse de la covariance
  • estimation des paramètres
  • décomposition de la somme des carrés totale, ajustement du modèle
  • test de significativité globale du modèle
  • test des effets
  • test de comparaison des moyennes par traitements
  • sélection du modèle

Modalités de validation

  • Examen final

Description des modalités de validation

Examen écrit

Bibliographie

TitreAuteur(s)
Statistique théorique et appliquée - tome 2 (De Boeck, Bruxelles 2011)P. DAGNELIE
Analyse de régression appliquée (Dunod 2004)Y. DODGE
Applied regression analysis (Wiley 1998)N. DRAPER et H. SMITH
Statistique: la théorie et ses applications (Springer 2010)M. LEJEUNE
SAS for Linear Models, Fourth Edition (SAS Institute Inc. 2002)R.C. LITTELL
Probabilités, analyse des données, statistique (Technip 2011)G.SAPORTA
Univariate and Multivariate General Linear Models: Theory and Applications using SAS Software (SAS Institute Inc. 1997)N.H. TIMM
Statistique. Méthodes pour décrire, expliquer et prévoir. (Dunod, 2007)M.TENENHAUS

Thésaurus du Cnam :

  • Prévision
  • Statistique décisionnelle
  • Modèle linéaire
  • Analyse de variance
  • Analyse de la covariance
  • Langage R
  • Modélisation statistique
  • Régression multiple
  • Régression simple

Thésaurus Formacode :

  • 11007 - plan expérience
  • 31068 - méthode analyse
  • 30854 - langage informatique

Secrétariat

Libellé
EPN06 Mathématiques et statistiques
Nom du contact
Sabine Glodkowski
Numéros de téléphone
Aucun numéro de téléphone
Adresse postale
2 rue conté Accès 35 3 ème étage porte 19
Paris 75003