Modélisation statistique

Réf. : STA110

Sessions de formation

(Fuseau horaire : Europe/Paris)

Centre Cnam Paris - Formation 2nd Semestre ouverte et à distance

La période de cours est planifiée du 03/02/2025 au 07/06/2025

L'inscription est ouverte jusqu'au 14/03/2025 17:00

Présentation

Public, conditions d'accès et prérequis

Avoir le niveau de l'unité d'enseignement : STA. 103 (calcul des probabilités) et STA001 (Techniques de la statistique)

Objectifs

Maîtriser les outils de la modélisation statistique (sélection de modèles, validation, interprétation) dans un contexte général (données continues, discrètes, qualitatives, mixtes) via l'utilisation de méthodes paramétriques (modèles linéaires et modèle linéaire généralisé) ou non-paramétriques.

Acquérir des connaissances ainsi qu'un savoir-faire dont l'objectif est de traiter un problème concret par une approche de modélisation (applications à des données réelles).

Mettre en œuvre cette modélisation à l'aide d'un logiciel de modélisation statistique avancé (logiciel R) et savoir interpréter les résultats obtenus.

Contenu

I) Méthodes paramétriques

Régression linéaire simple et multiple : modèle, moindres carrés, estimations, intervalles de confiance, tests, colinéarité, sélection de variables, validation, prédiction, interprétation. Recherche de points (aberrants, influents, atypiques et de points leviers).

Analyse de la Variance : à 1 facteur (mesures indépendantes, répétées) et à 2 facteurs (mesures indépendantes)  

Analyse de la Covariance (modèles, comparaison à la régression linéaire et à l'ANOVA à 1 facteur à mesures indépendantes, paradoxe de Lord)

Régression logistique : modèle probit et logit, estimations, tests, sélection de modèles, validation, prédiction.

Modèle linéaire généralisé (regression de Poisson, modèle polytomique)

Introduction à la modélisation Bayésienne
Introduction à l'analyse de séries temporelles


II) Méthodes non-paramétriques

Régression spline

Estimateurs par moyennes locales (estimateurs à noyau)

Régression polynomiale locale

L'enseignement comporte une initiation au logiciel R et une mise en oeuvre de ce logiciel dans diverses applications.

Bibliographie

Titre Auteur(s)
Regression analysis of count data models (Cambridge University Press) CAMERON, TRIVEDI
Time series analysis (Princeton University Press) HAMILTON
Le modèle linéaire par l’exemple (Dunod) Azaïs J-M., Bardet J-M
Régression linéaire : Théorie et applications (Statistiques et probabilités appliquées)) Cornillon P., Matzner-Lober, E.
Statistiques avec R (PUR) , Cornillon, PA, Guyader, A., Husson, F., Jégou, N., Josse, J., Kloareg, M., Matzner-Lober, E., Rouvière, L.
Statistique inférentielle : idées, démarches, exemples. (PUR) J.J. Daudin, S. Robin, C. Vuillet
Modèle linéaire, Comparaison de groupes et régression (Les Editions INSERM) Prum, B.
Probabilités, Analyse des données et Statistiques (Technip) G. Saporta

Modalités d'évaluation

  • Projet(s)

L'évaluation se fera uniquement sous la forme de projets consistant en l'application des différentes méthodes de modélisation sur des données réelles. Cette évaluation sur projet sera complétée par une présentation orale.