Données catégorielles
9 crédits Vincent AUDIGIER EPN06 - Mathématique et statistique Unité d'enseignement de type cours
Publié Du 01-09-2007 au 31-08-9999
Ce cours s'adresse en priorité aux auditeurs préparant le master MR123.
Il s'adresse également à des auditeurs préparant le diplôme d'actuaire.
Niveau requis : STA102 (régression et analyse de la variance) et STA104 (statistique mathématique).
Permettre aux ingénieurs, cadres d'entreprises ou d'administrations, médecins, chercheurs, de construire des modèles explicatifs de variables qualitatives. Le cours s'appuie sur la pratique du logiciel SAS, mis à disposition des auditeurs.
L'unité STA212 apparaît dans 3 cursus.
Master Sciences, technologies, santé, mention mathématiques appliquées, statistique parcours Statistique du risque pour la finance et l'assurance
Master Sciences, technologies, santé mention Informatique parcours Traitement de l'information et exploitation des données
Master Sciences, technologies, santé, mention mathématiques appliquées, statistique parcours Science des données
Présentation des méthodes statistiques traitant des variables qualitatives
Principes généraux d'estimation d'un modèle (maximum de vraisemblance)
La régression logistique simple
Notion de variable latente
Les modèles PROBIT, LOGIT
Le modèle logistique et son interprétation
Analyse des résidus, des observations
La régression logistique multiple
Le modèle : prédicteurs quantitatifs ou qualitatifs
Sélection de variables
Résumé des tests de validité générale d'un modèle
Tables de classement, courbe ROC
Interprétation des coefficients de la régression logistique : odds ratio
La régression logistique dans le cas où Y est une variable polytomique ordonnée
Aspects pratiques de la mise en oeuvre des méthodes de régression logistique
La procédure LOGISTIC
Présentation des modèles linéaires généralisés et de la procédure GENMOD
Régression de Poisson
Etude de contrastes
Modélisation d'une réponse multinomiale
Estimation par maximum de vraisemblance ou par moindres carrés généralisés
Etude de cas avec la procédure CATMOD
Comparaison de la régression logistique avec d'autres méthodes de modélisation d'une réponse qualitative
Analyse discriminante sur variables quantitatives et qualitatives
Arbres de décision
Eléments pratiques de création d'un score
Méthodes PLS
Présentation de NIPALS, PLS1,PLS2
Applications: régression logistique PLS, analyse discriminante PLS
Modèles linéaires généralisés PLS
Rédaction d'un mémoire utilisant les méthodes présentées en cours
Titre | Auteur(s) |
---|---|
Applied logistic regression 2ième édition (Wiley, 2000) | HOSMER D., LEMESHOW S. |
Statistique explicative appliquée (Technip, 2003) | NAKACHE J.P., CONFAIS J. |
Modèles statistiques pour données qualitatives (Technip 2005) | Editeurs DROESBEKE, LEJEUNE, SAPORTA; Auteurs: CROUX, GONZALEZ.... |
Categorical Data Analysis using the SAS System (SAS Institute Inc, Cary, NC, 2000) | STOKES M.E., DAVIS C.S. & KOCH G.G. |
Analyse discriminante (Dunod, 2001) | BARDOS M. |
Categorical data analysis 2ième édition (Wiley, 2002) | AGRESTI A. |