STA109

Biostatistique


6 crédits Aurélien LATOUCHE EPN06 - Mathématique et statistique Unité d'enseignement de type cours

Publié Du 01-09-2007 au 31-08-9999

Prérequis

Cet enseignement concerne les auditeurs travaillant dans le domaine de la santé (hôpitaux - laboratoires de recherche - industrie pharmaceutique...) ou de la sécurité sanitaire (agences - laboratoires d'analyse ...). Il s'adresse aux personnes amenées à concevoir, gérer et/ou analyser des protocoles d'études (clinique, épidémiologiques...) ou d'expérimentation (médecine - biologie...) et plus généralement à toute personne confronté à la variabilité biologique (en particulier en bio-informatique).
Il demande d'avoir des notions générales en mathématiques (niveau 1er ou terminale). Des connaissances supplémentaires en probabilité ou statistique sont appréciées.

Objectifs pédagogiques

Donner les connaissances nécessaires 
- à la préparation d'une expérience correcte du point de vue statistique en fonction des objectifs de l'étude
- à la description et à l'analyse statistique des données recueillies
- pour interpréter correctement les résultats obtenus et pour savoir les communiquer.

Compétences

A l'issue de l'enseignement l'étudiant devra savoir :
- Aborder méthodiquement un protocole expérimental.
- Maîtriser les outils simples d'exploration des données.
- Maîtriser le choix d'un modèle statistique simple représentant au mieux les données.
- Maîtriser le choix d'un outil d'aide à la décision (test statistique) en adéquation au contexte expérimental.
De ce fait il doit pouvoir acquérir un regard critique lui permettant d'analyser les résultats d'une enquête ou d'une expérience.

Contenu

• Notions de base : La variabilité  - l'échantillonnage - la représentativité - notions de ré-échantillonnage.
Qu'est-ce qu'une expérience contrôlée - une étude descriptive - exemples : études cas-témoins - cohortes...
 
Comment aborder un problème de statistique (description, modèle, hypothèses, décision) '
Statistique descriptive  : présentation graphique des données (histogramme), paramètres empiriques (proportion, moyenne, mode, quantiles, variance), fonction de répartition observée, tableau de contingence.

Rappels rapides sur le calcul de probabilité : combinatoire, événements.

L'information a priori : probabilité conditionnelle, théorème de Bayes, sensibilité, spécificité, valeurs prédictives positives et négatives, risque relatif, courbes ROC
Variables aléatoires  : définitions, distribution de probabilité, espérance, variance Variable centrée et réduite.
Lois de probabilités usuelles : loi binomiale, loi de Poisson, loi normale, loi Pearson (Khi 2), loi de Student, loi de Fisher. Conditions et contextes d'applications. Théorème de la limite centrale.
Estimation : estimation ponctuelle, qualité d'un estimateur,  intervalle de confiance de paramètres usuels (espérances, variances, fréquences).
Principes généraux des tests : risques de 1ère et 2ème espèce; degré de signification (p).
• Tests paramétriques et non paramétriques :
1. tests portant sur la comparaison de proportions ou de distributions.
2. tests portant sur la comparaison de moyennes ou de variances d'un ou de deux échantillons indépendants ou appariés.
3. test portant sur la comparaison de plusieurs moyennes sur des échantillons indépendants.
4. test des signes, test de Wilcoxon, test de Mann-Witney, test de Spearman, test de Kruskal et Wallis.
5. détermination du nombre d'observations (ou de sujets) nécessaires.
Modèle linéaire : régression simple, test d'indépendance.

Les exercices dirigés seront illustrés par des exemples à l'aide du logiciel R

Bibliographie

TitreAuteur(s)
http://www.agro-montpellier.fr/cnam-lr/statnet/St@tNet
Méthodes statistiques -Médecine - Biologie (Estem 2000)BOUYER J.
Méthodes statistiques – Exercices corrigés (Estem 2001)BOUYER J.
Biostatistique, Flammarion, 2007VALLERON, A.J.
Comprendre et utiliser les statistiques dans les sciences de la vie (Masson, 2005)FALISSARD, B

Thésaurus du Cnam :

  • Statistique inférentielle
  • Analyse statistique des données
  • Biostatistique
  • Statistique biomédicale
  • Estimation non paramétrique
  • Estimation paramétrique
  • Test
  • Langage R
  • Statistique descriptive
  • Régression linéaire
  • Régression simple

Thésaurus Formacode :

  • 11006 - analyse factorielle
  • 11017 - statistique appliquée
  • 11057 - statistique inférentielle
  • 30854 - langage informatique

Secrétariat

Libellé
EPN06 Mathématiques et statistiques
Nom du contact
Sabine Glodkowski
Numéros de téléphone
Aucun numéro de téléphone
Adresse postale
2 rue conté Accès 35 3 ème étage porte 19
Paris 75003