Apprentissage statistique : modélisation décisionnelle et apprentissage profond

Réf. : RCP209

Sessions de formation

(Fuseau horaire : Europe/Paris)

Centre Cnam Paris - Formation 1er Semestre ouverte et à distance

La période de cours est planifiée du 16/09/2024 au 18/01/2025

L'inscription est actuellement terminée pour cette session

Centre Cnam Paris - Formation 2nd Semestre en présentiel

La période de cours est planifiée du 03/02/2025 au 07/06/2025

L'inscription est ouverte jusqu'au 14/03/2025 17:00

Présentation

Public, conditions d'accès et prérequis

Cet enseignement s'adresse aux auditeurs et auditrices souhaitant se former à l'apprentissage statistique, notamment à l'apprentissage profond et aux réseaux de neurones artificiels.

Prérequis :

  • avoir un niveau équivalent licence en mathématiques (algèbre linéaire, probabilités, statistiques, analyse) et en informatique (savoir programmer),
    • Avoir suivi la première partie du cycle spécialisation de l'EICNAM ou avoir le niveau M1 (Bac + 4) est suffisant.
    • Le langage de programmation utilisé durant le cours est Python.
  • Il est recommandé d'avoir suivi au préalable l'UE RCP208 « Apprentissage statistique : modélisation descriptive et introduction aux réseaux de neurones » ou un enseignement équivalent comportant une présentation des méthodes de base d'analyse des données et de modélisation descriptive des données.

Objectifs

Ce cours présente les méthodes modernes d'intelligence artificielle pour la modélisation décisionnelle à partir des données, notamment les machines à vecteurs supports (SVM), les forêts aléatoires et les réseaux de neurones profonds, en vue de leur utilisation dans des applications réelles.
L'apprentissage automatique ou (machine learning) permet de construire des modèles prédictifs à partir de jeux de données empiriques, par exemple pour la prise de décision. Les méthodes abordées font partie de l'intelligence artificielle et de la fouille de données et ont de très nombreuses applications dans des domaines aussi divers que l'assurance qualité, le diagnostic médical, les véhicules autonomes, la bio-ingénierie, la climatologie, la sécurité environnementale, le marketing, la gestion de la relation client, la recherche d'information, etc.

Contenu

Les thèmes abordés dans les séances de cours et de travaux pratiques (TP) sont :

  • Bases de l'apprentissage supervisé : qu'est-ce qu'un modèle décisionnel ?
  • Évaluation et sélection de modèles.
  • Arbres de décision et forêts d'arbres de décision (random forest).
  • Machines à vecteurs de support (SVM) :
    • discrimination, régression,
    • estimation du support d'une distribution, ingénierie des noyaux.
  • Réseaux de neurones artificiels :
    • apprentissage de représentations
    • apprentissage profond (deep learning)
    • réseaux convolutifs
    • réseaux récurrents

Chaque séance de cours est suivie d'une séance de travaux pratiques (TP) permettant de mettre en œuvre les méthodes présentées. Les TP sont réalisés à l'aide du langage de programmation Python, en utilisant les bibliothèques logicielles Scikit-learn et Keras. Une introduction à Scikit-learn et à Keras est prévue lors des séances de TP.

Bibliographie

Titre Auteur(s)
Introduction au machine learning Chloé-Agathe Azencott
Machine learning avec Scikit-Learn Aurélien Géron
Deep learning avec Keras Aurélien Géron
L'apprentissage profond Aaron Courville, Ian Goodfellow, Yoshua Bengio

Modalités d'évaluation

  • Projet(s)
  • Examen final

L'UE est évaluée sur un projet personnel et un examen écrit. La note finale est la moyenne entre la note obtenue au projet et la note obtenue à l'examen.