Apprentissage statistique : modélisation décisionnelle et apprentissage profond
Sessions de formation
(Fuseau horaire : Europe/Paris)
Centre Cnam Paris - Formation 1er Semestre ouverte et à distance
La période de cours est planifiée du 16/09/2024 au 18/01/2025
L'inscription est actuellement terminée pour cette session
Centre Cnam Paris - Formation 2nd Semestre en présentiel
La période de cours est planifiée du 03/02/2025 au 07/06/2025
L'inscription est ouverte jusqu'au 14/03/2025 17:00
Présentation
Public, conditions d'accès et prérequis
Cet enseignement s'adresse aux auditeurs et auditrices souhaitant se former à l'apprentissage statistique, notamment à l'apprentissage profond et aux réseaux de neurones artificiels.
Prérequis :
- avoir un niveau équivalent licence en mathématiques (algèbre linéaire, probabilités, statistiques, analyse) et en informatique (savoir programmer),
- Avoir suivi la première partie du cycle spécialisation de l'EICNAM ou avoir le niveau M1 (Bac + 4) est suffisant.
- Le langage de programmation utilisé durant le cours est Python.
- Il est recommandé d'avoir suivi au préalable l'UE RCP208 « Apprentissage statistique : modélisation descriptive et introduction aux réseaux de neurones » ou un enseignement équivalent comportant une présentation des méthodes de base d'analyse des données et de modélisation descriptive des données.
Objectifs
Ce cours présente les méthodes modernes d'intelligence artificielle pour la modélisation décisionnelle à partir des données, notamment les machines à vecteurs supports (SVM), les forêts aléatoires et les réseaux de neurones profonds, en vue de leur utilisation dans des applications réelles.
L'apprentissage automatique ou (machine learning) permet de construire des modèles prédictifs à partir de jeux de données empiriques, par exemple pour la prise de décision. Les méthodes abordées font partie de l'intelligence artificielle et de la fouille de données et ont de très nombreuses applications dans des domaines aussi divers que l'assurance qualité, le diagnostic médical, les véhicules autonomes, la bio-ingénierie, la climatologie, la sécurité environnementale, le marketing, la gestion de la relation client, la recherche d'information, etc.
Contenu
Les thèmes abordés dans les séances de cours et de travaux pratiques (TP) sont :
- Bases de l'apprentissage supervisé : qu'est-ce qu'un modèle décisionnel ?
- Évaluation et sélection de modèles.
- Arbres de décision et forêts d'arbres de décision (random forest).
- Machines à vecteurs de support (SVM) :
- discrimination, régression,
- estimation du support d'une distribution, ingénierie des noyaux.
- Réseaux de neurones artificiels :
- apprentissage de représentations
- apprentissage profond (deep learning)
- réseaux convolutifs
- réseaux récurrents
Chaque séance de cours est suivie d'une séance de travaux pratiques (TP) permettant de mettre en œuvre les méthodes présentées. Les TP sont réalisés à l'aide du langage de programmation Python, en utilisant les bibliothèques logicielles Scikit-learn et Keras. Une introduction à Scikit-learn et à Keras est prévue lors des séances de TP.
Bibliographie
Titre | Auteur(s) |
---|---|
Introduction au machine learning | Chloé-Agathe Azencott |
Machine learning avec Scikit-Learn | Aurélien Géron |
Deep learning avec Keras | Aurélien Géron |
L'apprentissage profond | Aaron Courville, Ian Goodfellow, Yoshua Bengio |
Modalités d'évaluation
- Projet(s)
- Examen final
L'UE est évaluée sur un projet personnel et un examen écrit. La note finale est la moyenne entre la note obtenue au projet et la note obtenue à l'examen.