Apprentissage statistique : modélisation descriptive et introduction aux réseaux de neurones
6 crédits Michel CRUCIANU EPN05 - Informatique Unité d'enseignement de type cours
Publié Du 01-09-2007 au 31-08-9999
Cet enseignement s'adresse aux auditeurs souhaitant acquérir des connaissances de base sur l'analyse des données, la reconnaissance des formes et la fouille de données (data mining).
Prérequis obligatoires : avoir suivi le cycle préparatoire de l'EICNAM ou avoir un niveau équivalent (licence).
Ce cours donne des éléments de base de l'analyse des données et de la modélisation descriptive, ainsi que des principes à mettre en œuvre pour traiter des applications réelles. Une introduction à la modélisation décisionnelle avec des réseaux de neurones est également présentée. L'analyse des données et la modélisation descriptive aident à comprendre les données empiriques issues de phénomènes naturels, économiques ou socio-culturels. Cette compréhension facilite la mise en œuvre de méthodes performantes de construction de modèles décisionnels.
Les méthodes abordées ont de très nombreuses applications dans des domaines aussi divers que l'assurance qualité, les enquêtes d'opinion, le marketing, la gestion de la relation client, la climatologie, la sécurité, etc.
L'enseignement adopte une approche pragmatique, les séances de travaux pratiques permettant la mise en œuvre systématique des méthodes présentées.
Les unités d'enseignement RCP209 « Apprentissage statistique : modélisation décisionnelle et apprentissage profond », RCP211 « Intelligence artificielle avancée » et RCP217 « Intelligence artificielle pour des données multimédia » sont des suites recommandées de RCP208.
Analyse des données, modélisation descriptive à partir de données, introduction à la modélisation décisionnelle avec application à la reconnaissance des formes et à la fouille de données.
L'unité RCP208 apparaît dans 7 cursus.
Certificat de spécialisation Intelligence artificielle
Certificat de spécialisation Intelligence artificielle et calcul scientifique
Diplôme d'ingénieur Spécialité informatique parcours Intelligence Artificielle et Optimisation
Diplôme d'ingénieur Spécialité informatique parcours Cybersécurité
Master Sciences, technologies, santé mention Informatique parcours Recherche opérationnelle
Master Sciences, technologies, santé mention Informatique parcours Systèmes d'information et business intelligence HTT
Master Sciences, technologies, santé mention Informatique parcours Traitement de l'information et exploitation des données
Les thèmes abordés dans les séances de cours et de travaux pratiques (TP) sont :
Chaque séance de cours est suivie d'une séance de TP permettant de mettre en œuvre les méthodes présentées.
Les TP sont réalisés en utilisant principalement la plateforme Scikit-learn. Une introduction rapide au langage Python, à NumPy, à matplotlib et à Scikit-learn est prévue lors des premières séances de TP.
Examen ; certaines questions peuvent porter sur les travaux pratiques.
Titre | Auteur(s) |
---|---|
Reconnaissance des formes : méthodes et applications. Ed. Inter Editions. | A. Belaid, Y. Belaid |
Réseaux de neurones : méthodologies et applications. Ed. Eyrolles. | G. Dreyfus, et al |
Méthodes factorielles pour l'analyse des données : méthodes linéaires et extensions non-linéaires. Ed. Hermès. | M. Crucianu, J.-P. Asselin de Beauville, R. Boné |
Probabilités, analyse des données et statistique. Ed. TECHNIP. | G. Saporta |
Principles of Data Mining (Adaptive Computation and Machine Learning). Ed. Bradford Book. | D.J. Hand, H. Mannila, P. Smyth |