RCP217

Intelligence artificielle pour des données multimédia


6 crédits Marin FERECATU EPN05 - Informatique Unité d'enseignement de type mixte

Publié Du 01-01-2020 au 31-08-9999

Prérequis

Cette UE s'adresse à un public ayant des connaissance en informatique (programmation, bases de données) et en mathématiques appliquées (niveau bac+5). Ce cours constitue un cours "avancé", il est conseillé d'avoir suivi les UE RCP208 et RCP209 pour le suivre. Il convient notamment d'avoir des connaissances en apprentissage statistique et en apprentissage profond, et de maîtriser les librairies Python pour ce type de méthodes (Scikit-learn, TensorFlow, PyTorch).

Objectifs pédagogiques

Former les auditeurs aux techniques modernes d'intelligence artificielle appliquées au données de type multimédia et appliquer ces techniques à des problématiques couramment utilisées en sciences des données.

Compétences

Capacité à mettre en œuvre des techniques modernes d'intelligence artificielle appliquées au données multimédia, notamment les grandes bases d'images et de vidéos, séries temporelles, texte, données de type graphe. Application des ces techniques à des problématiques concrètes et couramment utilisées en sciences des données.

 

Contenu

Données spatio-temporelles : L'objectif est d'étudier l'adaptation des modèles d'IA dans le cas où la dimension temporelle revêt une importance particulière. Les applications potentielles couvrent l'interprétation de vidéos, de données audio, ou plus généralement de séries spatio-temporelles multi-variées, avec des applications dans différents champs de la physique (biologie, sismologie, climatologie) et de la prédiction financière.

Traitement de la langue naturelle : Les données textuelles couvrent des applications très nombreuses (chatbot, traduction automatiques, robots assistants, analyse syntaxique, etc). L'objectif sera d'étudier les modèles modernes d'"embedding vectoriels", sémantique distributionnelle, modèles récurrents pour l’annotation automatique et modèles de réécriture (encodeurs/décodeurs), et traduction automatique, ainsi que de les confronter et de les coupler aux méthodes historiques issues de la linguistique. Une partie dédiée à la fusion d'informations visuelles (ConvNets) et textuelles (RNN) est aussi envisagée avec des applications à l’annotation d’images et aux systèmes de questions-réponses visuels.

Graphes et systèmes de recommandations : L'objectif est d'adapter les méthode d'IA aux données de type graphe, qui sont ubiquitaires dans le monde numérique moderne (réseaux sociaux, données 3D dans le monde de la modélisation comme pour le CAD ou l'industrie automobile, etc). Une des principales difficulté est d'adapter les méthodes pour être capable de traiter des grilles non régulières ; les solutions actuelles de l'état de l'art seront introduites.

Modalités de validation

  • Projet(s)
  • Examen final

Description des modalités de validation

La note finale est la moyenne entre la note obtenue au projet et la note obtenue à l'examen final.

Bibliographie

TitreAuteur(s)
Video Activity Recognition: State-of-the-Art, Sensors 19(4), 2019Rodríguez-Moreno et al.
Intelligent video surveillance: a review through deep learning techniques for crowd analysis, Journal of Big Data, 6(48), 2019Sreenu et al.
Deep learning for time series classification: a review, Data Mining and Knowledge Discovery (2019)Fawaz et al.
Speech and Language Processing, Pearson, 2008Jurafsky et al.
Recommender systems, Springer 2016Aggarwal et al.

Thésaurus du Cnam :

  • Intelligence artificielle
  • Multimédia
  • Algorithme d'apprentissage
  • Optimisation dans les graphes
  • Vidéo
  • Son

Thésaurus Formacode :

  • 31028 - intelligence artificielle

Secrétariat

Libellé
EPN05 Informatique
Nom du contact
Swathi RANGANADIN RAJASELVAM
Numéros de téléphone
01 40 27 22 58
Adresse postale
2 rue conté 31.1.79
Paris 75003

Personnes impliquées nationalement

  • Marin FERECATU
  • Nicolas THOME
  • Nicolas AUDEBERT
  • Serge ROSMORDUC
  • Michel CRUCIANU
  • Raphaël FOURNIER-S'NIEHOTTA