Contributions à l'apprentissage par renforcement inverse - TEL - Thèses en ligne
Thèse Année : 2013

Work on Inverse Reinforcement Learning

Contributions à l'apprentissage par renforcement inverse

Résumé

Cette thèse, intitulée "Contributions à l’apprentissage par renforcement inverse", fournit trois contributions majeures au domaine. La première est une méthode d’estimation de l’attribut moyen, une quantité exploitée par la grande majorité des approches constituant l’état de l’art. Elle a permis d’étendre ces approches au cadre batch et off-policy. La seconde contribution majeure est un algorithme d’apprentissage par renforcement inverse, structured classification for inverse reinforcement learning (SCIRL), qui relâche une contrainte standard du domaine, la résolution répétée d’un processus décisionnel de Markov en introduisant la structure temporelle (par le biais de l’attribut moyen) de ce processus dans un algorithme de classification structurée. Les garanties théoriques qui lui sont attachées et ses bonnes performances en pratique ont permis sa présentation dans une conférence internationale prestigieuse : NIPS. Enfin, la troisième contribution est constituée par la méthode cascaded supervised learning for inverse reinforcement learning (CSI) consistant à apprendre le comportement de l’expert par une méthode supervisée puis à introduire la structure temporelle du MDP par une régression mettant en jeu la fonction de score du classifieur utilisé. Cette méthode offre des garanties théoriques de même nature que celles de SCIRL tout en présentant l’aventage d’utiliser des composants standards pour la classification et la régression, ce qui simplifie la mise en œuvre. Ce travail sera présenté dans une autre conférence internationale prestigieuse : ECML.
Fichier principal
Vignette du fichier
These_EK.pdf (3.36 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-01303275 , version 1 (22-04-2016)

Licence

Identifiants

  • HAL Id : tel-01303275 , version 1

Citer

Edouard Klein. Contributions à l'apprentissage par renforcement inverse. Intelligence artificielle [cs.AI]. Université de Lorraine, 2013. Français. ⟨NNT : ⟩. ⟨tel-01303275⟩
696 Consultations
441 Téléchargements

Partager

More