Optimisation simultanée et planification de trajectoires pour une formation d’agents / Nour Mitiche (2021)
Optimisation simultanée et planification de trajectoires pour une formation d’agents [document électronique] / Nour Mitiche, Auteur ; Zakaria elhabib Bouzit, Auteur ; Mohamed Tadjine, Directeur de thèse ; Messaoud Chakir, Directeur de thèse . - [S.l.] : [s.n.], 2021 . - 120 f., 1 fichier PDF (5,3 Mo) : ill.
Mode d'accès : accès au texte intégral par intranet.
Mémoire de Projet de Fin d’Études : Automatique : Alger, École Nationale Polytechnique : 2021
Bibliogr. f. 116-119
Langues : Français (fre)
Mots-clés : Planification de trajectoires
Systèmes multi-agents
RRT
Deep q-learning
OptimisationIndex. décimale : PA02421 Résumé : La planification de trajectoire est l’une des technologies clés pour faciliter la manoeuvrabilité autonome des robots mobiles. Cette problématique devient plus complexe dans les domaines qui nécessitent une structure multi-agent afin d’être en mesure d’effectuer des tâches trop complexes pour un agent unique. Le but est d’obtenir des trajectoires optimales sans collision qui garantissent l’accomplissement de l’objectif commun selon des critères particuliers. Dans notre mémoire, nous présentons deux solutions différentes : l’apprentissage centralisé à base de Reinforcement Learning (DQN), et l’exploration décentralisée à base de RRT*. Nous avons fini par proposer une solution plus performante basée sur l’optimalité de Pareto dans la structure décentralisée, ainsi qu’une amélioration de l’apprentissage dans la solution centralisée. Ces solutions ont été calculées sous Python, puis simulées sous MATLAB sur des robots différentiels mobiles.