VEDECOM a le plaisir de vous annoncer la soutenance de thèse de Tatiana BABICHEVA, docteur en mathématiques appliquées et applications des mathématiques.

 

« Machine Learning pour la gestion distribuée et dynamique d’une flotte de taxis et navettes autonomes », tel est le thème de sa thèse qui se tiendra le 10 mars 2021 à 9h30 par zoom.

 

N’hésitez pas à suivre cet évènement :

Lien de connexion à la soutenance de thèse

 

Le jury est composé de :

  • Mme Leïla KLOUL, MCF (HDR), Université de Versailles Saint-Quentin-en-Yvelines, FRANCE – Directeur de these
  • M. Dominique BARTH, Professeur, Université de Versailles SainDt-Quentin-en-Yvelines, FRANCE – Co-encadrant de these
  • M. Alain QUILLIOT, Professeur des Universités, Université Clemont-Ferrand II, FRANCE – Rapporteur
  • M. Akka ZEMMARI, Maître de conférences (HDR), Université de Bordeaux, FRANCE – Rapporteur
  • M. Wilco BURGHOUT, Directeur de recherche, KTH Royal Institute of Technology, SUÈDE – Co-encadrant de these
  • M. Jakob PUCHINGER , Professor, CentraleSupélec, FRANCE – Examinateur
  • M. René MANDIAU, Professeur des universités, Université Polytechnique Hauts-de-France , FRANCE – Examinateur
  • M. S. M. Hassan Mahdavi, PhD, Vedecom, Mobilab – Invité

Résumé

Cette thèse a pour objet l’étude des méthodes de gestion des systèmes urbains de taxis électriques autonomes partagés dans un contexte en ligne dans lequel :

  • les requêtes des clients se produisent au fil du temps
  • les véhicules sont disponibles pour le partage de trajet et nécessitent une gestion de la recharge électrique.

Nous proposons des heuristiques basées sur la décomposition de ce problème qui inclut la répartition du réseau routier et la mise en évidence de sous-problèmes tels que la gestion de la charge, la redistribution des véhicules vides et le partage de trajet dynamique.

Nous proposons un ensemble de nouvelles méthodes proactives de redistribution des véhicules vides. Nous prenons en compte à la fois la demande actuelle et la demande future anticipée, contrairement aux méthodes réactives, qui agissent uniquement sur la demande actuelle.

Nous fournissons un apprentissage par renforcement à différents niveaux, en fonction de la granularité du système. Nous proposons deux modèles :

  • un modèle RL basé sur les stations pour les petits réseaux
  • un modèle RL basé sur les zones pour les plus grands réseaux et où les agents sont des zones de la ville obtenus par partitionnement.

L’optimisation complète de l’information est fournie afin d’analyser les performances du système a-posteriori, dans un contexte hors ligne.

L’évaluation des performances des méthodes proposées est réalisée dans un ensemble de réseaux routiers de nature et de taille différentes.

La méthode proposée donne des résultats prometteurs. Ces résultats surpassent les autres méthodes testées et les données réelles sur les performances du système de taxi en termes de nombre de passagers satisfaits au sein d’une taille de flotte fixe.