Les missions du poste

Établissement : Université de Bordeaux
École doctorale : Mathématiques et Informatique
Laboratoire de recherche : LaBRI - Laboratoire Bordelais de Recherche en Informatique
Direction de la thèse : Nathanaël FIJALKOW ORCID 0000000265764680
Début de la thèse : 2026-09-01
Date limite de candidature : 2026-07-24T23:59:59

Ce projet doctoral s'inscrit dans l'axe de l'apprentissage par renforcement interprétable par programme (PIRL). L'objectif principal est de pallier le manque de lisibilité des politiques de décision actuelles, souvent basées sur des arbres de décision massifs ou des réseaux de neurones opaques. Le doctorant travaillera sur le développement d'algorithmes capables de synthétiser des stratégies structurées sous forme de programmes informatiques utilisant des boucles de contrôle (comme for et while). Cette approche vise à produire des politiques plus succinctes, facilitant ainsi leur compréhension par l'utilisateur et leur vérification formelle rigoureuse. Les travaux incluront la conception d'un framework Python open-source pour l'apprentissage de politiques structurées, avec des applications ciblées sur le contrôle de systèmes cyber-physiques.

Thèse financée par le projet SAIF (PEPR IA).

Apprendre et vérifier des stratégies structurées pour résoudre des processus de décision de Markov (MDP). L'ambition est d'atteindre des performances de pointe tout en garantissant l'explicabilité et la vérifiabilité des politiques.

Combinaison de techniques d'apprentissage par renforcement avec des pipelines de synthèse de programmes et des méthodes de vérification formelle.

Le profil recherché

Master en informatique avec une spécialisation en algorithmique, logique ou IA. Une connaissance préalable de la théorie des automates ou de la vérification de logiciels est un atout majeur.

Postuler sur le site du recruteur

Ces offres pourraient aussi vous correspondre.

Recherches similaires