Thèse Méthodes pour la Détection de Variations de Structure à Partir de Graphes de Pangénome H/F - Doctorat.Gouv.Fr
- CDD
- Doctorat.Gouv.Fr
Les missions du poste
Établissement : Université de Bordeaux École doctorale : Mathématiques et Informatique Laboratoire de recherche : LaBRI - Laboratoire Bordelais de Recherche en Informatique Direction de la thèse : Raluca URICARU ORCID 0000000257306428 Début de la thèse : 2026-10-01 Date limite de candidature : 2026-07-03T23:59:59 Les variations structurales, qui incluent notamment les grandes insertions, délétions, inversions, duplications et translocations, constituent une source majeure de diversité génétique et jouent un rôle important dans les maladies. Leur détection a longtemps été limitée par les technologies de séquençage et par l'utilisation d'un génome de référence linéaire unique. Avec la disponibilité croissante d'assemblages de haute qualité, l'analyse génomique évolue désormais vers des modèles de pangénome, en particulier les graphes de pangénome, qui offrent une représentation plus riche et plus flexible de la diversité génétique.
Dans ces graphes, les variants génomiques sont généralement associés à des motifs topologiques de type bulle. Toutefois, la relation entre ces motifs et les variants biologiques est loin d'être simple. Une bulle peut représenter un ou plusieurs variations, y compris des événements proches ou imbriqués, tandis qu'une même variation structurale peut être représentée par plusieurs motifs qui se recouvrent ou s'entrelacent. Comme les petites variations sont beaucoup plus nombreuses que les grandes variations structurales, ces dernières sont souvent masquées dans un grand nombre de bulles et sont par conséquent difficiles à détecter et à caractériser précisément.
Les outils actuels de détection de bulles dans les graphes de pangénome, tels que vg deconstruct et BubbleGun, fournissent des décompositions utiles du graphe, mais peu d'interprétation biologique. En particulier, ils n'identifient pas explicitement le type de variation structurale ni n'annotent précisément les positions de cassure, ce qui rend la détection des variations structurales, comme les inversions et les translocations, particulièrement difficile.
L'objectif principal de cette thèse est de développer de nouvelles méthodes pour détecter et caractériser les variations structurales à partir de graphes de pangénome, encore difficiles à identifier à partir des sorties brutes des outils actuels. Collaboration nationale avec Claire Lemaitre (DR Inria, équipe GenScale Rennes) dans le cadre du projet ANR PanQueSt Développer de nouvelles méthodes pour détecter et caractériser les variations structurales à partir de graphes de pangénome.
Le profil recherché
Les candidates et candidats doivent avoir une solide formation dans au moins un des domaines suivants : algorithmique, théorie des graphes, bioinformatique, ou biologie computationnelle. Une expérience en génomique ou en analyse de séquences par graphes sera appréciée. De bonnes compétences en programmation sont attendues ; le développement se fera principalement en Python et/ou Rust.
Nous recherchons une personne ayant de solides capacités d'analyse, un intérêt pour la recherche interdisciplinaire, et une motivation pour travailler au croisement entre théorie, développement logiciel et applications biologiques.