H/F Doctorant en statistiques


Détail de l'offre

Informations générales

Organisme de rattachement

CNRS  

Référence

UMR5149-NATCOL-024  

Date de début de diffusion

19/06/2025

Date de parution

04/07/2025

Date de fin de diffusion

10/07/2025

Description du poste

Versant

Fonction Publique de l'Etat

Catégorie

Catégorie A (cadre)

Nature de l'emploi

Emploi ouvert uniquement aux contractuels

Domaine / Métier

Recherche - Chercheuse / Chercheur

Statut du poste

Vacant

Intitulé du poste

H/F Doctorant en statistiques

Descriptif de l'employeur

Le Centre national de la recherche scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieure et de la Recherche. Créé en 1939 et dirigé par des scientifiques, il a pour mission de faire progresser la connaissance et être utile à la société dans le respect des règles d’éthique, de déontologie et d’intégrité scientifique.

Description du poste

Sujet de thèse :
Au cours d'un cancer, différentes mutations s'accumulent sur les cellules cancéreuses, générant plusieurs lignées cellulaires qui co-existent dans une tumeur donnée. L'objectif de ce projet est d'étudier l'histoire évolutive d'une tumeur à partir de données de séquençage haut débit dites "bulk", c'est-à-dire mélangeant différentes cellules de la tumeur.

Ces données sont complexes à la fois pour des raisons biologiques et techniques. L'évolution d'un cancer dépend en effet de nombreux processus biologiques, qui induisent notamment des mutations, des altérations structurelles de certaines régions du génome dans certaines cellules, ainsi que des variations de taille de la tumeur. D'un point de vue technique, le séquençage haut-débit ne fournit pas des séquences entières de génomes, mais renvoie un très grand nombre de petits fragments, appelés "reads", que l'on place sur une séquence de référence pour pouvoir les exploiter. Dans le cas de données bulk où l'on séquence plusieurs cellules, il n'est de plus pas possible de déterminer directement à quelle cellule appartient tel ou tel read.
L'objectif principal de la thèse est de reconstruire l'histoire de la composition cellulaire de la tumeur d'un patient à partir de biopsies de suivi réalisées à plusieurs temps différents et séquencées. L'approche envisagée repose sur la mise au point d'un modèle stochastique des données de séquençage bulk d'une tumeur. Un tel modèle se décompose naturellement deux parties principales. Un processus de naissance et mort (pour la division et la mort cellulaire), couplé à un processus de Poisson (pour les mutations), peut en premier lieu être utilisé pour modéliser l'évolution du nombre de cellules de chaque lignée et l'apparition de nouvelles lignées. Conditionnellement à cet effectif des lignées cellulaires, la seconde partie modélise le prélèvement des cellules tumorales et leur séquençage haut débit, qui produit l'ensemble des reads observés.

Ce modèle pourra être utilisé dans un premier temps pour simuler des données de séquençage sous diverses hypothèses biologiques, afin de tester la robustesse et la précision des méthodes de reconstructions déjà existantes, telles que Pairtree [3] ou CALDER [2].
Dans un second temps, l'objectif sera de calculer la vraisemblance de données de séquençage bulk sous ce modèle afin de proposer une nouvelle méthode d'inférence statistique, en adaptant par exemple l'approche de [1] pour la première partie du modèle.
[1] Didier, Laurin. 2020. Systematic Biology. 69:1068–1087.
[2] Myers, Satas, Raphael. 2019. Cell systems. 8:514–522.
[3] Wintersinger, Dobson, Kulman, et al. 2022. Blood Cancer Discovery. 3:208–219
Contexte :
La thèse se déroulera à l'Institut Montpelliérain Alexander Grothendiek (IMAG) à Montpellier, en collaboration avec le MAP5 à Paris. Il sera encadré par Gilles Didier (IMAG) et Paul Bastide (MAP5), en collaboration avec Alice Cleynen (IMAG) et
Voir plus sur le site emploi.cnrs.fr...

Conditions particulières d'exercice

Le Centre national de la recherche scientifique est l’une des plus importantes institutions publiques au monde : 34 000 femmes et hommes (plus de 1 000 laboratoires et 200 métiers), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l’innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche.

Descriptif du profil recherché

Contraintes et risques :

Temps plein

Oui

Rémunération contractuels (en € brut/an)

La rémunération est d'un minimum de 2200,00 € mensuel

Pays

Localisation du poste

Europe, France, Occitanie, Hérault (34)

Géolocalisation du poste

MONTPELLIER

Lieu d'affectation (sans géolocalisation)

34095 MONTPELLIER (France)

Critères candidat

Niveau d'études / Diplôme

Niveau 7 Master/diplômes équivalents

Spécialisation

Formations générales

Langues

Français (Seuil)