Ingénieur-e biologiste en analyse de données

 Offre 0 / 7984 

Détail de l'offre

Informations générales

Organisme de rattachement

INSERM  

Référence

2024-1440565  

Date de début de diffusion

08/01/2024

Date de parution

08/01/2024

Localisation

Date limite de candidature

08/02/2024

Description du poste

Versant

Fonction Publique de l'Etat

Catégorie

Catégorie A (cadre)

Nature de l'emploi

Emploi ouvert aux titulaires et aux contractuels

Domaine / Métier

Recherche - Experte / Expert en production, traitement et analyse de données

Statut du poste

Vacant

Intitulé du poste

Ingénieur-e biologiste en analyse de données

Descriptif de l'employeur

L’Inserm est le seul organisme public français entièrement dédié à la recherche biologique, médicale et en santé des populations. Il dispose de laboratoires de recherche sur l’ensemble du territoire, regroupés en 12 Délégations Régionales. Notre institut réunit 15 000 chercheurs, ingénieurs, techniciens et personnels administratifs, avec un objectif commun : améliorer la santé de tous par le progrès des connaissances sur le vivant et sur les maladies, l’innovation dans les traitements et la recherche en santé publique.

Rejoindre l’Inserm, c’est intégrer un institut engagé pour la parité et l’égalité professionnelle, la diversité et l’accompagnement de ses agents en situation de handicap, dès le recrutement et tout au long de la carrière. Afin de préserver le bien-être au travail, l’Inserm mène une politique active en matière de conditions de travail, reposant notamment sur un juste équilibre entre vie personnelle et vie professionnelle.

L'Inserm a reçu en 2016 le label européen HR Excellence in Research et s'est engagé à faire évoluer ses pratiques de recrutement et d'évaluation des chercheurs.

Descriptif du service

Le Laboratoire de Biologie et Modélisation de la Cellule (U1293/UMR 5239) comprend 100 personnes et est structuré en 17 équipes de recherche. Il est situé sur le site Monod de l’Ecole Normale Supérieure de Lyon. La stratégie globale du laboratoire consiste en l’étude quantitative des processus biologiques par des approches interdisciplinaires combinant biologie expérimentale et modélisation mathématiques et physique. Une grande majorité des équipes du LBMC (12 sur 17) mobilise des approches basées sur du séquençage à haut-débit dans leur recherche (ChIP-Seq, RNA-Seq, Hi-C, ...). C’est dans ce contexte que le LBMC a créé un « Biocomputing hub », structure fédérant les activités computationnelles développées au sein du LBMC. Les équipes INSERM du LBMC utilisent activement le Hub dans leur recherche. Récemment, une demande portant sur l’accompagnement tout au long de la production de données et sur le développement de nouveaux outils (modélisation, IA) a émergé au sein de ces équipes. Ce poste d’ingénieur permettra de répondre à cette demande tout en créant de nouvelles synergies au sein du LBMC. L’agent qui sera recruté sera intégré au sein du « Bio-computing hub » à la fois pour participer aux projets de différentes équipes mais également pour assurer la transmission et l’appropriation de nouvelles compétences au sein des équipes.

Description du poste

La personne recrutée rejoindra le « Hub BIO-COMPUTING », structure transversale du laboratoire, sous la responsabilité du Directeur du LBMC, D. Auboeuf (DR INSERM), et du responsable de cette structure, D. Jost. Une des missions du candidat sera de participer au développement de méthodologies adaptées à la recherche du LBMC, en particulier en lien avec la modélisation et l’IA, sur des thématiques portées notamment par les équipes INSERM incluant l’organisation 3D du génome, l’épigénétique et le métabolisme des ARNs.

L’ingénieur-e accompagnera les chercheurs tout au long du processus de production de données : traitement et analyse, modélisation, stockage et data management et il accompagnera les personnels du LBMC afin qu'ils puissent améliorer leurs pratiques liées au bio-computing et les former au portage sur des infrastructures de calcul scientifique.

Activités principales

·   Développer des outils et mettre en place des procédures standardisées de traitement des données de transcriptomique, génomique et épigénomique depuis leur production sur les séquenceurs haut débit (RNA-seq, Mnase-seq, ChIP-seq, ATAC-seq, Hi-C) jusqu’à leur dépôt sur les entrepôts de données (ex : NCBI/GEO) en passant par le prétraitement bio-informatique, l’analyse et la modélisation biostatistique des données. Assurer le déroulement de cette chaine de traitement sur les infrastructures de calculs régionales (Mésocentre CBPsmn).


· Accompagner les équipes de recherche : conseils méthodologiques, assistance, formation, aide à la rédaction d’articles ou de demandes de financement.


·  Participer à des projets de recherche au sein du Biocomputing Hub, en particulier en lien avec l’organisation 3D du génome ou l’épigénétique.


· Participer à des co-encadrements d’étudiants sur des projets de recherche en collaboration avec des bio-informaticiens ou avec des biologistes.


·  Faire de la veille technologique sur le développement méthodologiques en lien avec les recherches du LBMC et l’entretien de workflows.


· Améliorer les méthodologies de développement logiciels des différentes équipes du laboratoire : conteneurisation (ex : packaging de codes R, conda), organisation de travail (ex : Agile, DevOps, GitHub Actions), qualité de code (ex : sonarqube, codecov).


· Participer à la formation interne des membres du laboratoire à ces nouvelles méthodologies.


· Former les chercheurs aux procédures existantes et assurer le support technique et la formation aux outils développés.


· Participer à l'activité du réseau bio-informatique au niveau local et national en mettant à disposition les outils et interfaces générées et en participant à des formations.


· Participer au maintien et à l’amélioration du socle standard d’outils maintenu au laboratoire (intégration continue).


· Assurer le respect des normes qualité et des réglementations en vigueur pour garantir la reproductibilité des analyses effectuées (ex : Git, Notebook RMarkdow, Quarto).

Conditions particulières d'exercice

·     Le candidat rejoindra le hub Biocomputing du LBMC, qui est en charge d’animer et de promouvoir la biologie computationnelle au sein du laboratoire.

Descriptif du profil recherché

Connaissances :
·     Maîtrise des logiciels requis pour l’analyse de données en (épi)génomique (ex : DESeq2, TopHat, STAR, samtools, bedtools, danpos, Seurat, etc.).

·     Utilisation avancée de plusieurs langages de programmation (ex : Python, R, Bash) et des systèmes Unix/Linux.

·     Connaissance d'outils pour la gestion de codes (git), l’amélioration de la qualité des codes (intégration continue) et la reproductibilité de ses projets (ex : conteneurisation par docker, singularity, etc.).

·     Compétences en bio-statistique et machine-learning avec maitrise de concepts utilisés communément dans le milieu de la biologie (modèles linéaires, GLMs, modèles mixtes).

·     Connaissances générales en biologie cellulaire et moléculaire.

Savoir-faire :
·     Expertise portant sur les entrepôts de données, le stockage (court, moyen et long terme) et le dépôt de données.

·     Utilisation d’infrastructures et de clusters de calculs pour l’analyse des données et l’exploration numérique des modèles.

·     Développement de pipelines bioinformatiques pour le pré-traitement, l’analyse et la modélisation de données biologiques.

·     Mise en place de bonnes pratiques sur l’utilisation des données (approche FAIR : Findable, Accessible, Interoperable, Reusable).

Aptitudes :
·       Maîtriser l’anglais scientifique à l’oral et à l’écrit. Les candidats seront capables, en anglais, de s'exprimer, de suivre une présentation scientifique ou une réunion de laboratoire, de lire des publications et d’aider à la rédaction de travaux de recherche.

·       Encadrer du personnel de recherche et le former de manière pédagogique.

·       Travailler en équipe et être force de proposition.

·       Dialoguer avec les différentes équipes de recherche sur leurs besoins.

·       Gérer de manière autonome les aspects biocomputing de projets de recherche.

Expérience(s) souhaitée(s) : 
·  Expérience professionnelle réussie en recherche et support à la recherche en bio-informatique et en analyse de données issues d’approches à très haut débit.

Niveau de diplôme et formation(s) :
·     Doctorat en bioinformatique ou biologie computationnelle ; Master en bio-informatique ou bio-statistique.

Temps plein

Oui

Informations complémentaires

Informations complémentaires

Pour candidater, vous devez constituer un dossier en ligne via l'application Gaia de l'Inserm accessible à l'adresse https://www.gaia2.inserm.fr/login

Si vous êtes un agent Inserm, la connexion à Gaia se fait avec les identifiants de votre compte prenom.nom@inserm.fr

Pour les autres, vous devez créer un compte sur l’application Gaia de l'Inserm accessible à l'adresse https://www.gaia2.inserm.fr/login

Une fois connecté, l'inscription se fait depuis Mobilité 2024 (lien S'INSCRIRE).

Pays

Localisation du poste

Europe, France, Auvergne-Rhône-Alpes, Rhône (69)

Géolocalisation du poste

46 Allée d'Italie 69364 Lyon

Lieu d'affectation (sans géolocalisation)

Laboratoire de Biologie et Modélisation de la Cellule - U1293/UMR 5239

Critères candidat

Niveau d'études / Diplôme

Niveau 7 Master/diplômes équivalents

Documents à transmettre

L'envoi du CV et d'une lettre de motivation est obligatoire

Demandeur

Date de vacance de l'emploi

01/05/2024

Mail à qui adresser les candidatures (bouton postuler)

daniel.jost@ens-lyon.fr

Contact 1

daniel.jost@ens-lyon.fr