Ingénieur d'études en TAL dans le projet ERA-NET CHIST-ERA FAIRClinical (H/F)

Détail de l'offre

Informations générales

Organisme de rattachement

CNRS  

Référence

UMR9015-NONNAD-006  

Date de début de diffusion

24/06/2025

Date de parution

03/07/2025

Date de fin de diffusion

15/07/2025

Intitulé long de l'offre

Ingénieur d'études en TAL dans le projet ERA-NET CHIST-ERA FAIRClinical (H/F)

Date limite de candidature

15/07/2025

Nature du contrat

CDD d'1 an

Description du poste

Versant

Fonction Publique de l'Etat

Catégorie

Catégorie A (cadre)

Nature de l'emploi

Emploi ouvert uniquement aux contractuels

Domaine / Métier

Recherche - Experte / Expert en calcul scientifique

Statut du poste

Vacant

Intitulé du poste

Ingénieur d'études en TAL dans le projet ERA-NET CHIST-ERA FAIRClinical (H/F)

Descriptif de l'employeur

Le Centre national de la recherche scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieure et de la Recherche. Créé en 1939 et dirigé par des scientifiques, il a pour mission de faire progresser la connaissance et être utile à la société dans le respect des règles d’éthique, de déontologie et d’intégrité scientifique.

Description du poste

Missions :
Ce poste d'ingénieur d'études est dans le domaine du traitement du langage naturel. La personne recrutée rejoindra le projet international CHIST-ERA FAIRClinical. Elle mettra en œuvre des approches d'apprentissage automatique pour l'extraction d'informations à partir d'articles de recherche médicale et clinique et de leurs documents complémentaires.
Activités :
- Identifier les sources de données nécessaires à l'extraction et à la normalisation des entités.
- Développer des pipelines d’extraction d’information à partir des textes complets et des documents complémentaires.
- Évaluer les méthodes d’extraction d’information.
Contexte de travail :
Ce poste fait partie du projet FAIRClinical financé par CHIST-ERA, dont l'objectif est de renforcer le caractère FAIR de tous les fichiers de données complémentaires et d'améliorer de manière significative la réutilisation des formulaires de rapport de cas cliniques non structurés (CRF). Les données complémentaires sont généralement jointes à une publication scientifique, soit directement dans les bibliothèques biomédicales en ligne telles que PubMed Central, soit par l'intermédiaire de plateformes de dépôt généralistes telles que Zenodo.

Les CRF recueillent les données des patients dans le cadre d'études et d'essais de recherche clinique, et représentent un sous-ensemble riche en informations de la littérature de recherche clinique et des données complémentaires non structurées des études cliniques. Ce projet propose d'enrichir spécifiquement le contenu de toutes les données supplémentaires — et donc leur interopérabilité, leur trouvabilité et leur réutilisation — en fournissant un contenu plus normalisé.

Conditions particulières d'exercice

Le Centre national de la recherche scientifique est l’une des plus importantes institutions publiques au monde : 34 000 femmes et hommes (plus de 1 000 laboratoires et 200 métiers), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l’innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche.

Descriptif du profil recherché

Competences :
- Master en informatique, en traitement automatique des langues ou similaire.
- Compétences en apprentissage automatique supervisé et semi-supervisé, y compris l'apprentissage profond.
- Expérience en traitement automatique des langues
- Bonne maîtrise de l'anglais, à l'oral comme à l'écrit
- Capacité à travailler de manière indépendante et en équipe
- Capacité à hiérarchiser les tâches et à prendre des initiatives.
Contraintes et risques :
Risques liés au travail sur écran.

Temps plein

Oui

Rémunération contractuels (en € brut/an)

2540,99 € brut mensuel

Pays

Localisation du poste

Europe, France, Île-de-France, Essonne (91)

Géolocalisation du poste

GIF SUR YVETTE

Lieu d'affectation (sans géolocalisation)

91190 GIF SUR YVETTE (France)

Critères candidat

Niveau d'études / Diplôme

Niveau 7 Master/diplômes équivalents

Spécialisation

Informatique, traitement de l'information, réseau de transmission des données

Langues

Français (Seuil)