Informations générales
Organisme de rattachement
CNRS
Référence
UMR9015-NONNAD-006
Date de début de diffusion
24/06/2025
Date de parution
03/07/2025
Date de fin de diffusion
15/07/2025
Intitulé long de l'offre
Ingénieur d'études en TAL dans le projet ERA-NET CHIST-ERA FAIRClinical (H/F)
Date limite de candidature
15/07/2025
Nature du contrat
CDD d'1 an
Description du poste
Versant
Fonction Publique de l'Etat
Catégorie
Catégorie A (cadre)
Nature de l'emploi
Emploi ouvert uniquement aux contractuels
Domaine / Métier
Recherche - Experte / Expert en calcul scientifique
Statut du poste
Vacant
Intitulé du poste
Ingénieur d'études en TAL dans le projet ERA-NET CHIST-ERA FAIRClinical (H/F)
Descriptif de l'employeur
Le Centre national de la recherche scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieure et de la Recherche. Créé en 1939 et dirigé par des scientifiques, il a pour mission de faire progresser la connaissance et être utile à la société dans le respect des règles d’éthique, de déontologie et d’intégrité scientifique.
Description du poste
Missions :
Ce poste d'ingénieur d'études est dans le domaine du traitement du langage naturel. La personne recrutée rejoindra le projet international CHIST-ERA FAIRClinical. Elle mettra en œuvre des approches d'apprentissage automatique pour l'extraction d'informations à partir d'articles de recherche médicale et clinique et de leurs documents complémentaires.
Activités :
- Identifier les sources de données nécessaires à l'extraction et à la normalisation des entités.
- Développer des pipelines d’extraction d’information à partir des textes complets et des documents complémentaires.
- Évaluer les méthodes d’extraction d’information.
Contexte de travail :
Ce poste fait partie du projet FAIRClinical financé par CHIST-ERA, dont l'objectif est de renforcer le caractère FAIR de tous les fichiers de données complémentaires et d'améliorer de manière significative la réutilisation des formulaires de rapport de cas cliniques non structurés (CRF). Les données complémentaires sont généralement jointes à une publication scientifique, soit directement dans les bibliothèques biomédicales en ligne telles que PubMed Central, soit par l'intermédiaire de plateformes de dépôt généralistes telles que Zenodo.
Les CRF recueillent les données des patients dans le cadre d'études et d'essais de recherche clinique, et représentent un sous-ensemble riche en informations de la littérature de recherche clinique et des données complémentaires non structurées des études cliniques. Ce projet propose d'enrichir spécifiquement le contenu de toutes les données supplémentaires — et donc leur interopérabilité, leur trouvabilité et leur réutilisation — en fournissant un contenu plus normalisé.
Conditions particulières d'exercice
Le Centre national de la recherche scientifique est l’une des plus importantes institutions publiques au monde : 34 000 femmes et hommes (plus de 1 000 laboratoires et 200 métiers), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l’innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche.
Descriptif du profil recherché
Competences :
- Master en informatique, en traitement automatique des langues ou similaire.
- Compétences en apprentissage automatique supervisé et semi-supervisé, y compris l'apprentissage profond.
- Expérience en traitement automatique des langues
- Bonne maîtrise de l'anglais, à l'oral comme à l'écrit
- Capacité à travailler de manière indépendante et en équipe
- Capacité à hiérarchiser les tâches et à prendre des initiatives.
Contraintes et risques :
Risques liés au travail sur écran.
Temps plein
Oui
Rémunération contractuels (en € brut/an)
2540,99 € brut mensuel
Pays
Localisation du poste
Europe, France, Île-de-France, Essonne (91)
Géolocalisation du poste
GIF SUR YVETTE
Lieu d'affectation (sans géolocalisation)
91190 GIF SUR YVETTE (France)
Critères candidat
Niveau d'études / Diplôme
Niveau 7 Master/diplômes équivalents
Spécialisation
Informatique, traitement de l'information, réseau de transmission des données
Langues
Français (Seuil)