Évaluation de grands modèles de langue en santé (H/F)


Détail de l'offre

Informations générales

Organisme de rattachement

CNRS  

Référence

UMR9015-PIEZWE-009  

Date de début de diffusion

04/12/2025

Date de parution

15/12/2025

Date de fin de diffusion

25/12/2025

Description du poste

Versant

Fonction Publique de l'Etat

Catégorie

Catégorie A (cadre)

Nature de l'emploi

Emploi ouvert uniquement aux contractuels

Domaine / Métier

Recherche - Chercheuse / Chercheur

Statut du poste

Vacant

Intitulé du poste

Évaluation de grands modèles de langue en santé (H/F)

Descriptif de l'employeur

Le Centre national de la recherche scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieure et de la Recherche. Créé en 1939 et dirigé par des scientifiques, il a pour mission de faire progresser la connaissance et être utile à la société dans le respect des règles d’éthique, de déontologie et d’intégrité scientifique.

Description du poste

Missions :
Dans le cadre du projet collaboratif PARTAGES financé par la BPI, il s'agit de concevoir et coordonner l'évaluation de grands modèles de langue en santé et de l'application de ces modèles à sept cas d'usage en santé. Cela inclut notamment la définition des éléments constitutifs des protocoles d'évaluation, la définition des dimensions de comparaison des modèles, la mise en place d’un protocole d’évaluation de modèles de fondation, la définition des protocoles d'évaluation pour chaque cas d'usage en fonction du type de cas et de son cadre d'application, la mise en application des protocoles spécifiques pour l’évaluation des cas d'usage et des modèles de fondation, et le suivi des résultats des évaluations des algorithmes de chaque cas d’usage et des modèles de fondation. Ces dernières tâches notamment impliqueront une forte interaction avec les partenaires responsables du développement des modèles de langue et des partenaires responsables des cas d'usage, l'organisation d'évaluations similaires à des campagnes d'évaluation, l'organisation d'ateliers de restitution de ces évaluations. Les méthodes et les résultats feront l'objet d'une documentation qui a vocation à être publique et de publications dans les conférences ou revues pertinentes du domaine.

Activités :
Dans le contexte de l'évaluation de systèmes de traitement automatique des langues (TAL) du projet PARTAGES, principalement à base de méthodes neuronales, qui seront appliqués au domaine médical :
- conception et mise en œuvre de méthodes à l'état de l'art pour l'évaluation de systèmes de TAL,
- pilotage de l'activité d'évaluation des partenaires du projet,
- planification et conduite de réunions,
- participation à des réunions,
- création et implémentation de protocoles d'évaluation,
- analyse des résultats d'évaluations,
- rédaction de rapports, guides, publications.

Contexte de travail :
Le laboratoire LISN
https://www.lisn.upsaclay.fr/
Le Laboratoire Interdisciplinaire des Sciences du Numérique (LISN) est une Unité Mixte de Recherche (UMR 9015) créé le 1er janvier 2021 grâce à la coopération des équipes de recherche du LIMSI et du LRI. Ses tutelles sont le CNRS, l’Université Paris-Saclay, l’INRIA et CentraleSupélec. Composé de près de 400 personnes, ses domaines de recherche couvrent d’une part des thématiques cœurs des sciences du numérique et des sciences de l’ingénieur, et d’autre part des thématiques interdisciplinaires par nature : intelligence artificielle et science des données, interaction humain-machine, traitement automatique des langues et de la parole, et bio-informatique.

Les activités de recherche sont organisées en 5 départements, 5 actions transversales et 16 équipes de recherche. 5 équipes de soutien et support à la recherche assurent le bon fonctionnement du laboratoire. Les travaux prendront place au sein de l'équipe SEME du département Sciences et Technologies des Langues.

Le projet PARTAGES
https
Voir plus sur le site emploi.cnrs.fr...

Conditions particulières d'exercice

Le Centre national de la recherche scientifique est l’une des plus importantes institutions publiques au monde : 34 000 femmes et hommes (plus de 1 000 laboratoires et 200 métiers), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l’innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche.

Descriptif du profil recherché

Competences :
- Thèse en traitement automatique des langues ayant mobilisé de l'apprentissage automatique,
- maîtrise des méthodes et outils de TAL et d'apprentissage automatique, y compris neuronaux,
- maîtrise des mesures et protocoles d'évaluation du TAL,
- expérience de projets de recherche collaboratifs,
- goût du travail en équipe,
- facilité de contact avec les équipes extérieures,
- maîtrise des temps et ponctualité dans les livrables,
- aisance en français et en anglais technique.

Contraintes et risques :
- travail sur écran

Temps plein

Oui

Rémunération contractuels (en € brut/an)

Entre 3131 et 4341,70 € brut mensuel

Pays

Localisation du poste

Europe, France, Île-de-France, Essonne (91)

Géolocalisation du poste

ORSAY CEDEX

Lieu d'affectation (sans géolocalisation)

91405 ORSAY CEDEX (France)

Critères candidat

Niveau d'études / Diplôme

Niveau 8 Doctorat/diplômes équivalents

Spécialisation

Formations générales

Langues

Français (Seuil)