Informations générales
Organisme de rattachement
CNRS
Référence
UMR5535-SARADE-108
Date de début de diffusion
30/04/2026
Date de parution
08/05/2026
Date de fin de diffusion
21/05/2026
Intitulé long de l'offre
INGÉNIEUR DANS LE DÉVELOPPEMENT DE MÉTHODES DE MACHINE LEARNING ET DEEP LEARNING POUR LA GÉNÉTIQUE ET LA BIOINFORMATIQUE (H/F)
Date limite de candidature
21/05/2026
Nature du contrat
CDD d'1 an
Description du poste
Versant
Fonction Publique de l'Etat
Catégorie
Catégorie A (cadre)
Nature de l'emploi
Emploi ouvert uniquement aux contractuels
Domaine / Métier
Recherche - Experte / Expert en expérimentation, instrumentation et techniques biologiques
Statut du poste
Vacant
Intitulé du poste
INGÉNIEUR DANS LE DÉVELOPPEMENT DE MÉTHODES DE MACHINE LEARNING ET DEEP LEARNING POUR LA GÉNÉTIQUE ET L
Descriptif de l'employeur
Le Centre national de la recherche scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieure et de la Recherche. Créé en 1939 et dirigé par des scientifiques, il a pour mission de faire progresser la connaissance et être utile à la société dans le respect des règles d’éthique, de déontologie et d’intégrité scientifique.
Description du poste
Missions :
Nous recherchons une ingénieure ou un ingénieur d'études (IE) motivé pour rejoindre le groupe AI for Genome Interpretation (AI4GI) à l’IGMM (CNRS UMR5535, Montpellier) pour une durée de 12 mois. Le contrat peut être renouvelé sous conditions pour 36 mois supplémentaires si le projet passe les étapes d’évaluation.
Avez-vous étudié l’informatique, les mathématiques ou la physique et êtes-vous en train de devenir une experte ou un expert en machine learning ? Êtes-vous à l’aise avec la programmation par tenseurs et opérations vectorielles (PyTorch, NumPy) ? Connaissez-vous en profondeur les méthodes de machine learning et aimez-vous construire des réseaux de neurones from scratch ? Aimez-vous développer de nouvelles architectures de réseaux de neurones pour résoudre des problèmes non conventionnels ? Ce poste pourrait être pour vous.
Nous recherchons une candidate ou un candidat motivé et curieux, avec une expérience dans le développement de méthodes de machine learning pour la bioinformatique.
L’ingénieure ou l’ingénieur d’études recruté aura pour mission de concevoir et développer des méthodes innovantes de machine learning et de deep learning appliquées à l’interprétation du génome.
La personne contribuera au développement de nouvelles architectures de réseaux de neurones combinant des DNA Large Language Models et des approches d’apprentissage profond, dans le cadre du projet GenGI, visant à prédire des phénotypes humains à partir de données de séquençage à grande échelle.
La personne participera également à l’intégration de ces méthodes dans un environnement de recherche interdisciplinaire à l’interface entre intelligence artificielle, bioinformatique et génétique.
Activités :
Le candidat ou la candidate devra :
• Commencer par se familiariser avec les recherches et méthodes existantes pour l’interprétation du génome
• Se familiariser avec les données de séquençage et leur prétraitement
• Étudier le fonctionnement des DNA LLM et développer des solutions pour les intégrer dans les architectures de réseaux de neurones développées par le laboratoire
• Se concentrer sur le développement de solutions bas niveau pour la scalabilité des réseaux de neurones et des modèles de langage à grande échelle appliqués aux données de séquençage du génome entier
• Développer from scratch des algorithmes et architectures de réseaux de neurones pour la prédiction de sorties structurées (c.-à-d. arbres, graphes)
• Implémenter et développer des méthodes pour l’interprétation des prédictions et des sorties des réseaux de neurones, incluant des activations basées sur des concepts et des analyses contrefactuelles
Le projet se concentre sur le développement de nouvelles architectures de réseaux de neurones pour effectuer de l’inférence sur des données de séquençage.
Contexte de travail :
Le poste est basé à l’Institut de Génétique Moléculaire de Montpellier (IGMM UMR5535, CNRS), dans un environnement de
Voir plus sur le site emploi.cnrs.fr...
Conditions particulières d'exercice
Le Centre national de la recherche scientifique est l’une des plus importantes institutions publiques au monde : 34 000 femmes et hommes (plus de 1 000 laboratoires et 200 métiers), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l’innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche.
Descriptif du profil recherché
Competences :
La bioinformatique et l’interprétation du génome sont des domaines multidisciplinaires et en évolution rapide.
Nous recherchons une candidate ou un candidat qui :
• A une formation en informatique, mathématiques ou physique, avec une forte orientation en machine learning
• Est motivé pour apprendre en continu de nouvelles compétences, méthodes et concepts
• Apprécie de résoudre des problèmes nouveaux et imprévus avec de fortes compétences en résolution de problèmes
Compétences et expertise requises
• Fort intérêt pour les réseaux de neurones, le machine learning, l’algèbre linéaire et compréhension des statistiques
• Compréhension approfondie des fondements du machine learning, incluant :
• Algèbre linéaire (opérations vectorielles et matricielles)
• Méthodes d’optimisation
• Réseaux de neurones (avec expérience pratique en PyTorch)
• Solides compétences en programmation Python et calcul scientifique (PyTorch, scikit-learn, NumPy)
• Maîtrise des environnements GNU/Linux (incluant des outils comme SSH)
• Bonnes compétences en communication et travail en équipe
Qualifications supplémentaires (souhaitées)
• Familiarité avec les GWAS, la génétique des populations ou les pipelines de bioinformatique
• Expérience dans le traitement de données génomiques (séquençage exome ou génome entier)
• Connaissances de base en génétique et biologie
Autres informations
• Le projet implique le développement de modèles de réseaux de neurones non conventionnels avec PyTorch
• Un niveau d’anglais minimum B2 est requis
• Les candidatures doivent être soumises en anglais
Contraintes et risques :
Temps plein
Oui
Rémunération contractuels (en € brut/an)
A partir de 2521€ brut mensuel, ajustable selon expérience
Pays
Localisation du poste
Europe, France, Occitanie, Hérault (34)
Géolocalisation du poste
MONTPELLIER
Lieu d'affectation (sans géolocalisation)
34293 MONTPELLIER (France)
Critères candidat
Niveau d'études / Diplôme
Niveau 6 Licence/diplômes équivalents
Spécialisation
Sciences naturelles (biologie-géologie)
Langues
Français (Seuil)