Post-Doc (ou Ingénieur) Machine Learning et bases de données H/F
Référence : UAR3565-FATIDM-006
- Fonction publique : Fonction publique de l'État
- Employeur : Centre national de la recherche scientifique (CNRS)
- Localisation : 86000 POITIERS (France)
Partager la page
Veuillez pour partager sur Facebook, Twitter et LinkedIn.
- Nature de l’emploi Emploi ouvert uniquement aux contractuels
- Nature du contrat Non renseigné
- Expérience souhaitée Non renseigné
-
Rémunération (fourchette indicative pour les contractuels) 2991,58 euros bruts € brut/an
- Catégorie Catégorie A (cadre)
- Management Non renseigné
- Télétravail possible Non renseigné
Vos missions en quelques mots
Missions :
Dans le cadre du projet OSCARS -AMIS- (Advanced Metadata Intelligent System), le Consortium-HN ARIANE recrute un(e) post-doctorant(e) en informatique Data - Machine Learning et bases de données.
Le Consortium-HN ARIANE (Analyses, Recherches, Intelligence Artificielle et Nouvelles Éditions Numériques) est un réseau scientifique interdisciplinaire de l’infrastructure Huma-Num. Il associe des experts en sciences humaines (littérature, linguistique, histoire, etc.) et en informatique. Ce consortium vise à constituer un espace de collaboration entre ces deux champs, favorisant ainsi les avancées méthodologiques et épistémologiques dans l’analyse des objets propres aux sciences du texte. L’objectif d'ARIANE est de contribuer à la conception, l’adaptation et le raffinement des outils numériques actuellement appliqués aux données textuelles des sciences humaines. Le consortium se donne pour mission de développer une approche interdisciplinaire en croisant les méthodologies des humanités numériques et les technologies avancées du traitement automatique du langage naturel. Il cherche à enrichir les processus d’analyse des textes à l’aide de dispositifs (semi-)automatisés, tout en créant un espace critique de discussion sur l’interprétation des résultats produits par ces méthodes.
Le/la candidat/e recruté/e intégrera l’équipe chargée du développement de l’application web innovante « AMIS », une application permettant l’enrichissement des métadonnées pour les chercheurs en sciences humaines.
Il ou elle sera chargé(e) du développement du module -Robot AMIS-, qui utilise des techniques d’intelligence artificielle et de machine learning pour proposer des recommandations de métadonnées basées sur l’analyse de données textuelles. Il/Elle jouera un rôle clé dans la gestion et l’analyse de grandes bases de données et dans l’entraînement de modèles de type LLM (Large Language Models).
Pour ces missions, le/la candidat/e recruté/e pourra être amené(e) à suivre les stagiaires recrutés par le consortium en vue d’atteindre les objectifs du projet.
Activités :
Plus concrètement, les missions et activités seront les suivantes :
⁻ Conception et implémentation du « Robot AMIS » (Module 2) pour interroger des bases de données externes via des API et traiter les résultats en vue de proposer des recommandations de métadonnées.
⁻ Entraînement et fine-tuning des modèles LLM (Large Language Models) pour l’analyse des textes et l’extraction des métadonnées pertinentes.
⁻ Analyse des résultats issus des bases de données et proposition de métadonnées enrichies basées sur des critères tels que le contenu, le genre, les motifs, les sentiments, les thesaurus, les ontologies, etc..
⁻ Intégration des fonctionnalités d’explicabilité (X-AI) pour tracer les étapes et fournir des justifications sur les recommandations émises par le modèle.
⁻ Gestion des bases de données et des infrastructures cloud nécessaires pour exécute
Voir plus sur le site emploi.cnrs.fr...
Profil recherché
Competences :
Compétences techniques
⁻ Technologies d’IA/ML (ex: Python, TensorFlow, PyTorch, scikit-learn, etc.)
⁻ Modèles de traitement du langage naturel (NLP) : Fine-tuning des LLM, analyse sémantique, text mining
⁻ Bases de données : Gestion des bases de données relationnelles (SQL) et non relationnelles (NoSQL)
⁻ APIs et services REST : Développement et intégration d’APIs pour interroger des bases de données externes
⁻ Connaissance des ontologies et des vocabulaires contrôlés utilisés dans les sciences des textes (XML-TEI, RDF)
⁻ Expérience avec l’infrastructure cloud (Google Colab, AWS, ou infrastructures équivalentes) pour des projets nécessitant une forte puissance de calcul.
Compétences -soft-
⁻ Intérêt pour les sciences humaines.
⁻ Sens de l’innovation, curiosité intellectuelle, aptitudes à la communication et au soutien technique
⁻ Sens relationnel, rigueur, fiabilité
⁻ Capacité à travailler en équipe et à collaborer avec des équipes multidisciplinaires.
⁻ Intérêt pour les projets open-source
Profil recherché :
⁻ Diplôme : Idéalement, Bac +8. Post-Doc. Docteur en informatique (science des données, IA)
⁻ Expérience : Idéalement, au moins 2 ans d’expérience dans des projets de machine learning et de traitement des données textuelles
⁻ Capacité à travailler sur des modèles complexes et à expliquer leurs résultats de manière claire.
Contraintes et risques :
Niveau d'études minimum requis
- Niveau Niveau 8 Doctorat/diplômes équivalents
- Spécialisation Formations générales
Langues
- Français Seuil
Qui sommes-nous ?
Le Centre national de la recherche scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation.
C’est l’une des plus importantes institutions publiques au monde : 33 000 femmes et hommes (dont plus de 16 000 chercheurs et plus de 16 000 ingénieurs et techniciens), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines.
Depuis plus de 80 ans, le CNRS développe des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit entre ses missions de recherche et le transfert vers la société fait du CNRS un acteur clé de l’innovation en France et dans le monde.
Le partenariat qui lie le CNRS avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires témoignent du potentiel économique de ses travaux de recherche.
À propos de l'offre
-
Projet européen -AMIS- financé par OSCARS
-
Le Centre national de la recherche scientifique est l’une des plus importantes institutions publiques au monde : 34 000 femmes et hommes (plus de 1 000 laboratoires et 200 métiers), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l’innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche.
-
Vacant
-
Chercheuse / Chercheur