
Ingénieur de recherche (H/F) en traitement automatique des langues
Référence : UMR9015-THOGER-006
- Fonction publique : Fonction publique de l'État
- Employeur : Centre national de la recherche scientifique (CNRS)
- Localisation : 91190 GIF SUR YVETTE (France)
Partager la page
Veuillez pour partager sur Facebook, Twitter et LinkedIn.
- Nature de l’emploi Emploi ouvert uniquement aux contractuels
- Nature du contrat Non renseigné
- Expérience souhaitée Non renseigné
-
Rémunération (fourchette indicative pour les contractuels) à partir de 2932,84€ mois € brut/an
- Catégorie Catégorie A (cadre)
- Management Non renseigné
- Télétravail possible Non renseigné
Vos missions en quelques mots
Missions :
Le proposition de poste ci-présent rentre dans le cadre de deux projets actuellement en développement au sein du laboratoire LISN. Le travail effectué sera décomposé en deux parties, la création d'un corpus annotés en question réponse sur des documents comportant à la fois des données textuelles et visuelles et une seconde partie sur le traitement de la parole dans le cadre de transcription oral de description d'équations mathématiques vers le format latex.
Les trois premiers mois seront consacrés à la création d'un corpus de question réponse sur des documents scolaires, les questions portant à la fois sur des diagrammes/images, du texte et des énoncés mathématiques. L'objectif sera de piloter les études pour le développement du corpus, de participer activement au développement du corpus (technique), d'en définir les caractéristiques et de concevoir des méthodes d'évaluations multi-critères tout ceci nécessitant la maîtrise des outils de TAL les plus récents. Afin de réaliser les différents travaux le candidat coordonnera des stagiaires. Les six derniers mois du poste seront consacrés à la mise en place d'un système de reconnaissance de la parole avec de sorties "structurées", la conception de méthode d'évaluation et la mise en place d'une démonstration.
Activités :
Partie 1 : Corpus multimodal sur des documents scolaires
* Pilotage d'une équipe pour la conception d'un corpus multimodal contenant à la fois des images (en particulier des schémas) et du texte sur des documents éducatifs tels que des livres scolaires ou des ressources encyclopédiques à partir d'approches automatiques
* Conception de méthodes statistiques innovantes pour l'évaluation de systèmes génératifs
* Pilotage d'une campagne d'évaluation du corpus produit (évaluation par des experts) mais aussi la gestion du budget
Partie 2 : Transduction de formules mathématiques à partir de la parole
* Piloter le pôle "inférence structurée" de la plateforme open-source PTAL (https://ptal.lisn.upsaclay.fr/); Entre autre il faut:
* superviser la conception d'un système de transcription de la parole en LaTeX
* définir et mettre en place un cade d'évaluation des systèmes adapté à la problématique de l'écriture d'équations
Missions communes :
* Participer à l'animation scientifique du groupe de recherche
* Aide et support technique aux activités de recherche.
Contexte de travail :
Le travail se déroulera au Laboratoire Interdisciplinaire des Sciences du Numérique (LISN) sur le site "Belvédère". Le candidat retenu travaillera conjointement avec l'équipe M3 (Modèles, Méthodes et Multilinguisme) et l'équipe SEME (Sémantique et Extraction d'information) du département STL (Sciences et Technologies du Langage). Ces équipes sont spécialisées dans les méthodes d'apprentissage automatique appliquées aux traitements de la langue parlé (M3) et écrite (SEME).
Profil recherché
Competences :
- Formation d'ingénieur ou équivalent (master en informatique et/ou traitement des langues)
- Expérience dans la mise en place de campagne d'évaluation et/ou d'annotation
- Supervision dans la rédaction d'articles scientifiques
- Veille scientifique
- Assurer un rôle de conseil et d'expertise dans le cadre des du projet
- De bonnes compétences techniques dans les domaines suivants :
- Maîtrise des méthodes d'apprentissage statistique
- Connaissance étendue des outils du TAL
- Approches et outils pour l'apprentissage profond
Nous recherchons en particulier les personnes avec un fort intérêt pour les problématiques de l'accessibilité des technologies du traitement automatique des langues.
Contraintes et risques :
travail sur écran
Niveau d'études minimum requis
- Niveau Niveau 7 Master/diplômes équivalents
- Spécialisation Informatique, traitement de l'information, réseau de transmission des données
Langues
- Français Seuil
Qui sommes-nous ?
Le Centre national de la recherche scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation.
C’est l’une des plus importantes institutions publiques au monde : 33 000 femmes et hommes (dont plus de 16 000 chercheurs et plus de 16 000 ingénieurs et techniciens), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines.
Depuis plus de 80 ans, le CNRS développe des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit entre ses missions de recherche et le transfert vers la société fait du CNRS un acteur clé de l’innovation en France et dans le monde.
Le partenariat qui lie le CNRS avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires témoignent du potentiel économique de ses travaux de recherche.
À propos de l'offre
-
Le Centre national de la recherche scientifique est l’une des plus importantes institutions publiques au monde : 34 000 femmes et hommes (plus de 1 000 laboratoires et 200 métiers), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l’innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche.
-
Vacant
-
Experte / Expert en information statistique