Data scientist spécialisé en développement logiciel et NLP F/H
Référence : APHP_2025-15832
- Fonction publique : Fonction publique Hospitalière
- Employeur : Siège de l'AP-HP
- Localisation : Paris (75), France
Partager la page
Veuillez pour partager sur Facebook, Twitter et LinkedIn.
- Nature de l’emploi Emploi ouvert aux titulaires et aux contractuels
- Expérience souhaitée Non renseigné
-
Rémunération Fourchette indicative pour les contractuels Non renseignée Fourchette indicative pour les fonctionnaires Non renseignée
- Catégorie Non renseigné
- Management Non renseigné
- Télétravail possible Non renseigné
Vos missions en quelques mots
Nous cherchons un.e Data Scientist pour rejoindre l’équipe Sciences des Données. Vous développerez, validerez et maintiendrez des algorithmes et bibliothèques logicielles facilitant l’usage de données du système clinique pour la recherche et le pilotage. Vous vous concentrerez sur le traitement automatique du langage pour transformer les données textuelles de l’EDS en données structurées. Vous participerez au projet national « PARTAGES » pour développer un LLM médical français et le valider sur des cas d’usages spécifiques. Vos développements seront diffusés au sein de la communauté de recherche de l’AP-HP. Vous contribuerez à des articles scientifiques valorisant ces travaux. Vous serez aussi impliqué.e dans des recherches et analyses de données, en collaboration avec des experts métier de divers domaines (oncologie, diabète, psychiatrie,..).
Des objectifs annuels seront définis avec le responsable hiérarchique.
Missions principales :
- Développement et maintien de l’expertise en traitement des données de l’EDS
- Consolidation de l’expression de besoin « traitement automatique du langage » avec les équipes de recherche et de pilotage de l’EDS
- Implication dans le projet PARTAGES
- Développement de bibliothèques Python pour l’analyse des données de l’EDS
- Développement de modèles de machine learning pour pré-traiter les données
- Rédaction de documentation technique et utilisateur
- Développement de partenariats académiques
- Contribution à l’écriture d’articles scientifiques
Missions ponctuelles :
- Support utilisateur
- Formation au traitement automatique du langage
- Conseil interne
Profil recherché
Diplôme : Diplômé(e) d'ingénieur avec spécialisation en traitement de données massives
Expérience : 3 à 5 ans, idéalement dans le secteur de la santé
Compétences Clés :
- Expertise en analyse de bases de données (SQL) ;
- Expertise en développement de modèles de machine learning (Tensorflow, Pytorch etc.) ;
- Expertise en calcul distribué et en data management (Spark, etc.) ;
- Expertise en traitement automatiques des langues (NLP) ;
- Expertise en développement Python/R ;
- Expertise en déploiement de modèles statistiques/de machine learning ;
Prérequis :
- Connaissance des problématiques fonctionnelles hospitalières (structures, processus) et des métiers de la santé (dont la recherche sur données et la recherche clinique) ;
- Capacité à lire la littérature scientifique et à contribuer à des articles scientifiques ;
- Connaissance des méthodes épidémiologiques ;
- Connaissance des standards d'interopérabilité du domaine de la santé (FHIR, OMOP, CDA, HL7, CIM, Snomed, LOINC…)
- Connaissance du RGPD et de la réglementation liée à la recherche sur données et la recherche clinique
Savoir-faire et savoir être :
- Esprit d'équipe et fort sens du relationnel
- Autonomie, rigueur, méthode
- Excellentes aptitudes relationnelles et à la communication, capacité d'écoute et de vulgarisation, capacité de formation (Aisance à l'oral, diplomatie)
- Capacité de travail importante, associée à un fort dynamisme.
- Curiosité et capacité d'adaptation et d'anticipation
- Adhésion aux valeurs du service public et intérêt prononcé pour le domaine de la santé
À propos de l'offre
-
Data engineer