Offre de thèse H/F: Inférence post-sélection pour modèles à variables latentes

Référence : UMR5219-ISAGUI-004

  • Fonction publique : Fonction publique de l'État
  • Employeur : Centre national de la recherche scientifique (CNRS)
  • Localisation : 31062 TOULOUSE (France)

Partager la page

Veuillez pour partager sur Facebook, Twitter et LinkedIn.

  • Nature de l’emploi Emploi ouvert uniquement aux contractuels
  • Nature du contrat Non renseigné
  • Expérience souhaitée Non renseigné
  • Rémunération (fourchette indicative pour les contractuels) La rémunération est d'un minimum de 2200,00 € mensuel € brut/an
  • Catégorie Catégorie A (cadre)
  • Management Non renseigné
  • Télétravail possible Non renseigné

Vos missions en quelques mots

Sujet de thèse :
Les outils d'inférence classique, en particulier les tests d'hypothèses et les intervalles de confiance, peuvent échouer de manière spectaculaire lorsqu'ils sont appliqués à des modèles statistiques dépendant des données. L'inférence post-sélection désigne un ensemble de travaux de recherche récents qui conçoivent et analysent des méthodes statistiques adaptées à ces modèles dépendant des données. En particulier, [3] traite des modèles linéaires gaussiens, et [2] propose des extensions aux contextes non linéaires et non gaussiens, basées sur des arguments asymptotiques.

L'objectif de ce projet de doctorat est d'étendre l'inférence post-sélection aux modèles à variables latentes. Ces modèles sont devenus la méthode de référence dans un large éventail d'applications [4, 6, 8] et font l'objet de nombreuses contributions récentes [1, 5]. Néanmoins, les garanties d'inférence post-sélection font actuellement défaut pour ces modèles, alors même que la sélection de modèles est courante en pratique [7, 9].

Cette extension, s'appuyant sur [2], nécessitera l'obtention de théorèmes centraux limites uniformes joints pour les estimateurs de paramètres avec variables latentes. De plus, d'un point de vue computationnel, l'estimation des paramètres sera réalisée à l'aide des algorithmes d'espérance-maximisation (EM) et de leurs extensions. Cela impliquera également des développements mathématiques pour prendre en compte le contexte de l'inférence post-sélection.

[1] P. Abry, J. Chevallier, G. Fort, and B. Pascal. Pandemic intensity estimation from stochastic approximation-based algorithms. In 2023 IEEE 9th International Workshop on Computational Ad- vances in Multi-Sensor Adaptive Processing (CAMSAP), pages 356–360. IEEE, 2023.
[2] F. Bachoc, D. Preinerstorfer, and L. Steinberger. Uniformly valid confidence intervals post-model- selection. The Annals of Statistics, 48(1):440–463, 2020.
[3] R. Berk, L. Brown, A. Buja, K. Zhang, and L. Zhao. Valid post-selection inference. The Annals of Statistics, pages 802–837, 2013.
[4] D. M. Blei. Build, compute, critique, repeat: Data analysis with latent variable models. Annual Review of Statistics and Its Application, 1(1):203–232, 2014.
[5] J. Chevallier, V. Debavelaere, and S. Allassonniere. A coherent framework for learning spatiotemporal piecewise-geodesic trajectories from longitudinal manifold-valued data. SIAM Journal on Imaging Sciences, 14(1):349–388, 2021.
[6] B. Everett. An introduction to latent variable models. Springer Science & Business Media, 2013.
[7] S. Lotfi, P. Izmailov, G. Benton, M. Goldblum, and A. G. Wilson. Bayesian model selection, the marginal likelihood, and generalization. In International Conference on Machine Learning, pages 14223–14247. PMLR, 2022.
[8] B. O. Muth ́en. Beyond SEM: General latent variable modeling. Behaviormetrika, 29(1):81–117, 2002.
[9] Y.-Q. Zhang, G.-L. Tian, and N.-S. Tang. Latent variable selection in s
Voir plus sur le site emploi.cnrs.fr...

Profil recherché

Contraintes et risques :
La thèse sera rattachée à l'Institut de Mathématiques de Toulouse.
Plusieurs courts déplacements à Marseille et Cadarache sont possibles dans le cadre du projet QHTHY.

Niveau d'études minimum requis

  • Niveau Niveau 7 Master/diplômes équivalents
  • Spécialisation Formations générales

Langues

  • Français Seuil

Qui sommes-nous ?

Le Centre national de la recherche scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation.

C’est l’une des plus importantes institutions publiques au monde : 33 000 femmes et hommes (dont plus de 16 000 chercheurs et plus de 16 000 ingénieurs et techniciens), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines.

En savoir plus sur l'employeur

À propos de l'offre

  • Profil du candidat / de la candidate : Nous recherchons des candidat(e)s titulaires d'un diplôme en mathématiques, avec une spécialisation en probabilité, statistique, apprentissage automatique ou mathématiques appliquées. De solides compétences théoriques sont attendues

  • Le Centre national de la recherche scientifique est l’une des plus importantes institutions publiques au monde : 34 000 femmes et hommes (plus de 1 000 laboratoires et 200 métiers), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l’innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche.

  • Vacant
  • Chercheuse / Chercheur

Des offres d'emplois recommandées pour vous