May 2024 Robust subgaussian estimation with VC-dimension
Jules Depersin
Author Affiliations +
Ann. Inst. H. Poincaré Probab. Statist. 60(2): 971-989 (May 2024). DOI: 10.1214/22-AIHP1347

Abstract

Median-of-means (MOM) based procedures provide non-asymptotic and strong deviation bounds even when data are heavy tailed and/or corrupted. This work proposes a new general and systematic way to bound the excess risk for MOM estimators. The core technique is the use of the VC-dimension (instead of Rademacher complexity) to measure the statistical complexity. In particular, this allows one to give the first robust estimators for sparse estimation which achieves the so-called subgaussian rate, only assuming a finite second moment for the uncorrupted data.

By comparison, previous works using Rademacher complexities required a number of finite moments that grows logarithmically with the dimension. With this technique, we derive new robust subgaussian bounds for mean estimation in any norm.

Les procédures basées sur la médiane des moyennes (MOM) fournissent des bornes non asymptotiques et fortes, même lorsque les données ont des queues de distribution lourdes et/ou sont corrompues. Ce travail propose une nouvelle méthode générale et systématique pour limiter le risque des estimateurs MOM. La technique de base est l’utilisation de la dimension VC (au lieu de la complexité de Rademacher) pour mesurer la complexité statistique. Cela permet en particulier de trouver des estimateurs robustes pour l’estimation sparse qui atteignent le taux dit sous-gaussien en supposant seulement un second moment fini pour les données non corrompues.

En comparaison, les travaux précédents utilisant les complexités de Rademacher nécessitaient un nombre de moments finis de l’ordre du logarithme de la dimension, donc dépendant de la dimension. Grâce à cette technique, nous proposons de nouvelles bornes sous-gaussiennes robustes pour l’estimation de la moyenne dans n’importe quelle norme.

Funding Statement

J.D. thanks INSEE, ENSAE and CREST for their support.

Acknowledgements

I would like to thank Guillaume Lecué, Matthieu Lerasle and James Brian Mitchell for their precious comments. I also wish to thank anonymous referees for helping me change and improve this paper.

Citation

Download Citation

Jules Depersin. "Robust subgaussian estimation with VC-dimension." Ann. Inst. H. Poincaré Probab. Statist. 60 (2) 971 - 989, May 2024. https://doi.org/10.1214/22-AIHP1347

Information

Received: 4 April 2022; Revised: 28 September 2022; Accepted: 10 November 2022; Published: May 2024
First available in Project Euclid: 11 June 2024

Digital Object Identifier: 10.1214/22-AIHP1347

Subjects:
Primary: 62F35

Keywords: Heavy tailed data , robustness , Sparse estimation

Rights: Copyright © 2024 Association des Publications de l’Institut Henri Poincaré

JOURNAL ARTICLE
19 PAGES

This article is only available to subscribers.
It is not available for individual sale.
+ SAVE TO MY LIBRARY

Vol.60 • No. 2 • May 2024
Back to Top