Open Access
August 2012 Optimal model selection in density estimation
Matthieu Lerasle
Ann. Inst. H. Poincaré Probab. Statist. 48(3): 884-908 (August 2012). DOI: 10.1214/11-AIHP425

Abstract

In order to calibrate a penalization procedure for model selection, the statistician has to choose a shape for the penalty and a leading constant. In this paper, we study, for the marginal density estimation problem, the resampling penalties as general estimators of the shape of an ideal penalty. We prove that the selected estimator satisfies sharp oracle inequalities without remainder terms under a few assumptions on the marginal density $s$ and the collection of models. We also study the slope heuristic, which yields a data-driven choice of the leading constant in front of the penalty when the complexity of the models is well-chosen.

Une procédure de pénalisation en sélection de modèle repose sur la construction d’une forme pour la pénalité ainsi que sur le choix d’une constante de calibration. Dans cet article, nous étudions, pour le problème d’estimation de la densité, les pénalités obtenues par rééchantillonnage de pénalités idéales. Nous montrons l’efficacité de ces procédures pour l’estimation de la forme des pénalités en prouvant, pour les estimateurs sélectionnés, des inégalités d’oracle fines sans termes résiduelles; les résultats sont valides sous des hypothèses faibles à la fois sur la densité inconnue $s$ et sur les collections de modèles. Ces pénalités sont de plus faciles à calibrer puisque la constante asymptotiquement optimale peut être calculée en fonction des poids de rééchantillonnage. En pratique, le nombre de données est toujours fini, nous étudions donc également l’heuristique de pente et justifions l’algorithme de pente qui permet de calibrer la constante de calibration à partir des données.

Citation

Download Citation

Matthieu Lerasle. "Optimal model selection in density estimation." Ann. Inst. H. Poincaré Probab. Statist. 48 (3) 884 - 908, August 2012. https://doi.org/10.1214/11-AIHP425

Information

Published: August 2012
First available in Project Euclid: 26 June 2012

zbMATH: 1244.62052
MathSciNet: MR2976568
Digital Object Identifier: 10.1214/11-AIHP425

Subjects:
Primary: 62G07 , 62G09

Keywords: Density estimation , Optimal model selection , Resampling methods , Slope heuristic

Rights: Copyright © 2012 Institut Henri Poincaré

Vol.48 • No. 3 • August 2012
Back to Top