Abstract
A representation of the degrees of freedom akin to Stein’s lemma is given for a class of estimators of a mean value parameter in $\mathbb{R}^{n}$. Contrary to previous results our representation holds for a range of discontinues estimators. It shows that even though the discontinuities form a Lebesgue null set, they cannot be ignored when computing degrees of freedom. Estimators with discontinuities arise naturally in regression if data driven variable selection is used. Two such examples, namely best subset selection and lasso-OLS, are considered in detail in this paper. For lasso-OLS the general representation leads to an estimate of the degrees of freedom based on the lasso solution path, which in turn can be used for estimating the risk of lasso-OLS. A similar estimate is proposed for best subset selection. The usefulness of the risk estimates for selecting the number of variables is demonstrated via simulations with a particular focus on lasso-OLS.
Une représentation des degrés de liberté comparable au lemme de Stein est donnée pour une classe d’estimateurs du paramètre de la moyenne dans $\mathbb{R}^{n}$. Contrairement aux résultats précédents, notre représentation est valable pour une famille d’estimateurs discontinus. Cela montre que même si les discontinuités sont de mesure de Lebesgue zéro, elles ne peuvent pas être ignorées lors du calcul des degrés de liberté. Les estimateurs avec discontinuités apparaissent naturellement dans les modèles de régression si de la sélection de variables par les données est utilisée. Deux tels exemples, la sélection du meilleur sous-ensemble et le lasso-OLS, sont considérés en détail dans l’article. Pour le Lasso-OLS, la représentation générale mène à une estimation des degrés de liberté basée sur le chemin de la solution Lasso, qui à son tour peut être utilisée pour estimer le risque du lasso-OLS. Une estimation similaire est proposée pour la sélection du meilleur sous-ensemble. L’utilité des estimées de risque pour le choix du nombre de variables est démontrée par des simulations qui se concentrent en particulier sur lasso-OLS.
Citation
Frederik Riis Mikkelsen. Niels Richard Hansen. "Degrees of freedom for piecewise Lipschitz estimators." Ann. Inst. H. Poincaré Probab. Statist. 54 (2) 819 - 841, May 2018. https://doi.org/10.1214/17-AIHP822
Information