Open Access
June 2008 New M-estimators in semi-parametric regression with errors in variables
Cristina Butucea, Marie-Luce Taupin
Ann. Inst. H. Poincaré Probab. Statist. 44(3): 393-421 (June 2008). DOI: 10.1214/07-AIHP107

Abstract

In the regression model with errors in variables, we observe n i.i.d. copies of (Y, Z) satisfying Y=fθ0(X)+ξ and Z=X+ɛ involving independent and unobserved random variables X, ξ, ɛ plus a regression function fθ0, known up to a finite dimensional θ0. The common densities of the Xi’s and of the ξi’s are unknown, whereas the distribution of ɛ is completely known. We aim at estimating the parameter θ0 by using the observations (Y1, Z1), …, (Yn, Zn). We propose an estimation procedure based on the least square criterion $\tilde{S}_{\theta^{0},g}(\theta)=\mathbb{E}_{\theta^{0},g}[((Y-f_{\theta}(X))^{2}w(X)]$ where w is a weight function to be chosen. We propose an estimator and derive an upper bound for its risk that depends on the smoothness of the errors density pɛ and on the smoothness properties of w(x)fθ(x). Furthermore, we give sufficient conditions that ensure that the parametric rate of convergence is achieved. We provide practical recipes for the choice of w in the case of nonlinear regression functions which are smooth on pieces allowing to gain in the order of the rate of convergence, up to the parametric rate in some cases. We also consider extensions of the estimation procedure, in particular, when a choice of wθ depending on θ would be more appropriate.

Dans le modèle de régression avec erreurs sur les variables, nous observons n v.a. i.i.d. de même loi que (Y, Z) satisfaisant aux relations Y=fθ0(X)+ξ et Z=X+ɛ, où les v.a. X, ξ, ɛ sont indépendantes, pas observées, et la fonction de régression fθ0 est connue à un paramètre de dimension finie θ0 près. Les densités de X et de ξ sont inconnues tandis que la loi de ɛ est entièrement connue. Nous estimons le paramètre θ0 à partir des observations (Y1, Z1), …, (Yn, Zn). Nous proposons une procédure d’estimation basée sur le critère des moindres carrés $\tilde{S}_{\theta^{0},g}(\theta)=\mathbb{E}_{\theta^{0},g}[((Y-f_{\theta}(X))^{2}w(X)]$, où w est une fonction de poids à choisir. Nous définissons l’estimateur et calculons la borne supérieure du risque de cet estimateur, qui dépend de la régularité de la densité des erreurs pɛ et de la régularité en x de w(x)fθ(x). De plus, nous établissons des conditions suffisantes pour que les estimateurs atteignent la vitesse paramétrique. Nous décrivons des méthodes pratiques pour le choix de x dans le cas des fonctions de régression non-linéaires qui sont régulières par morceaux permettant de gagner des ordres de vitesse allant jusqu’à la vitesse paramétrique dans certains cas. Nous considérons également des extensions de cette procédure d’estimation, en particulier au cas où un choix de wθ dépendant de θ serait plus appropié.

Citation

Download Citation

Cristina Butucea. Marie-Luce Taupin. "New M-estimators in semi-parametric regression with errors in variables." Ann. Inst. H. Poincaré Probab. Statist. 44 (3) 393 - 421, June 2008. https://doi.org/10.1214/07-AIHP107

Information

Published: June 2008
First available in Project Euclid: 26 May 2008

zbMATH: 1206.62068
MathSciNet: MR2451051
Digital Object Identifier: 10.1214/07-AIHP107

Subjects:
Primary: 62F12 , 62J02
Secondary: 62G05 , 62G20

Keywords: asymptotic normality , consistency , Deconvolution kernel estimator , Errors-in-variables model , M-estimators , Ordinary smooth and super-smooth functions , rates of convergence , Semi-parametric nonlinear regression

Rights: Copyright © 2008 Institut Henri Poincaré

Vol.44 • No. 3 • June 2008
Back to Top