Open Access
May 2016 Oracle inequalities for the Lasso in the high-dimensional Aalen multiplicative intensity model
Sarah Lemler
Ann. Inst. H. Poincaré Probab. Statist. 52(2): 981-1008 (May 2016). DOI: 10.1214/14-AIHP662

Abstract

In a general counting process setting, we consider the problem of obtaining a prognostic on the survival time adjusted on covariates in high-dimension. Towards this end, we construct an estimator of the whole conditional intensity. We estimate it by the best Cox proportional hazards model given two dictionaries of functions. The first dictionary is used to construct an approximation of the logarithm of the baseline hazard function and the second to approximate the relative risk. We introduce a new data-driven weighted Lasso procedure to estimate the unknown parameters of the best Cox model approximating the intensity. We provide non-asymptotic oracle inequalities for our procedure in terms of an appropriate empirical Kullback divergence. Our results rely on an empirical Bernstein’s inequality for martingales with jumps and properties of modified self-concordant functions.

Dans le cadre général d’un processus de comptage, nous intéressons à la façon d’obtenir un pronostic sur la durée de survie en fonction des covariables en grande dimension. Pour ce faire, nous construisons un estimateur de l’intensité conditionnelle. Nous l’estimons par le meilleur modèle de Cox étant donné deux dictionnaires de fonctions. Le premier dictionnaire est utilisé pour construire le logarithme du risque de base et le second, pour approximer le risque relatif. Nous introduisons une nouvelle procédure Lasso pondéré avec une pondération basée sur les données pour estimer les paramètres inconnus du meilleur modèle de Cox approximant l’intensité. Nous établissons une inégalité oracle non-asymptotique en divergence de Kullback empirique, qui est la fonction de perte la plus appropriée à notre procédure. Nos résultats reposent sur une inégalité de Bernstein pour les martingales à sauts et sur des propriétés des fonctions self-concordantes.

Citation

Download Citation

Sarah Lemler. "Oracle inequalities for the Lasso in the high-dimensional Aalen multiplicative intensity model." Ann. Inst. H. Poincaré Probab. Statist. 52 (2) 981 - 1008, May 2016. https://doi.org/10.1214/14-AIHP662

Information

Received: 12 October 2013; Revised: 11 June 2014; Accepted: 30 October 2014; Published: May 2016
First available in Project Euclid: 4 May 2016

zbMATH: 1342.62158
MathSciNet: MR3498018
Digital Object Identifier: 10.1214/14-AIHP662

Subjects:
Primary: 60E15 , 62G05 , 62G08 , 62N02

Keywords: Cox proportional hazards model , Empirical Bernstein’s inequality , High-dimensional covariates , intensity , Lasso , Non-asymptotic oracle inequalities , Non-parametric model , Right-censored data , Semiparametric model , Survival analysis

Rights: Copyright © 2016 Institut Henri Poincaré

Vol.52 • No. 2 • May 2016
Back to Top