Open Access
November 2016 Sharp detection of smooth signals in a high-dimensional sparse matrix with indirect observations
Cristina Butucea, Ghislaine Gayraud
Ann. Inst. H. Poincaré Probab. Statist. 52(4): 1564-1591 (November 2016). DOI: 10.1214/15-AIHP689

Abstract

We consider a matrix-valued Gaussian sequence model, that is, we observe a sequence of high-dimensional $M\times N$ matrices of heterogeneous Gaussian random variables $x_{ij,k}$ for $i\in\{1,\ldots,M\}$, $j\in\{1,\ldots,N\}$, $M$ and $N$ tend to infinity and $k\in\mathbb{Z}$. For large $|k|$, the standard deviation of our observations is $\epsilon|k|^{s}$ for some $\epsilon>0,\epsilon\to0$ and a given $s\geq0$, case that encompasses mildly ill-posed inverse problems.

We give separation rates for the detection of a sparse submatrix of size $m\times n$ ($m$ and $n$ tend to infinity, $m/M$ and $n/N$ tend 0) with active components. A component $(i,j)$ is said active if the sequence $\{x_{ij,k}\}_{k}$ has mean $\{\theta_{ij,k}\}_{k}$ within a Sobolev ellipsoid of smoothness $\tau>0$ and total energy $\sum_{k}\theta^{2}_{ij,k}$ larger than some $r^{2}_{\epsilon}$. We construct a test procedure and compute rates that involve relationships between $m,n,M$, $N$ and $\epsilon$, such that the asymptotic total error probability tends to 0. We also show how these rates can be made adaptive to the size $(m,n)$ of the submatrix under some constraints.

We prove corresponding lower bounds under additional assumptions on the relative size of the submatrix in the large matrix of observations. Our separation rates are sharp under further assumptions. Lower bounds for hypothesis testing problems mean that no test procedure can distinguish between the null hypothesis (no signal) and the alternative, i.e. the minimax total error probability for testing tends to 1.

Nous considérons un modèle de suites de matrices de taille $M\times N$ dont les entrées sont des variables aléatoires Gaussiennes hétérogènes, $x_{ij,k}$, $i\in\{1,\ldots,M\}$, $j\in\{1,\ldots,N\}$, avec $M$ et $N$ qui tendent vers l’infini et $k\in\mathbb{Z}$. Pour $|k|$ grand, nous supposons l’écart-type de $x_{ij,k}$ de l’ordre de $\epsilon|k|^{s}$ pour $\epsilon>0$ tel que $\epsilon\rightarrow0$ et avec $s>0$ connu; notre modèle permet donc d’inclure le cadre des problèmes inverses modérément mal-posés.

Nos résultats sont des vitesses de séparation dans le problème de détection d’une sous-matrice significative de taille $m\times n$, avec $m$ et $n$ qui tendent vers l’infini et parcimonieuse, c-à-d $m/M$ et $n/N$ tendent vers $0$. Une composante $(i,j)$ est dite active si la suite $\{x_{ij,k}\}_{k}$ a une espérance $\{\theta_{ij,k}\}_{k}$ qui appartient à une ellipsoide de Sobolev de régularité $\tau>0$ et une énergie totale $\sum_{k}\theta^{2}_{ij,k}$ supérieure à $r^{2}_{\epsilon}$. Nous construisons une procédure de test pour laquelle nous obtenons des vitesses de séparation impliquant des relations entre $m,n,M$, $N$ et $\epsilon$, de sorte que l’erreur totale de test tende vers $0$. Nous montrons comment rendre ces vitesses de tests adaptatives en $(m,n)$, la taille des sous-matrices significatives.

En faisant une hypothèse supplémentaire sur la taille relative des sous-matrices à détecter, nous prouvons les bornes inférieures correspondantes, ce qui assure qu’aucune procédure de test n’est capable de distinguer l’hypothèse nulle de l’alternative avec des vitesses « meilleures » que celles obtenues par notre procédure de test. Dans certains cas, nous obtenons des vitesses de séparation exactes.

Citation

Download Citation

Cristina Butucea. Ghislaine Gayraud. "Sharp detection of smooth signals in a high-dimensional sparse matrix with indirect observations." Ann. Inst. H. Poincaré Probab. Statist. 52 (4) 1564 - 1591, November 2016. https://doi.org/10.1214/15-AIHP689

Information

Received: 5 May 2014; Revised: 21 March 2015; Accepted: 21 May 2015; Published: November 2016
First available in Project Euclid: 17 November 2016

zbMATH: 1353.62056
MathSciNet: MR3573287
Digital Object Identifier: 10.1214/15-AIHP689

Subjects:
Primary: 60G15 , 62C20 , 62G10 , 62G20 , 62H15

Keywords: Asymptotic minimax test , Detection boundary , Gaussian white noise model , Heterogeneous observations , High-dimensional data , Indirect observations , Inverse problems , Sharp rates , Sparsity

Rights: Copyright © 2016 Institut Henri Poincaré

Vol.52 • No. 4 • November 2016
Back to Top