Abstract
We consider a matrix-valued Gaussian sequence model, that is, we observe a sequence of high-dimensional $M\times N$ matrices of heterogeneous Gaussian random variables $x_{ij,k}$ for $i\in\{1,\ldots,M\}$, $j\in\{1,\ldots,N\}$, $M$ and $N$ tend to infinity and $k\in\mathbb{Z}$. For large $|k|$, the standard deviation of our observations is $\epsilon|k|^{s}$ for some $\epsilon>0,\epsilon\to0$ and a given $s\geq0$, case that encompasses mildly ill-posed inverse problems.
We give separation rates for the detection of a sparse submatrix of size $m\times n$ ($m$ and $n$ tend to infinity, $m/M$ and $n/N$ tend 0) with active components. A component $(i,j)$ is said active if the sequence $\{x_{ij,k}\}_{k}$ has mean $\{\theta_{ij,k}\}_{k}$ within a Sobolev ellipsoid of smoothness $\tau>0$ and total energy $\sum_{k}\theta^{2}_{ij,k}$ larger than some $r^{2}_{\epsilon}$. We construct a test procedure and compute rates that involve relationships between $m,n,M$, $N$ and $\epsilon$, such that the asymptotic total error probability tends to 0. We also show how these rates can be made adaptive to the size $(m,n)$ of the submatrix under some constraints.
We prove corresponding lower bounds under additional assumptions on the relative size of the submatrix in the large matrix of observations. Our separation rates are sharp under further assumptions. Lower bounds for hypothesis testing problems mean that no test procedure can distinguish between the null hypothesis (no signal) and the alternative, i.e. the minimax total error probability for testing tends to 1.
Nous considérons un modèle de suites de matrices de taille $M\times N$ dont les entrées sont des variables aléatoires Gaussiennes hétérogènes, $x_{ij,k}$, $i\in\{1,\ldots,M\}$, $j\in\{1,\ldots,N\}$, avec $M$ et $N$ qui tendent vers l’infini et $k\in\mathbb{Z}$. Pour $|k|$ grand, nous supposons l’écart-type de $x_{ij,k}$ de l’ordre de $\epsilon|k|^{s}$ pour $\epsilon>0$ tel que $\epsilon\rightarrow0$ et avec $s>0$ connu; notre modèle permet donc d’inclure le cadre des problèmes inverses modérément mal-posés.
Nos résultats sont des vitesses de séparation dans le problème de détection d’une sous-matrice significative de taille $m\times n$, avec $m$ et $n$ qui tendent vers l’infini et parcimonieuse, c-à-d $m/M$ et $n/N$ tendent vers $0$. Une composante $(i,j)$ est dite active si la suite $\{x_{ij,k}\}_{k}$ a une espérance $\{\theta_{ij,k}\}_{k}$ qui appartient à une ellipsoide de Sobolev de régularité $\tau>0$ et une énergie totale $\sum_{k}\theta^{2}_{ij,k}$ supérieure à $r^{2}_{\epsilon}$. Nous construisons une procédure de test pour laquelle nous obtenons des vitesses de séparation impliquant des relations entre $m,n,M$, $N$ et $\epsilon$, de sorte que l’erreur totale de test tende vers $0$. Nous montrons comment rendre ces vitesses de tests adaptatives en $(m,n)$, la taille des sous-matrices significatives.
En faisant une hypothèse supplémentaire sur la taille relative des sous-matrices à détecter, nous prouvons les bornes inférieures correspondantes, ce qui assure qu’aucune procédure de test n’est capable de distinguer l’hypothèse nulle de l’alternative avec des vitesses « meilleures » que celles obtenues par notre procédure de test. Dans certains cas, nous obtenons des vitesses de séparation exactes.
Citation
Cristina Butucea. Ghislaine Gayraud. "Sharp detection of smooth signals in a high-dimensional sparse matrix with indirect observations." Ann. Inst. H. Poincaré Probab. Statist. 52 (4) 1564 - 1591, November 2016. https://doi.org/10.1214/15-AIHP689
Information