Christelle Judith Agonkoui, Freedath Djibril Moussa, Sophie Dabo-Niang
Afr. Stat. 17 (4), 3321-3366, (September 2023) DOI: 10.16929/as/2022.3321.308
KEYWORDS: choice-based sampling, Case-control, multivariate functional data, multivariate functional principal components, 62D05, 62H99, 62P10
We address the problem of performing dimension reduction on multivariate functional data observed on different domains in an endogenously stratified sampling context. The aim is to propose a new multivariate functional principal component analysis (MFPCA) approach for data sampled by a stratification of a population according to a binary variable of interest. This estimation strategy is derived from a direct relationship between univariate and multivariate FPCA for finite Karhunen-Loève decompositions. The proposed methodology yields encouraging results and can be applied to data with measurement errors. Computational results on simulated data highlight the good performance of the proposed methodology compared to the classical MFPCA, which ignores the type of data sampling. A real-life application considering breast cancer cells data is also presented.
Nous abordons le problème de la réduction de dimension des données fonctionnelles multivariées observées sur différents domaines dans un contexte d’échantillonnage endogène stratifié. Nous proposons une nouvelle approche d’analyse en composantes principales fonctionnelles multivariées (ACPFM) pour des données échantillonnées par une stratification de la population suivant une variable d’intérêt binaire. Cette stratégie d’estimation est obtenue à partir d’une relation entre les ACP fonctionnelles univariée et multivariée pour les décompositions finies de Karhunen-Loève. Notre méthodologie donne des résultats encourageants et peut être appliquée à des données comportant des erreurs de mesure. Des simulations mettent en évidence les bonnes performances de la méthodologie proposée par rapport à l’ACPFM classique, qui ignore la nature d’échantillonnage des données. Nous présentons également une application en considérant des données réelles portant sur des cellules cancéreuses du sein.