Abstract
The empirical optimal transport (OT) cost between two probability measures from random data is a fundamental quantity in transport based data analysis. In this work, we derive novel guarantees for its convergence rate when the involved measures are different, possibly supported on different spaces. Our central observation is that the statistical performance of the empirical OT cost is determined by the less complex measure, a phenomenon we refer to as lower complexity adaptation of empirical OT. For instance, under Lipschitz ground costs, we find that the expected error between the empirical OT cost based on n observations and the population quantity decreases with rate if one of the two measures is concentrated on a d-dimensional manifold, while the other can be arbitrary. For semi-concave ground costs, we show that the upper bound for the rate improves to . Similarly, our theory establishes the general convergence rate for semi-discrete OT. All of these results are valid in the two-sample case as well. Our findings therefore suggest that the curse of dimensionality only affects the estimation of the OT cost when both measures exhibit a high intrinsic dimension. Our proofs are based on the dual formulation of OT as a maximization over a suitable function class and the observation that the c-transform of under bounded costs has the same uniform metric entropy as itself.
Le coût empirique de transport optimal (OT) entre deux mesures de probabilité issues de données aléatoires est une quantité fondamentale pour l’analyse de données basée sur la théorie du transport optimal. Dans ce travail, nous dérivons de nouvelles garanties pour le taux de convergence de cette quantité quand les mesures en jeu sont différentes et potentiellement supportées sur des espaces différents. Notre observation centrale est que la performance statistique du coût de transport empirique est déterminée par la mesure dont la complexité est la plus faible, un phénomène que nous nommons l’adaptivité à la complexité la plus faible du coût de transport empirique. Par exemple, dans le cas d’une fonction de coût lipschitzienne, nous trouvons que l’espérance de l’erreur entre le coût de transport optimal empirique basé sur n observations et son équivalent dans la population décroît à un taux si une des deux mesures est concentrée sur une variété de dimension d, l’autre mesure pouvant être arbitraire. Pour des fonctions de coût semi-concaves, nous montrons que la borne supérieure pour le taux est meilleure et d’ordre . De manière similaire, notre théorie montre que le taux est atteint pour le transport semi-discret. Tous les résultats s’appliquent aussi au cas de deux échantillons. Nos résultats suggèrent que le fléau de la dimension n’affecte l’estimation du coût de transport optimal que quand les deux mesures ont une dimension intrinsèque élevée. Nos preuves se basent sur la formulation duale du problème de transport optimal, une maximisation sur une classe de fonctions , et l’observation que la c-transformée de , dans le cas de fonctions de coûts bornées, a la même entropie métrique uniforme que elle-même.
Funding Statement
S. Hundrieser and T. Staudt were in part funded by the DFG under Germany’s Excellence Strategy—EXC 2067/1-390729940. S. Hundrieser was also in part funded by the DFG RTG 2088.
Acknowledgments
A. Munk gratefully acknowledges support of the DFG CRC 1456.
Citation
Shayan Hundrieser. Thomas Staudt. Axel Munk. "Empirical optimal transport between different measures adapts to lower complexity." Ann. Inst. H. Poincaré Probab. Statist. 60 (2) 824 - 846, May 2024. https://doi.org/10.1214/23-AIHP1369
Information