Open Access
December 2003 Ambiguïtés Irréductibles dans les Monoïdes de Mots
Vincent Berment, Claude Del Vigna
Bull. Belg. Math. Soc. Simon Stevin 10(5): 693-706 (December 2003). DOI: 10.36045/bbms/1074791326

Abstract

Le point de départ de l'étude présentée ici est cette "malice" de certaines langues du Sud-Est Asiatique qui s'écrivent sans que des espaces séparent les mots. Les traitements automatiques de ces langues s'en trouvent compliqués d'autant que, dès le premier niveau, celui des syllabes, le découpage des textes n'est en général pas unique. Autrement dit, rapporté à la combinatoire des mots, le système syllabique de ces langues n'est pas un code. On s'intéresse ici à l'origine des ambiguïtés de découpage, plus précisément au recensement de celles qu'on appelle irréductibles, en ce sens qu'elles sont à l'origine de toutes les autres. On montre que le langage des ambiguïtés irréductibles est rationnel et on présente le moyen d'en calculer une expression régulière en l'étayant de l'expérience de son application à la langue laotienne.

The starting point of this study is that the written formof certain South-East Asian languages does not use spaces between words, thus complicating their automatic processing. This is particularly the case on the syllabic level, where generally the text cannot be cut up uniquely. From the formal combinatorics point of view, the syllabic system of these languages is not a code. We will focus on the origin of the splittingambiguities, more specifically on the inventory of the so-called irreducible ambiguities, in the sense that all others originate from them. We prove that the language of irreducible ambiguities is rational. Then we present a method to compute one of its regular expressions, illustrating the method with the experience of its application to the Lao language.

Citation

Download Citation

Vincent Berment. Claude Del Vigna. "Ambiguïtés Irréductibles dans les Monoïdes de Mots." Bull. Belg. Math. Soc. Simon Stevin 10 (5) 693 - 706, December 2003. https://doi.org/10.36045/bbms/1074791326

Information

Published: December 2003
First available in Project Euclid: 22 January 2004

zbMATH: 1126.68454
Digital Object Identifier: 10.36045/bbms/1074791326

Subjects:
Primary: 68Q45 , 68R15

Rights: Copyright © 2003 The Belgian Mathematical Society

Vol.10 • No. 5 • December 2003
Back to Top