Théorème de Cobham

Page d’aide sur l’homonymie

Ne doit pas être confondu avec Thèse de Cobham.

Le théorème de Cobham est un théorème de combinatoire des mots qui a des connexions importantes avec la théorie des nombres, et notamment des nombres transcendants, et avec la théorie des automates. Le théorème stipule que si les écritures, en deux bases multiplicativement indépendantes, d'un ensemble d'entiers naturels S sont des langages rationnels, alors l'ensemble S est une union finie de progressions arithmétiques. Le théorème a été prouvé par Alan Cobham en 1969. Depuis, il a donné lieu à de nombreuses extensions et généralisations[1].

Définitions

Soit b > 0 {\displaystyle b>0} un entier. L'écriture en base b {\displaystyle b} d'un entier naturel n {\displaystyle n} est la suite de chiffres n 0 n 1 n h {\displaystyle n_{0}n_{1}\cdots n_{h}} tels que

n = n 0 + n 1 b + + n h b h {\displaystyle n=n_{0}+n_{1}b+\cdots +n_{h}b^{h}}

avec 0 n 0 , n 1 , , n h < b {\displaystyle 0\leq n_{0},n_{1},\ldots ,n_{h}<b} et n h > 0 {\displaystyle n_{h}>0} . La suite n 0 n 1 n h {\displaystyle n_{0}n_{1}\cdots n_{h}} est souvent noté n b {\displaystyle \langle n\rangle _{b}} ou plus simplement n b {\displaystyle n_{b}} .

Un ensemble d'entiers naturels S est reconnaissable en base b {\displaystyle b} ou plus simplement b {\displaystyle b} -reconnaissable si l'ensemble { n b n S } {\displaystyle \{n_{b}\mid n\in S\}} des écritures en base b de ses éléments est un langage reconnu par un automate fini, sur l'alphabet { 0 , 1 , , b 1 } {\displaystyle \{0,1,\ldots ,b-1\}} .

Deux entiers positifs k {\displaystyle k} et {\displaystyle \ell } sont multiplicativement indépendants s'il n'existe pas d'entiers non nuls p {\displaystyle p} et q {\displaystyle q} tels que k p = q {\displaystyle k^{p}=\ell ^{q}} . Par exemple, 2 et 3 sont multiplicativement indépendants, alors que 8 et 16 ne le sont pas puisque 8 4 = 16 3 {\displaystyle 8^{4}=16^{3}} . Deux entiers sont multiplicativement dépendants si et seulement s'ils sont puissances d'un même troisième entier.

Énoncés

Énoncé original

Plusieurs énoncés équivalents du théorème ont été donnés. La version originale de Cobham est la suivante :

Théorème (Cobham 1969) — Soit S un ensemble d'entiers naturels, et soient k {\displaystyle k} et {\displaystyle \ell } deux entiers positifs multiplicativement indépendants. Alors S est reconnaissable par automate fini en base k {\displaystyle k} et en base {\displaystyle \ell } si et seulement si S est ultimement périodique.

Une autre façon d'énoncer le théorème le relie aux suites automatiques. Cobham lui-même les appelle « uniform tag sequences »[2]. Il se trouve sous la forme suivante dans le livre d'Allouche et Shallit[3] :

Théorème — Soient k {\displaystyle k} et {\displaystyle \ell } deux entiers multiplicativement indépendants. Une suite est à la fois k {\displaystyle k} -automatique et {\displaystyle \ell } -automatique seulement si elle est 1 {\displaystyle 1} -automatique[4].

On peut en effet montrer que la suite caractéristique d'un ensemble entiers naturels S reconnaissable par automate fini en base k est une suite k-automatique et que réciproquement, pour toute suite k-automatique u {\displaystyle u} et tout entier 0 i < k {\displaystyle 0\leq i<k} , l'ensemble S i {\displaystyle S_{i}} des entiers s {\displaystyle s} tels que u s = i {\displaystyle u_{s}=i} est reconnaissable en base k {\displaystyle k} .

Formulation en logique

Le théorème de Cobham peut se formuler dans une logique du premier ordre, en utilisant un théorème démontré par Büchi en 1960. Cette formulation logique a donné lieu à des extensions et généralisations. L'expression logique fait appel à la théorie[5]

N , + , V r {\displaystyle \langle N,+,V_{r}\rangle }

des entiers naturels équipés de l'addition et de plus de la fonction V r {\displaystyle V_{r}} définie par V_r(0)=1 et pour un entier positif n {\displaystyle n} , prend la valeur V r ( n ) = m {\displaystyle V_{r}(n)=m} si r m {\displaystyle r^{m}} est la plus haute puissance de r {\displaystyle r} qui divise n {\displaystyle n} . Par exemple, V 2 ( 20 ) = 4 {\displaystyle V_{2}(20)=4} , et V 3 ( 20 ) = 1 {\displaystyle V_{3}(20)=1} . Un ensemble

Un ensemble d’entiers S {\displaystyle S} est définissable en logique du premier ordre dans N , + , V r {\displaystyle \langle N,+,V_{r}\rangle } s’il peut être décrit par un formule du premier ordre avec égalité, addition et V r {\displaystyle V_{r}} .

Exemples :

  • L’ensemble des nombres impairs est définissable (sans V r {\displaystyle V_{r}} ) par la formule ( y ) ( x = y + y + 1 ) {\displaystyle (\exists y)(x=y+y+1)}
  • L’ensemble { 2 n n 0 } {\displaystyle \{2^{n}\mid n\geq 0\}} des puissances de 2 est définissable par la formule toute simple V 2 ( x ) = x {\displaystyle V_{2}(x)=x} .

Théorème de Cobham reformulé — Soit S un ensemble d'entiers naturels, et soient k {\displaystyle k} et {\displaystyle \ell } deux entiers positifs multiplicativement indépendants. Alors S définissable au premier ordre dans N , + , V k {\displaystyle \langle N,+,V_{k}\rangle } et dans N , + , V {\displaystyle \langle N,+,V_{\ell }\rangle } si et seulement si S est ultimement périodique.

On peut pousser plus loin l’analogie avec la logique en notant que S est définissable au premier ordre dans l’arithmétique de Presburger si et seulement s’il est ultimement périodique. Ainsi, un ensemble S est définissable dans les logiques N , + , V k {\displaystyle \langle N,+,V_{k}\rangle } et N , + , V {\displaystyle \langle N,+,V_{\ell }\rangle } si et seulement s'il est définissable dans l'arithmétique de Presburger.

Généralisations

Approche par morphisme

Une suite automatique est un mot morphique particulier, dont le morphisme générateur est uniforme. Un ensemble d'entiers est donc k-reconnaissable si et seulement si sa suite caractéristique est engendrée par un morphisme uniforme suivie d'un morphisme de codage. Par exemple, la suite caractéristique des puissances de 2 est produite par le morphisme 2-uniforme sur l'alphabet B = { a , 0 , 1 } {\displaystyle B=\{a,0,1\}} défini par

a a 1   , 1 10   , 0 00 {\displaystyle a\mapsto a1\ ,\quad 1\mapsto 10\ ,\quad 0\mapsto 00}

qui engendre le mot infini

a 11010001 {\displaystyle a11010001\cdots } ,

suivi du morphisme de codage (c'est-à-dire lettre à lettre) qui envoie a {\displaystyle a} sur 0 {\displaystyle 0} et laisse 0 {\displaystyle 0} et 1 {\displaystyle 1} inchangés, ce qui donne 011010001 {\displaystyle 011010001\cdots } .

La notion a été étendue comme suit : Un mot morphique s {\displaystyle s} est α {\displaystyle \alpha } -substitutif pour un certain nombre α {\displaystyle \alpha } s'il s'écrit sous la forme

s = π ( f ω ( b ) ) {\displaystyle s=\pi (f^{\omega }(b))}

où le morphisme f : B B {\displaystyle f:B^{*}\to B^{*}} , prolongeable en b {\displaystyle b} , a les propriétés suivantes :

  • toutes les lettres de B {\displaystyle B} ont des occurrences dans f ω ( b ) {\displaystyle f^{\omega }(b)} , et
  • α > 1 {\displaystyle \alpha >1} est la valeur propre dominante de la matrice du morphisme f {\displaystyle f} .

Un ensemble S d'entiers naturels est α {\displaystyle \alpha } -reconnaissable si sa suite caractéristique s {\displaystyle s} est α {\displaystyle \alpha } -substitutive.

Une dernière définition : Un nombre de Perron est un nombre algébrique z > 1 {\displaystyle z>1} tel que tous ses conjugués appartiennent au disque { z C , | z | < z } {\displaystyle \{z'\in \mathbb {C} ,|z'|<z\}} . Ce sont exactement les valeurs propres dominantes des matrices entières positives primitives.

On a alors l'énoncé suivant[6] :

Théorème de Cobham pour les substitutions — Soient α et β deux nombres de Perron multiplicativement indépendants. Alors une suite x à élément dans un ensemble fini et à la fois α-substitutive et β-substitutive si et seulement si x est ultimement périodique.

Approche logique

L'équivalence logique a permis de considérer des situations plus générales : les suites automatiques sur les entiers naturels N {\displaystyle \mathbb {N} } ou ensembles reconnaissables ont été étendues aux entiers relatifs Z {\displaystyle \mathbb {Z} } , aux produits cartésiens N m {\displaystyle \mathbb {N} ^{m}} , aux nombres réels R {\displaystyle \mathbb {R} } et aux produits cartésiens R m {\displaystyle \mathbb {R} ^{m}} [5].

Extension à Z {\displaystyle \mathbb {Z} }

On code les entiers base k {\displaystyle k} en faisant précéder l’écriture d'un entier positif par le chiffre 0, et d’un entier négatif par k 1 {\displaystyle k-1} suivi du complément à k {\displaystyle k} . Par exemple, en base 2, l’entier -6=-8+2 s’écrit 1010. Les puissances de 2 s’écrivent 010^* , et leurs opposés 110^* (car 11000 = -16+8=-8)

Extension à N m {\displaystyle \mathbb {N} ^{m}}

Une partie X {\displaystyle X} de N m {\displaystyle N^{m}} est reconnaissable en base k {\displaystyle k} si les éléments de X {\displaystyle X} , écrits comme vecteurs à m {\displaystyle m} composantes sont reconnaissables sur l’alphabet produit.

Par exemple

En base 2, on a 3 = 11 2 {\displaystyle 3=11_{2}} et 9 = 1001 2 {\displaystyle 9=1001_{2}} ; le vecteur ( 3 9 ) {\displaystyle {\begin{pmatrix}3\\9\end{pmatrix}}} est écrit comme ( 0011 1001 ) = ( 0 1 ) ( 0 0 ) ( 1 0 ) ( 1 1 ) {\displaystyle {\begin{pmatrix}0011\\1001\end{pmatrix}}={\begin{pmatrix}0\\1\end{pmatrix}}{\begin{pmatrix}0\\0\end{pmatrix}}{\begin{pmatrix}1\\0\end{pmatrix}}{\begin{pmatrix}1\\1\end{pmatrix}}} .

Théorème de Semenov (1997) — Soient r {\displaystyle r} et s {\displaystyle s} deux entiers positifs multiplicativement indépendants. Une partie S {\displaystyle S} de N m {\displaystyle N^{m}} est r {\displaystyle r} -reconnaissable et s {\displaystyle s} -reconnaissable si et seulement si S {\displaystyle S} est une union finie de parties semi-linéaires.

Une preuve élégante de ce théorème est de Muchnik en 2003, par récurrence sur m {\displaystyle m} .

D'autres extensions ont été données aux nombres réels et aux vecteurs de nombres réels[5].

Démonstrations

Samuel Eilenberg énonce le théorème sans preuve dans son livre[7] ; il dit « The proof is correct, long, and hard. It is a challenge to find a more reasonable proof of this fine theorem ». Georges Hansel a proposé une preuve plus simple, publiée dans des actes difficilement accessibles d'un colloque[8]. La preuve de Dominique Perrin[9] et celle du livre d'Allouche et Shallit[3] contiennent la même erreur dans un des lemmes, mentionnée dans la liste d'erratas du livre[10]. Cette erreur a été relevée dans une note de Tomi Kärki[11], et corrigée par Michel Rigo et Laurent Waxweiler[12]. Cette partie de la démonstration a fait l'objet d'une rédaction récente[13].

En janvier 2018, Thijmen J. P. Krebs annonce, sur Arxiv, une preuve simplifiée du théorème original, basée sur un critère d'aproximation de Dirichlet plutôt que de Kronecker ; l’article est paru en 2021[14]. La méthode employée est raffinée et utilisée par Mol, Rampersad, Shallit et Stipulanti[15].

Notes et références

  1. Une synthèse des résultats récents est présentée dans Durand et Rigo 2010 et dans Adamczewski et Bell 2010.
  2. Cobham 1972.
  3. a et b Allouche et Shallit 2003, p. 345-350.
  4. Une suite « 1-automatique » est une suite ultimement périodique.
  5. a b et c Bruyère 2010.
  6. Durand 2011.
  7. (en) Samuel Eilenberg, Automata, Languages and Machines, Vol. A, New York, Academic Press, coll. « Pure and Applied Mathematics » (no 58), , xvi+451 (ISBN 978-0-12-234001-7).
  8. Georges Hansel, « À propos d’un théorème de Cobham », dans D. Perrin (éditeur), Actes de la Fête des mots, Rouen, Greco de programmation, CNRS, , p. 55–59.
  9. Dominique Perrin, « Finite Automata », dans Jan van Leeuwen (éditeur), Handbook of Theoretical Computer Science, vol. B : : Formal Models and Semantics, Elsevier, (ISBN 978-0444880741), p. 1-57.
  10. Errata for Automatic Sequences: Theory, Applications, Generalizations
  11. Tomi Kärki, « A Note on the Proof of Cobham’s Theorem », Rapport Technique n° 713, Université de Turku, (consulté le ).
  12. Michel Rigo et Laurent Waxweiler, « A Note on Syndeticity, Recognizable Sets and Cobham's Theorem. », Bulletin of the EATCS, vol. 88,‎ , p. 169-173 (MR 2222340, zbMATH 1169.68490, arXiv 0907.0624, lire en ligne).
  13. Paul Fermé, Willy Quach et Yassine Hamoudi, « Le théorème de Cobham », (consulté le ).
  14. Krebs 2021.
  15. Mol et al. 2019.

Bibliographie

  • [1969] (en) Alan Cobham, « On the base-dependence of sets of numbers recognizable by finite automata », Mathematical Systems Theory, vol. 3, no 2,‎ , p. 186–192 (DOI 10.1007/BF01746527, MR 0250789).
  • [1972] (en) Alan Cobham, « Uniform tag sequences », Mathematical Systems Theory, vol. 6, nos 1-2,‎ , p. 164–192 (DOI 10.1007/BF01706087, MR 0457011).
  • Véronique Bruyère, « Around Cobham's theorem and some of its extensions », Dynamical Aspects of Automata and Semigroup Theories, Satellite Workshop of Highlights of AutoMathA, (consulté le )
  • (ru) Alexei Lvovich Semenov, « Predicates regular in two number systems are Presburger », Sib. Mat. Zh., vol. 18,‎ , p. 403-418 (MR 0450050, zbMATH 0369.02023).
  • Andrej A. Muchnik, « The definable criterion for definability in Presburger arithmetic and its applications », Theoret. Comput. Sci., vol. 290, no 3,‎ , p. 1433–1444 (MR 1937730, zbMATH 1052.68079).
  • (en) Fabien Durand, « Cobham's theorem for substitutions », Journal of the European Mathematical Society, vol. 13, no 6,‎ , p. 1797–1812 (DOI 10.4171/JEMS/294, arXiv 1010.4009, lire en ligne).
  • Fabien Durand et Michel Rigo, « On Cobham’s Theorem », dans J.-É. Pin (éditeur), Automata: from Mathematics to Applications, European Mathematical Society, 2010 (en préparation) (lire en ligne).
  • Boris Adamczewski et Jason Bell, « Automata in number theory », dans J.-É. Pin (éditeur), Automata: from Mathematics to Applications, European Mathematical Society, 2010 (en préparation).
  • Lucas Mol, Narad Rampersad, Jeffrey Shallit et Manon Stipulanti, « Cobham’s Theorem and Automaticity », International Journal of Foundations of Computer Science, vol. 30, no 08,‎ , p. 1363–1379 (ISSN 0129-0541, DOI 10.1142/S0129054119500308, arXiv 1809.00679)
  • Thijmen J. P. Krebs, « A More Reasonable Proof of Cobham’s Theorem », International Journal of Foundations of Computer Science, vol. 32, no 02,‎ , p. 203207 (ISSN 0129-0541, DOI 10.1142/S0129054121500118, arXiv 1801.06704).
  • icône décorative Portail des mathématiques
  • icône décorative Portail de l'informatique théorique