Théorème du singe infini - Infinite monkey theorem

Chimpanzé assis devant une machine à écrire

Le théorème du singe infini stipule qu'un singe frappant au hasard des touches sur un clavier de machine à écrire pendant un temps infini tapera presque sûrement n'importe quel texte donné, comme les œuvres complètes de William Shakespeare . En fait, le singe taperait presque sûrement chaque texte fini possible un nombre infini de fois. Cependant, la probabilité que des singes remplissant tout l' univers observable tapent une seule œuvre complète, telle que Hamlet de Shakespeare , est si faible que la probabilité que cela se produise pendant une période de plusieurs centaines de milliers d' ordres de grandeur plus longue que l' âge du l'univers est extrêmement faible (mais techniquement pas nul). Le théorème peut être généralisé pour affirmer que toute séquence d'événements qui a une probabilité non nulle de se produire, du moins tant qu'elle ne s'est pas produite, finira presque certainement par se produire.

Dans ce contexte, "presque sûrement" est un terme mathématique signifiant que l'événement se produit avec probabilité 1, et le "singe" n'est pas un vrai singe, mais une métaphore d'un dispositif abstrait qui produit une séquence aléatoire sans fin de lettres et de symboles. L'un des premiers exemples d'utilisation de la « métaphore du singe » est celui du mathématicien français Émile Borel en 1913, mais le premier cas a peut-être été encore plus ancien.

Les variantes du théorème incluent plusieurs et même une infinité de dactylos, et le texte cible varie entre une bibliothèque entière et une seule phrase. Jorge Luis Borges a retracé l'histoire de cette idée d' Aristote est sur la génération et la corruption et Cicero 's De Natura Deorum (Sur la nature des dieux), par Blaise Pascal et Jonathan Swift , à des déclarations modernes avec leurs simiens emblématiques et des machines à écrire . Au début du 20e siècle, Borel et Arthur Eddington ont utilisé le théorème pour illustrer les échelles de temps implicites dans les fondements de la mécanique statistique .

Solution

Preuve directe

Il existe une démonstration directe de ce théorème. En guise d'introduction, rappelons que si deux événements sont statistiquement indépendants , alors la probabilité que les deux se produisent est égale au produit des probabilités que chacun se produise indépendamment. Par exemple, si la probabilité de pluie à Moscou un jour donné dans le futur est de 0,4 et la probabilité d'un tremblement de terre à San Francisco un jour donné est de 0,00003, alors la probabilité que les deux se produisent le même jour est de 0,4 × 0,00003 = 0,000012 , en supposant qu'ils sont bien indépendants.

Considérez la probabilité de taper le mot banane sur une machine à écrire à 50 touches. Supposons que les touches soient enfoncées de manière aléatoire et indépendante, ce qui signifie que chaque touche a une chance égale d'être enfoncée quelles que soient les touches qui ont été enfoncées précédemment. La probabilité que la première lettre saisie soit « b » est de 1/50, et la probabilité que la deuxième lettre saisie soit « a » est également de 1/50, et ainsi de suite. Par conséquent, la probabilité que les six premières lettres épelant banane est

(1/50) × (1/50) × (1/50) × (1/50) × (1/50) × (1/50) = (1/50) 6 = 1/15 625 000 000.

Moins d'un sur 15 milliards, mais pas zéro.

D'après ce qui précède, la probabilité de ne pas taper banane dans un bloc donné de 6 lettres est de 1 − (1/50) 6 . Parce que chaque bloc est tapé indépendamment, la chance X n de ne pas taper banane dans l'un des n premiers blocs de 6 lettres est

Au fur et à mesure que n grandit, X n devient plus petit. Pour n = 1 million, X n est d'environ 0,9999, mais pour n = 10 milliards, X n est d'environ 0,53 et pour n = 100 milliards, il est d'environ 0,0017. Lorsque n tend vers l'infini, la probabilité X n tend vers zéro ; c'est-à-dire qu'en rendant n assez grand, X n peut être rendu aussi petit que souhaité, et la chance de taper banane approche les 100 %. Ainsi, la probabilité que le mot banane apparaisse à un moment donné dans une séquence infinie de frappes est égale à un.

Le même argument s'applique si nous remplaçons un singe tapant n blocs de texte consécutifs par n singes tapant chacun un bloc (simultanément et indépendamment). Dans ce cas, X n = (1 − (1/50) 6 ) n est la probabilité qu'aucun des n premiers singes ne tape correctement la banane au premier essai. Par conséquent, au moins un singe parmi une infinité de singes produira ( avec une probabilité égale à un ) un texte aussi rapidement qu'il le serait par une dactylo humaine parfaitement précise le copiant à partir de l'original.

Chaînes infinies

Cela peut être exprimé de manière plus générale et compacte en termes de chaînes , qui sont des séquences de caractères choisies dans un alphabet fini :

  • Étant donné une chaîne infinie où chaque caractère est choisi uniformément au hasard , toute chaîne finie donnée apparaît presque sûrement comme une sous - chaîne à une certaine position.
  • Étant donné une séquence infinie de chaînes infinies, où chaque caractère de chaque chaîne est choisi uniformément au hasard, toute chaîne finie donnée apparaît presque sûrement comme préfixe de l'une de ces chaînes.

Les deux découlent facilement du deuxième lemme de Borel-Cantelli . Pour le deuxième théorème, soit E k l' événement où la k ème chaîne commence par le texte donné. Parce que cela a une probabilité p non nulle fixe de se produire, les E k sont indépendants et la somme ci-dessous diverge,

la probabilité qu'une infinité de E k se produisent est 1. Le premier théorème est montré de la même manière ; on peut diviser la chaîne aléatoire en blocs non chevauchants correspondant à la taille du texte souhaité, et faire de E k l'événement où le k ème bloc est égal à la chaîne souhaitée.

Probabilités

Cependant, pour un nombre physiquement significatif de singes tapant pendant des durées physiquement significatives, les résultats sont inversés. S'il y avait autant de singes qu'il y a d'atomes dans l'univers observable tapant extrêmement vite pendant des milliards de fois la vie de l'univers, la probabilité que les singes reproduisent ne serait-ce qu'une seule page de Shakespeare est insondable.

Ignorant la ponctuation, l'espacement et les majuscules, un singe tapant des lettres uniformément au hasard a une chance sur 26 de taper correctement la première lettre de Hamlet . Il a une chance sur 676 (26 × 26) de taper les deux premières lettres. Comme la probabilité diminue de façon exponentielle , à 20 lettres, elle n'a déjà qu'une chance sur 26 20 = 19 928 148 895 209 409 152 340 197 376 (presque 2 × 10 28 ). Dans le cas de l'ensemble du texte d' Hamlet , les probabilités sont si faibles qu'elles sont inconcevables. Le texte d'Hamlet contient environ 130 000 lettres. Ainsi, il y a une probabilité de un sur 3,4 × 10 183 946 d'obtenir le texte correct au premier essai. Le nombre moyen de lettres qui doivent être tapées jusqu'à ce que le texte apparaisse est également de 3,4 × 10 183 946 , ou y compris la ponctuation, de 4,4 × 10 360 783 .

Même si chaque proton dans l'univers observable était un singe avec une machine à écrire, tapant du Big Bang jusqu'à la fin de l'univers (lorsque les protons n'existeraient peut-être plus ), il leur faudrait encore beaucoup plus de temps - plus de trois cents et soixante mille ordres de grandeur de plus – pour avoir même 1 chance sur 10 500 de succès. En d'autres termes, pour avoir une chance sur un billion de succès, il faudrait 10 360 641 univers observables constitués de singes protoniques. Comme Kittel et Kroemer l'ont mis dans leur manuel sur la thermodynamique , le domaine dont les fondements statistiques ont motivé les premières expositions connues de typage des singes, "La probabilité d' Hamlet est donc nulle dans n'importe quel sens opérationnel d'un événement ...", et la déclaration que les singes doivent finalement réussir « donne une conclusion trompeuse sur de très, très grands nombres ».

En fait, il y a moins d'une chance sur un trillion de succès qu'un tel univers fait de singes puisse taper n'importe quel document particulier d'à peine 79 caractères.

Presque sûrement

La probabilité qu'une chaîne de texte infinie générée aléatoirement contienne une sous-chaîne finie particulière est de 1. Cependant, cela ne signifie pas que l'absence de la sous-chaîne est « impossible », bien que l'absence ait une probabilité a priori de 0. Par exemple, le singe immortel pourrait tapez au hasard G comme première lettre, G comme seconde et G comme chaque lettre par la suite, produisant une chaîne infinie de G ; à aucun moment le singe ne doit être « contraint » à taper autre chose. (Penser autrement implique l' erreur du joueur .) Quelle que soit la longueur d'une chaîne finie générée aléatoirement, il y a une chance faible mais non nulle qu'elle s'avère être constituée du même caractère répété tout au long ; cette chance tend vers zéro lorsque la longueur de la chaîne tend vers l'infini. Il n'y a rien de spécial à propos d'une séquence aussi monotone si ce n'est qu'elle est facile à décrire ; le même fait s'applique à toute séquence spécifique nommable, telle que "RGRGRG" répété indéfiniment, ou "ab-aa-bb-aaa-bbb-...", ou "Trois, Six, Neuf, Douze…".

Si le singe hypothétique a une machine à écrire avec 90 touches également probables qui incluent des chiffres et des signes de ponctuation, alors les premières touches tapées pourraient être "3.14" (les trois premiers chiffres de pi ) avec une probabilité de (1/90) 4 , qui est de 1 /65.610.000. Est tout aussi probable toute autre chaîne de quatre caractères autorisée par la machine à écrire, telle que « GGGG », « mATh » ou « q%8e ». La probabilité que 100 clés saisies au hasard soient constituées des 99 premiers chiffres de pi (y compris la clé de séparation), ou de toute autre séquence particulière de cette longueur, est beaucoup plus faible : (1/90) 100 . Si la longueur de texte allouée au singe est infinie, la chance de ne taper que les chiffres de pi est 0, ce qui est tout aussi possible (mathématiquement probable) que de ne taper que Gs (également probabilité 0).

La même chose s'applique à l'événement consistant à taper une version particulière de Hamlet suivie de copies sans fin de lui-même ; ou Hamlet immédiatement suivi de tous les chiffres de pi ; ces chaînes spécifiques sont également de longueur infinie , elles ne sont pas interdites par les termes du problème de pensée, et elles ont chacune une probabilité a priori de 0. En fait, toute séquence infinie particulière des types de singes immortels aura eu une probabilité a priori de 0 , même si le singe doit taper quelque chose.

Il s'agit d'une extension du principe selon lequel une chaîne finie de texte aléatoire a une probabilité de plus en plus faible d' être une chaîne particulière plus elle est longue (bien que toutes les chaînes spécifiques soient également improbables). Cette probabilité tend vers 0 lorsque la chaîne tend vers l'infini. Ainsi, la probabilité que le singe tape une chaîne interminablement longue, telle que tous les chiffres de pi dans l'ordre, sur un clavier à 90 touches est (1/90) qui est égal à (1/∞) qui est essentiellement 0. À en même temps, la probabilité que la séquence contienne une sous- séquence particulière (comme le mot MONKEY, ou les 12e à 999e chiffres de pi, ou une version de la Bible King James) augmente à mesure que la chaîne totale augmente. Cette probabilité approche 1 lorsque la chaîne totale approche l'infini, et donc le théorème original est correct.

Correspondance entre les chaînes et les nombres

Dans une simplification de l'expérience de pensée, le singe pourrait avoir une machine à écrire avec seulement deux touches : 1 et 0. La chaîne infiniment longue ainsi produite correspondrait aux chiffres binaires d'un nombre réel particulier entre 0 et 1. Un ensemble infini dénombrable de les chaînes possibles se terminent par des répétitions infinies, ce qui signifie que le nombre réel correspondant est rationnel . Les exemples incluent les chaînes correspondant à un tiers (010101...), cinq sixièmes (11010101...) et cinq-huitièmes (1010000...). Seul un sous-ensemble de telles chaînes de nombres réels (bien qu'un sous-ensemble dénombrable infini) contient l'intégralité de Hamlet (en supposant que le texte est soumis à un codage numérique, tel que ASCII ).

Pendant ce temps, il existe un ensemble infiniment infini de chaînes qui ne se terminent pas par une telle répétition ; ceux-ci correspondent aux nombres irrationnels . Ceux-ci peuvent être classés en deux sous-ensembles infiniment infinis : ceux qui contiennent Hamlet et ceux qui n'en contiennent pas. Cependant, le sous-ensemble "le plus grand" de tous les nombres réels sont ceux qui contiennent non seulement Hamlet , mais qui contiennent toutes les autres chaînes possibles de n'importe quelle longueur, et avec une distribution égale de ces chaînes. Ces nombres irrationnels sont appelés normaux . Comme presque tous les nombres sont normaux, presque toutes les chaînes possibles contiennent toutes les sous-chaînes finies possibles. Par conséquent, la probabilité que le singe tape un nombre normal est de 1. Les mêmes principes s'appliquent quel que soit le nombre de touches parmi lesquelles le singe peut choisir ; un clavier à 90 touches peut être vu comme un générateur de nombres écrits en base 90.

Histoire

Mécanique statistique

Sous l'une des formes sous lesquelles les probabilistes connaissent maintenant ce théorème, avec ses singes "dactylographiques" [c'est-à-dire dactylographiés] ( français : singes dactylographes ; le mot français singe recouvre à la fois les singes et les singes), est apparu dans le livre d'Émile Borel de 1913 article « mécanique et irréversibilité statistique » ( mécanique statistique et irréversibilité ), et dans son livre « Le Hasard » en 1914. ses « singes » ne sont pas des singes réels; ils sont plutôt une métaphore d'une manière imaginaire de produire une grande séquence aléatoire de lettres. Borel a dit que si un million de singes tapaient dix heures par jour, il était extrêmement improbable que leur production égale exactement tous les livres des bibliothèques les plus riches du monde ; et pourtant, en comparaison, il était encore plus improbable que les lois de la mécanique statistique soient jamais violées, même brièvement.

Le physicien Arthur Eddington s'est inspiré davantage de l'image de Borel dans The Nature of the Physical World (1928), en écrivant :

Si je laisse mes doigts vagabonder sur les touches d'une machine à écrire, il peut arriver que ma chape fasse une phrase intelligible. Si une armée de singes grattait sur des machines à écrire, ils pourraient écrire tous les livres du British Museum. La chance qu'ils le fassent est décidément plus favorable que la chance que les molécules retournent dans la moitié du vaisseau.

Ces images invitent le lecteur à considérer l'incroyable improbabilité d'un nombre important mais fini de singes travaillant pendant un laps de temps important mais fini produisant une œuvre significative, et à comparer cela avec l'improbabilité encore plus grande de certains événements physiques. Tout processus physique qui est encore moins probable que le succès de tels singes est effectivement impossible, et on peut dire sans risque qu'un tel processus ne se produira jamais. Il ressort clairement du contexte qu'Eddington ne suggère pas que la probabilité que cela se produise mérite un examen sérieux. Au contraire, c'était une illustration rhétorique du fait qu'en dessous de certains niveaux de probabilité, le terme improbable est fonctionnellement équivalent à impossible .

Origines et "The Total Library"

Dans un essai intitulé 1939 « La bibliothèque totale », l' écrivain argentin Jorge Luis Borges a tracé le concept singe infini retour à Aristote de Métaphysique. Expliquant les vues de Leucippe , qui soutenait que le monde est né de la combinaison aléatoire d'atomes, Aristote note que les atomes eux-mêmes sont homogènes et que leurs arrangements possibles ne diffèrent que par la forme, la position et l'ordre. Dans De la génération et de la corruption , le philosophe grec compare cela à la façon dont une tragédie et une comédie sont constituées des mêmes « atomes », c'est -à- dire de caractères alphabétiques. Trois siècles plus tard, le De natura deorum ( De la nature des dieux ) de Cicéron s'opposait à la vision du monde atomiste :

Celui qui croit cela peut aussi bien croire que si une grande quantité des vingt-et-une lettres, composées soit d'or, soit de toute autre matière, était jetée à terre, elles tomberaient dans un ordre tel qu'elles forment lisiblement les Annales de Ennius. Je doute que la fortune pût en faire un seul vers.

Borges suit l'histoire de cette dispute à travers Blaise Pascal et Jonathan Swift , puis observe qu'à son époque, le vocabulaire avait changé. En 1939, l'idiome était « qu'une demi-douzaine de singes munis de machines à écrire produiraient, en quelques éternités, tous les livres du British Museum ». (A quoi Borges ajoute : « A strictement parler, un singe immortel suffirait. ») Borges imagine alors le contenu de la Bibliothèque Totale que cette entreprise produirait si elle était poussée à son maximum :

Tout serait dans ses volumes aveugles. Tout : l'histoire détaillée du futur, les Égyptiens d' Eschyle , le nombre exact de fois que les eaux du Gange ont reflété le vol d'un faucon, la nature secrète et vraie de Rome, l'encyclopédie que Novalis aurait construite, mes rêves et les demi-rêves à l' aube le 14 Août 1934, la preuve de Pierre Fermat du théorème , les chapitres non écrites d' Edwin Drood , ces mêmes chapitres traduits dans la langue parlée par les Garamantes , les paradoxes Berkeley inventées concernant le temps mais n'a pas publier, les livres de fer d'Urizen, les épiphanies prématurées d' Etienne Dedalus , qui n'auraient aucun sens avant un cycle de mille ans, l' Évangile gnostique de Basilide , le chant des sirènes, le catalogue complet de la Bibliothèque, la preuve de l'inexactitude de ce catalogue. Tout : mais pour chaque ligne sensible ou fait précis, il y aurait des millions de cacophonies insignifiantes, de farragos verbaux et de babillages. Tout : mais toutes les générations de l'humanité pourraient passer avant que les étagères vertigineuses – étagères qui effacent le jour et sur lesquelles gît le chaos – ne les récompensent jamais d'une page tolérable.

Le concept de bibliothèque totale de Borges était le thème principal de sa nouvelle largement lue de 1941 " La bibliothèque de Babel ", qui décrit une bibliothèque incroyablement vaste composée de chambres hexagonales imbriquées, contenant ensemble tous les volumes possibles pouvant être composés à partir des lettres de l'alphabet. et quelques caractères de ponctuation.

Singes réels

En 2002, des professeurs et des étudiants du cours MediaLab Arts de l' Université de Plymouth ont utilisé une subvention de 2 000 £ du Conseil des arts pour étudier la production littéraire de vrais singes. Ils ont laissé un clavier d'ordinateur dans l'enclos de six macaques à crête des Célèbes au zoo de Paignton dans le Devon, en Angleterre, pendant un mois, avec une liaison radio pour diffuser les résultats sur un site Web.

Non seulement les singes n'ont rien produit, mais cinq pages au total composées en grande partie de la lettre "S", le mâle principal a commencé à frapper le clavier avec une pierre, et d'autres singes ont suivi en le saillant. Mike Phillips, directeur de l'Institut des arts numériques et de la technologie (i-DAT) de l'université, a déclaré que le projet financé par l'artiste était principalement de l'art de la performance et qu'ils en avaient appris "beaucoup". Il a conclu que les singes "ne sont pas des générateurs aléatoires. Ils sont plus complexes que cela... Ils étaient très intéressés par l'écran, et ils ont vu que lorsqu'ils tapaient une lettre, quelque chose se passait. Il y avait un niveau d'intention là-bas. "

Le texte intégral créé par les singes est disponible à lire "ici" (PDF) . Archivé de l'original (PDF) le 2009-03-18.

Applications et critiques

Évolution

Thomas Huxley est parfois accusé à tort de proposer une variante de la théorie dans ses débats avec Samuel Wilberforce .

Dans son livre de 1931 The Mysterious Universe , le rival d'Eddington, James Jeans, attribua la parabole du singe à un "Huxley", signifiant vraisemblablement Thomas Henry Huxley . Cette attribution est incorrecte. Aujourd'hui, il est parfois plus rapporté que Huxley appliqué l'exemple dans un débat désormais légendaire sur Charles Darwin « est sur l'origine des espèces avec l'évêque anglican d'Oxford, Samuel Wilberforce, tenu lors d' une réunion de l' Association britannique pour la promotion de la Science à Oxford le 30 juin 1860. Cette histoire souffre non seulement d'un manque de preuves, mais du fait qu'en 1860 la machine à écrire elle-même n'avait pas encore vu le jour.

Malgré la confusion initiale, les arguments du singe et de la machine à écrire sont maintenant courants dans les arguments sur l'évolution. À titre d'exemple d' apologétique chrétienne, Doug Powell a soutenu que même si un singe tape accidentellement les lettres de Hamlet , il n'a pas réussi à produire Hamlet parce qu'il n'avait pas l'intention de communiquer. Son implication parallèle est que les lois naturelles ne pourraient pas produire le contenu informationnel de l' ADN . Un argument plus courant est représenté par le révérend John F. MacArthur , qui a affirmé que les mutations génétiques nécessaires pour produire un ténia à partir d'une amibe sont aussi improbables qu'un singe tapant le soliloque d'Hamlet, et donc les chances contre l'évolution de toute vie sont impossibles à surmonter.

Le biologiste évolutionniste Richard Dawkins utilise le concept du singe de frappe dans son livre The Blind Watchmaker pour démontrer la capacité de la sélection naturelle à produire une complexité biologique à partir de mutations aléatoires . Dans une expérience de simulation, Dawkins a fait produire à son programme de belette la phrase Hamlet METHINKS C'EST COMME UNE BELETTE , en partant d'un parent typé au hasard, en « reproduisant » les générations suivantes et en choisissant toujours la correspondance la plus proche de la descendance qui sont des copies du parent, avec des mutations. La probabilité que la phrase cible apparaisse en une seule étape est extrêmement faible, mais Dawkins a montré qu'elle pouvait être produite rapidement (en environ 40 générations) en utilisant une sélection cumulative de phrases. Les choix aléatoires fournissent la matière première, tandis que la sélection cumulative donne des informations. Comme Dawkins le reconnaît, cependant, le programme de la belette est une analogie imparfaite pour l'évolution, car les phrases de « progéniture » ​​ont été sélectionnées « selon le critère de ressemblance avec une cible idéale éloignée ». En revanche, affirme Dawkins, l'évolution n'a pas de plans à long terme et ne progresse pas vers un objectif lointain (comme les humains). Le programme de la belette est plutôt destiné à illustrer la différence entre la sélection cumulative non aléatoire et la sélection aléatoire en une seule étape. En termes d'analogie avec le singe de frappe, cela signifie que Roméo et Juliette pourraient être produits relativement rapidement s'ils étaient placés sous les contraintes d'une sélection non aléatoire de type darwinien, car la fonction de fitness aura tendance à conserver en place toutes les lettres qui correspondent à la cible. texte, améliorant chaque génération successive de singes de frappe.

Une piste différente pour explorer l'analogie entre l'évolution et un singe sans contrainte réside dans le problème que le singe ne tape qu'une lettre à la fois, indépendamment des autres lettres. Hugh Petrie soutient qu'une configuration plus sophistiquée est nécessaire, dans son cas non pas pour l'évolution biologique mais l'évolution des idées :

Afin d'obtenir l'analogie appropriée, nous devrions équiper le singe d'une machine à écrire plus complexe. Cela devrait inclure des phrases et des pensées élisabéthaines entières. Cela devrait inclure les croyances élisabéthaines sur les modèles d'action humaine et les causes, la morale et la science élisabéthaine, et les modèles linguistiques pour les exprimer. Il devrait même probablement inclure un compte rendu des types d'expériences qui ont façonné la structure de croyance de Shakespeare en tant qu'exemple particulier d'un élisabéthain. Alors, peut-être, nous pourrions laisser le singe jouer avec une telle machine à écrire et produire des variantes, mais l'impossibilité d'obtenir une pièce shakespearienne n'est plus évidente. Ce qui est varié englobe vraiment beaucoup de connaissances déjà acquises.

James W. Valentine , tout en admettant que la tâche du singe classique est impossible, trouve qu'il existe une analogie intéressante entre l'anglais écrit et le génome métazoaire dans cet autre sens : tous deux ont des "structures combinatoires et hiérarchiques" qui limitent grandement l'immense nombre de combinaisons. au niveau de l'alphabet.

Théorie littéraire

RG Collingwood a fait valoir en 1938 que l'art ne peut pas être produit par accident, et a écrit comme un aparté sarcastique à ses critiques,

... certains ... ont nié cette proposition, soulignant que si un singe jouait avec une machine à écrire ... il produirait ... le texte complet de Shakespeare. Tout lecteur qui n'a rien à faire peut s'amuser à calculer combien de temps il faudrait pour que la probabilité vaille la peine de parier. Mais l'intérêt de la suggestion réside dans la révélation de l'état mental d'une personne qui peut identifier les "œuvres" de Shakespeare avec la série de lettres imprimées sur les pages d'un livre...

Nelson Goodman a pris la position contraire, illustrant son propos avec Catherine Elgin par l'exemple de « Pierre Ménard, auteur du Quichotte » de Borges ,

Ce que Ménard a écrit n'est qu'une autre inscription du texte. N'importe lequel d'entre nous peut faire de même, tout comme les presses à imprimer et les photocopieurs. En effet, nous dit-on, si une infinité de singes... on finirait par produire une réplique du texte. Cette réplique, soutenons-nous, serait autant un exemple de l'œuvre Don Quichotte que le manuscrit de Cervantès, le manuscrit de Ménard et chaque exemplaire du livre qui a jamais été ou sera imprimé.

Dans un autre écrit, Goodman précise : " Que le singe puisse être supposé avoir produit sa copie au hasard ne fait aucune différence. C'est le même texte, et il est ouvert à toutes les mêmes interprétations. ... " Gérard Genette rejette l'argument de Goodman comme suppliant la question .

Pour Jorge JE Gracia , la question de l'identité des textes conduit à une autre question, celle de l'auteur. Si un singe est capable de taper Hamlet , bien qu'il n'ait aucune intention de sens et donc se disqualifie en tant qu'auteur, alors il apparaît que les textes n'exigent pas d'auteurs. Les solutions possibles incluent de dire que celui qui trouve le texte et l'identifie comme Hamlet est l'auteur ; ou que Shakespeare est l'auteur, le singe son agent, et le découvreur simplement un utilisateur du texte. Ces solutions ont leurs propres difficultés, dans la mesure où le texte semble avoir une signification distincte des autres agents : et si le singe opérait avant la naissance de Shakespeare, ou si Shakespeare n'est jamais né, ou si personne ne trouve jamais le texte dactylographié du singe ?

Génération aléatoire de documents

Le théorème concerne une expérience de pensée qui ne peut pas être entièrement réalisée dans la pratique, car il est prévu qu'elle nécessite des quantités de temps et de ressources prohibitives. Néanmoins, il a inspiré des efforts dans la génération de texte aléatoire fini.

Un programme informatique dirigé par Dan Oliver de Scottsdale, Arizona, selon un article du New Yorker , est arrivé à un résultat le 4 août 2004 : après que le groupe eut travaillé pendant 42 162 500 000 milliards de milliards d'années-singes, l'un des tapé, "VALENTIN. Cesser d'Idor:eFLP0FRjWK78aXzVOwm)-';8.t» Les 19 premières lettres de cette séquence se trouvent dans « Les deux gentilshommes de Vérone ». D'autres équipes ont reproduit 18 caractères de « Timon d'Athènes », 17 de « Troilus et Cressida », et 16 de « Richard II ».

Un site Web intitulé The Monkey Shakespeare Simulator , lancé le 1er juillet 2003, contenait une applet Java qui simulait une grande population de singes tapant au hasard, avec l'intention déclarée de voir combien de temps il faut aux singes virtuels pour produire une pièce shakespearienne complète du début à finir. Par exemple, il a produit cette ligne partielle d' Henri IV, partie 2 , rapportant qu'il a fallu « 2 737 850 millions de milliards de milliards de milliards d'années-singes » pour atteindre 24 caractères correspondants :

RUMEUR. Ouvrez vos oreilles; 9r"5j5&?OWTY Z0d

En raison des limitations de puissance de traitement, le programme a utilisé un modèle probabiliste (en utilisant un générateur de nombres aléatoires ou RNG) au lieu de générer réellement du texte aléatoire et de le comparer à Shakespeare. Lorsque le simulateur "détectait une correspondance" (c'est-à-dire que le RNG générait une certaine valeur ou une valeur dans une certaine plage), le simulateur simulait la correspondance en générant du texte correspondant.

Des méthodes plus sophistiquées sont utilisées dans la pratique pour la génération du langage naturel . Si au lieu de simplement générer des caractères aléatoires, on restreint le générateur à un vocabulaire significatif et à des règles de grammaire en suivant de manière conservatrice, comme l'utilisation d'une grammaire sans contexte , alors un document aléatoire généré de cette manière peut même tromper certains humains (au moins sur une lecture rapide) comme montré dans les expériences avec SCIgen , snarXiv , et le générateur de postmodernisme .

En février 2019, le groupe OpenAI a publié l' intelligence artificielle Generative Pre-trained Transformer 2 (GPT-2) sur GitHub , qui est capable de produire un article de presse entièrement plausible à partir d'une entrée de deux phrases d'une main humaine. L'IA était si efficace qu'au lieu de publier le code complet, le groupe a choisi de publier une version réduite et a publié une déclaration concernant "les préoccupations concernant les grands modèles linguistiques utilisés pour générer un langage trompeur, biaisé ou abusif à grande échelle".

Test de générateurs de nombres aléatoires

Les questions sur les statistiques décrivant la fréquence à laquelle un singe idéal est censé taper certaines chaînes se traduisent par des tests pratiques pour les générateurs de nombres aléatoires ; ceux-ci vont du simple au "assez sophistiqué". Professeurs Computer-sciences George Marsaglia et Arif Zaman rapport qu'ils ont utilisé pour appeler une de ces catégories de tests « chevauchement m- uplet tests » dans les cours, car ils concernent chevauchement m-uplets d'éléments successifs dans un ordre aléatoire. Mais ils ont découvert que les appeler "tests de singe" aidait à motiver l'idée auprès des étudiants. Ils ont publié un rapport sur la classe de tests et leurs résultats pour divers GNA en 1993.

Dans la culture populaire

Le théorème du singe infini et son imagerie associée sont considérés comme une illustration populaire et proverbiale des mathématiques des probabilités, largement connues du grand public en raison de sa transmission par la culture populaire plutôt que par l'éducation formelle. Ceci est aidé par l'humour inné provenant de l'image de singes littéraux qui s'envolent sur un ensemble de machines à écrire, et c'est un bâillon visuel populaire.

Une citation attribuée à un discours de 1996 de Robert Wilensky déclarait : « Nous avons entendu dire qu'un million de singes à un million de claviers pourraient produire les œuvres complètes de Shakespeare ; maintenant, grâce à Internet, nous savons que ce n'est pas vrai. »

La popularité durable et généralisée du théorème a été notée dans l'introduction d'un article de 2001, " Monkeys, Typewriters and Networks: The Internet in the Light of the Theory of Accidental Excellence ". En 2002, un article du Washington Post disait : « Beaucoup de gens se sont amusés avec la fameuse notion qu'un nombre infini de singes avec un nombre infini de machines à écrire et un temps infini pourraient éventuellement écrire les œuvres de Shakespeare ». En 2003, l' expérience financée par le Conseil des arts, mentionnée précédemment, impliquant de vrais singes et un clavier d'ordinateur a reçu une large couverture médiatique. En 2007, le théorème a été répertorié par le magazine Wired dans une liste de huit expériences de pensée classiques .

La courte pièce en un acte du dramaturge américain David Ives Words, Words, Words , de la collection All in the Timing , se moque du concept du théorème du singe infini.

Voir également

Remarques

Les références

Liens externes