Paradoxe des deux enveloppes

Nous disposons de deux enveloppes qui contiennent chacune une somme d’argent. L’une porte un montant, et l’autre son double.  

Il faut choisir une enveloppe, puis ensuite confirmer si c’est bien celle que nous voulons prendre (il n'y a pas le droit de regarder le contenu de l'enveloppe avant de confirmer le choix). Si oui, on gagne l’argent contenu dans l’enveloppe, sinon on gagne l’argent contenu dans l’autre enveloppe. 

L’espérance de gain est identique pour les deux strategies

Le paradoxe indique qu'une enveloppe contient la somme  x et l'autre la somme  2x dont on ne connaît la valeur d'aucune des 2 enveloppes. Donc on a :

-Une chance sur 2 de choisir l'enveloppe contenant  x . Dans ce cas-là, si on la garde on gagne la somme  x et sinon on gagne la somme  2x .

-Une chance sur 2 de choisir l'enveloppe contenant  2x . Dans ce cas-là, si on la garde on gagne la somme  2x et sinon on gagne la somme  x .

Donc cela signifie que, si on garde l'enveloppe, l'espérance de gain vaut  0,5 \times x + 0,5 \times 2x = 1,5x  et si on change d'enveloppe, l'espérance de gain vaut  0,5 \times 2x + 0,5 \times x = 1,5x . On voit donc que l'espérance de gain reste la même que l'on change ou non d'enveloppe, et que donc on ne gagne rien à changer.

Le problème de ce raisonnement est qu'il n'y a que 2 issues possibles. Le raisonnement choisit une variable aléatoire qui représentera le contenu d'une enveloppe et dans lequel on a 3 issues possibles représentées par n, \frac{n}{2} et 2n qui sont différentes pourvu que n soit supérieur à 0. Donc ce raisonnement ne peut pas être acceptable.

Explication du paradoxe et en quoi il est incorrect

Ce paradoxe est le suivant : Quelle que soit la somme x découverte dans l’enveloppe choisie, la somme x' contenue dans l’autre a une chance sur deux d’être 2x, ou bien une chance sur deux d’être \frac {x}{2}. Son espérance est donc \frac {5x}{4}>x, et ainsi, il vaut mieux donc toujours changer d’enveloppe.  

D’après ce raisonnement, x étant une variable aléatoire égale à t avec comme probabilité \frac{1}{2} et 2t avec comme probabilité \frac{1}{2}.

x' la variable complémentaire, l’espérance de la variable aléatoire \frac{x'}{x} est égale à \frac{5}{4}, de même pour l'espérance de la variable aléatoire \frac{x}{x'}.

Cela ne veut pas pour autant dire qu’il vaut mieux changer d’enveloppe vu que les espérances de x et x' sont égales (\frac{3t}{2} pour les deux).  L’espérance de x' n’est pas égale à \frac{5}{4} fois celle de x.

Ainsi, on voit bien que changer d'enveloppe après en avoir déjà choisi une n'augmentera pas notre espérance de gain.

Pourquoi ouvrir l'enveloppe ne change rien

John Broome, un philosophe anglais, a exposé le raisonnement suivant : on a deux enveloppes indiscernables, l’une contient un montant de  2^n et l’autre un montant de 2^n+1 avec une probabilité  \frac{2^n}{3^n+1} pour n \geq 0

Broome remarque que lorsque l'enveloppe choisie contient  M_c = 1 on a intérêt à choisir de changer d'enveloppe puisque l'autre contient  M_c = 2^n avec n > 0 il y a un gain de  \frac{1}{10} \times M_c espéré dans l'échange.

Il en conclut que dans tous les cas, on a intérêt à changer d'enveloppe même si on l'ouvre pas. Ce qui est paradoxal puisqu'on a déjà montré que si on n'ouvre pas les enveloppes, il n'y a aucun gain à espérer dans l'échange. Déduire un avantage lorsqu'on n'ouvre pas l'enveloppe de l'avantage espéré en prenant connaissance du contenu de l'enveloppe semble donc abusif, l'explication vient de ce qu'avec cette distribution, l'espérance (que l'on change ou non d'enveloppe) est infinie.

Choisir d'ouvrir l'enveloppe ou de ne pas l'ouvrir ne change donc rien, l'espérance reste la même.

Un autre exemple : le problème de Monty Hall

Énoncé du problème

Le problème de Monty Hall est le suivant : on considère un joueur placé devant trois portes fermées. Derrière l'une d'elles se trouve une voiture et derrière chacune des 2 autres se cache une chèvre. Le joueur doit alors désigner une porte à ouvrir. Puis le présentateur doit ouvrir une porte qui n'est ni celle choisie par le joueur ni celle contenant la voiture. À la fin on propose donc au joueur soit de garder la porte initialement choisie soit d'ouvrir la 3ème porte qui n'a pas encore été révélée.

On a donc 3 évènements:

  • cas 1 : le joueur choisit la porte avec la chèvre 1.
  • cas 2 : le joueur choisit la porte avec la chèvre 2.
  • cas 3 : le joueur choisit la porte avec la voiture.

Ces 3 évènements sont équiprobables et ont pour probabilité :

 P(C1) = P(C2) = P(C3) = \frac{1}{3}

Dans la suite du problème on a donc 3 nouveaux évènements :

  • cas 1: le joueur choisit la porte avec la chèvre 1 et alors le présentateur ouvre la porte avec la chèvre 2. La porte restante cache donc la voiture.
  • cas 2: le joueur choisit la porte avec la chèvre 2 et alors le présentateur ouvre la porte avec la chèvre 1. La porte restante cache donc la voiture.
  • cas 3: le joueur choisit la porte avec la voiture et donc le présentateur a le choix d'ouvrir soit la porte avec la chèvre 1 soit la porte avec la chèvre 2. La porte restante cache une chèvre.

On voit donc que, dans 2 cas sur 3, la porte restante cache une voiture.

On ajoute aux 3 évènements précédents les 3 nouveaux et on a :

  • C : le joueur a choisit une des 2 portes derrières lesquelles se cachent les chèvres.
  • GVC : le joueur gagne la voiture en changeant de porte.
  • GVS: le joueur gagne la voiture sans changer de porte.

Traduisons cela sous forme de probabilités :

Le joueur change de porte

  • On a vu que si le joueur a choisi une porte contenant une chèvre, alors changer de porte le mènera forcément vers la voiture et donc :  P(GVC|C)=1
  • On a aussi vu que si le joueur a choisi une porte contenant la voiture, changer de porte conduirait forcément à ouvrir une porte à chèvre et donc :  P(GVC|S) = 0

Donc la probabilité de gagner en changeant de porte est donc :  P(GVC) = P(GVC|C) \times P(C) + P(GVC|V) \times P(V) = 1 \times \frac{2}{3} + 0 \times \frac{1}{3} = \frac{2}{3}

Le joueur ne change pas de porte

  • Si le joueur ne gagne que s'il avait choisit la voiture dès le début on a : P(GVS|C) = 0, P(GVS|V) = 1

La probabilité de gagner sans changer de porte est donc: P(GVS) = P(GVS|C) \times P(C) + P(GVS|V) \times P(V) = 0 \times \frac{2}{3} + 1 \times  \frac{1}{3} =  \frac{1}{3}

Conclusion

Pour conclure, nous pouvons dire que le paradoxe évoqué lors de ce billet est absurde. Tout est une question de hasard comme dans le problème de Monty Hall.

Bibliographie

0 Cliquer pour recommander cet article