Exercice corrigé : Autour du paradoxe des deux enveloppes

Qu’est-ce que le paradoxe des enveloppes ? Découvrez-le dans cet article à travers des variantes autour de ce paradoxe !

Ces petits problèmes sont des variations libres sur le paradoxe des enveloppes (Paradoxe des deux enveloppes), bien qu’ici il n’y aura paradoxe étant donné que la distribution des contenus des enveloppes est parfaitement connue.

Ils cachent toutefois quelques aspects amusants !

Une version peu calculatoire et relativement intuitive

Commençons par une version peu calculatoire et relativement intuitive

Enoncé

On tire un nombre u selon une loi uniforme dans [0,1], et on place sa valeur dans l’enveloppe n°1. Dans l’enveloppe n°2, on place la valeur de \min(2u,1).

On se voit alors proposer le jeu suivant : on tire au hasard une des enveloppes, et on découvre un nombre x à l’intérieur. On a alors le choix entre :

  • encaisser la valeur de x
  • encaisser le montant y de l’autre enveloppe, à la place de x
  1. Quelle est, selon x, la stratégie de changement ou conservation d’enveloppe qui maximise l’espérance de gain ?
  2. Quel est le juste prix pour participer à ce jeu ?

Corrigé

Avant de rentrer dans d’éventuels -petits- calculs, quelques considérations immédiates :

  • Dans l’enveloppe 1, la distribution du montant est uniforme, mais évidemment pas dans l’enveloppe 2 ; on y a 50% de chance de découvrir « 1 », et pour le reste, 50% de chance d’y trouver un nombre tiré uniformément entre 0 et 1.
  • Par conséquent, suivant la valeur x qu’on découvre, les probabilités qu’on ait choisi l’enveloppe n°1 ou l’enveloppe n°2 ne sont pas égales. C’est évident pour x=1 en particulier, qui se produit dans 50% des cas dans l’enveloppe n°2, mais « jamais » dans l’enveloppe 1, de sorte que la probabilité conditionnelle d’avoir tiré l’enveloppe n°2 sachant x=1 est égale à 1
  • On en déduit que dans l’enveloppe n°1 la probabilité de trouver un nombre dans ]0,1[ est de 1 ; dans l’enveloppe n°2 elle est de \dfrac{1}{2}. Intuitivement, en séparant les cas, la probabilité conditionnelle d’avoir tiré l’enveloppe n°1 sachant qu’on découvre un montant x<1 est donc de \dfrac{2}{3}
    (Nous ferons un calcul davantage rigoureux de ces probabilités conditionnelles dans la partie suivante..)
  • La stratégie optimale dépend forcément de x ; par exemple si x=1, on n’a évidemment aucun intérêt à changer d’enveloppe. De même, intuitivement, pour les valeurs de x les plus grandes, mêmes inférieures à 1, il y a trop à perdre et pas assez gagner en changeant d’enveloppe
  • Une fois établie la stratégie optimale, le juste prix pour participer au jeu ne peut être autre chose que l’espérance du gain obtenu en appliquant cette stratégie optimale

Question 1

Notons U la variable aléatoire uniforme décrivant le montant inscrit dans l’enveloppe n°1, et V=\min⁡(2U,1) celle de l’enveloppe n°2.

Z est la variable aléatoire décrivant le montant qu’on découvre dans l’enveloppe choisie au hasard. Il y a 1 chance sur 2 que Z soit égale à U, et 1 chance sur 2 que Z soit égale à V. Sa fonction de répartition est directement donnée par \mathbb{P}[Z\leq z] = \dfrac{1}{2} \mathbb{P}[U\leq z]+\dfrac{1}{2} \mathbb{P}[V≤z]

Vu ce qui précède, l’espérance de gain du changement est donnée par :

\begin{array}{ll}
&\mathbb{E}[\text{changer}|Z = x] \\
= & \left\{ \begin{array}{lll}
\dfrac{2}{3} (2x-x) + \dfrac{1}{3}\left( \dfrac{x}{2}-x\right)&= \dfrac{x}{2} &\text{ si } x \in \left[ 0 , \dfrac{1}{2} \right] \\
\dfrac{2}{3} (1-x) + \dfrac{1}{3}\left( \dfrac{x}{2}-x\right)&= \dfrac{2}{3}-\dfrac{5}{6}x &\text{ si } x \in \left[  \dfrac{1}{2},1 \right]
\end{array}\right.
\end{array}

Enfin, pour x=1, en échangeant on va récupérer un montant aléatoire uniforme sur \left[\dfrac{1}{2},1\right], donc \mathbb{E}[\text{changer}│Z=1]= - \dfrac{1}{4}

Fonction question 1 enveloppes

Cette fonction s’annule en x^*=0.8.

La stratégie est donc de changer d’enveloppe pour x<0.8, et ne pas changer pour x>0.8

Question 2

Si G^* est la fonction de gain – toujours positif ou nul- de la stratégie optimale de changement d’enveloppe, alors le prix du jeu \Pi est donné par :

\Pi = \mathbb{E} (Z+G^*(Z))

Soit \displaystyle \Pi = \dfrac{3}{4} \int_0^{0.5} \dfrac{3}{2}z dz + \dfrac{3}{4}\int_{0.5}^{0.8} \left( \dfrac{2}{3}+\dfrac{1}{6}z \right) dz + \dfrac{3}{4} \int_{0.8}^1 zdz + \dfrac{1}{4}

Et donc \Pi = 0.7

Afin de vérifier la stratégie optimale, on peut par exemple approcher l’espérance de changement selon x par Monte-Carlo en simulant exactement ce jeu un grand nombre de fois (ici 10^6), puis en agrégeant les résultats suivant les valeurs de x .

Cette simulation suit les résultats ci-dessus :

Monte-Carlo question 2 paradoxe des enveloppes

Une version plus jolie mais plus complexe

Maintenant, une version plus jolie mais un peu plus complexe

Enoncé

On tire un nombre u selon une loi uniforme dans [0,1], et on place sa valeur dans l’enveloppe n°1. Dans l’enveloppe n°2, on place la valeur de u^2.

Même jeu ; que devient la stratégie optimale ?

Corrigé

Cette fois ci, les montants des 2 enveloppes sont des variables aléatoires continues ; et le profit (éventuellement négatif) correspondant au changement d’enveloppe est soit de x^2-x, soit de \sqrt{x}-x

La principale difficulté est ici de calculer la probabilité conditionnelle d’avoir tiré l’une ou l’autre des variables aléatoires sachant qu’on découvre le montant x, donc de trouver \mathbb{P}[Z=U |Z=x] et \mathbb{P}[Z=U^2 |Z=x]

Supposons d’abord pour simplifier qu’on ait deux variables aléatoires discrètes A et B, et que Z soit le tirage au hasard entre les 2, et calculons \mathbb{P}[Z=A |Z=n] et \mathbb{P}[Z=B |Z=n].

D’après la formule de Bayes :

\mathbb{P}[Z=A|Z=n].\mathbb{P}[Z=n]=\mathbb{P}[Z=n|Z=A].\mathbb{P}[Z=A]

Or, on a : \mathbb{P}[Z=n]=\dfrac{1}{2} \mathbb{P}[A=n]+\dfrac{1}{2} \mathbb[B=n], ainsi que : \mathbb{P}[Z=n|Z=A]=\mathbb{P}[A=n] ; et par construction \mathbb{P}[Z=A] = \dfrac{1}{2} ; donc :

\mathbb{P}[Z=A|Z=n]=\dfrac{\mathbb{P}[A=n]}{\mathbb{P}[A=n]+\mathbb{P}[B=n]}

Cette petite formule est intuitive : on retrouve le prorata des cas \mathbb{P}[A=n] et des cas \mathbb{P}[B=n].

Comment adapter ceci au cas discret pour des variables à densité ? En adaptant la formule ci-dessus autour d’un petit intervalle autour de x, on a :

\mathbb{P}[Z=A|Z\in[x-\varepsilon,x+\varepsilon]]=\dfrac{P[A\in[x-\varepsilon,x+\varepsilon]]}{\mathbb{P}[A\in[x-\varepsilon,x+\varepsilon]]+\mathbb{P}[B\in[x-\varepsilon,x+\varepsilon]]}

Et ainsi :

\mathbb{P}[Z=A|Z=x]=\dfrac{f_A (x)}{f_A (x)+f_B (x)}

f_A et f_B sont les densités respectives de A et B, ce qui est une transcription assez logique.

Nous pouvons maintenir finir notre problème. On a f_U (x)=1 comme \mathbb{P}[U^2<x]= \sqrt{x}, on a : f_{U^2} (x)=\dfrac{1}{2\sqrt{x}}.

On en déduit : \mathbb{P}[Z=U|Z=x]= \dfrac{2\sqrt{x}}{1+2 \sqrt{x}} et \mathbb{P}[Z=U^2|Z=x]=\dfrac{1}{1+2\sqrt{x}}

On peut à nouveau vérifier ceci par Monte-Carlo :

Monte-Carlo exercice 2 courbe croissante

L’espérance du profit du changement s’écrit donc :

\mathbb{E}[changer|Z=x]=\dfrac{2\sqrt{x}.(x^2-x)+(\sqrt{x}-x)}{1+2\sqrt{x}}

En observant que x=0 et x=1 annulent forcément le numérateur (changer d’enveloppe ne change rien dans ces cas), on peut factoriser :

\mathbb{E}(x)=\mathbb{E}[changer|Z=x]=\dfrac{\sqrt{x}.(\sqrt{x}-1)(2(\sqrt{x})^3+2x-1)}{1+2\sqrt{x}}
2y^3+2y^2-1 s’annule en y^*=0.5652.. donc \mathbb{E}(x) s’annule en x^*=y^{*2}=0.3195.. (solve 2y^3+2y^2−1=0 − Wolfram|Alpha (wolframalpha.com))

Donc : il faut donc changer d’enveloppe pour x=0.3195, et ne pas changer pour x>x^*

Le sens s’interprète bien : pour les petites valeurs de x, il y a beaucoup plus de chance d’avoir tiré U^2 plutôt que U car la densité de U^2 y est comparativement très forte ; dans ce cas il est rentable de changer puisque \sqrt{x}>x.

Simulation par Monte Carlo du gain de changement par rapport à \mathbb{E}(x)=\dfrac{\sqrt{x}.(\sqrt{x}-1)(2\sqrt{x}^3+2x-1)}{1+2\sqrt{x}} :

Généralisation

Enoncé

Enfin, la version générale, en fonction de l’exposant n

On tire un nombre u selon une loi uniforme dans [0,1], et on place sa valeur dans l’enveloppe n°1. Dans l’enveloppe n°2, on place la valeur de u^n.

Corrigé

Dans ce cas :

\mathbb{E}_n [changer|Z=x]=\dfrac{n.x^{1-\frac{1}{n}}.(x^n-x)+(x^{\frac{1}{n}}-x)}{1+n.x^{1-\frac{1}{n}} }

Plus n est grand plus il faut s’arrêter vite de changer d’enveloppe, à cause du terme en (x^n-x).

Il faut bien garder à l’esprit qu’on essaie ici de maximiser l’espérance ! Un critère du type « je retourne si j’ai plus d’1 chance sur 2 d’obtenir un nombre plus grand » donnerait par exemple une autre stratégie, mais sous-optimale en espérance de gain.

Fonction selon n question 3 paradoxe des enveloppes
Total
0
Partages

Laisser un commentaire

Articles similaires