<style> .reveal .slides { text-align: left; font-size:28px; } </style> # The Box Problem: To Switch or Not to Switch Author: Steven J. Brams, D. Marc Kilgour --- ## 問題: - 假設你面前有兩個盒子,一個裡面有 $b,另一個有 $2b。 - 隨機選擇一個,然後決定保留或換另一個。 - 如何做出最理性的選擇? ---- ## 選擇與期望值 - 如果選到的盒子裡有 $100,則換盒子的期望值為 $125。 - 但不論選到的盒子裡有多少錢,換盒子的期望值都會是 $1.25x。 - 似乎換盒子總是更好的選擇,這合理嗎? ---- ## 期望值事實上... 實際上,當使用期望值此論點時,大家常常會忽略明顯的缺點是沒有利用到獲得第一項箱子時的資訊。 簡單來說,就是需要先對每個盒子中可能找到的金額有一個先驗機率。特別是,知道先驗機率分佈將使你能夠計算出第一個盒子中所找到的金額是否小於另一個盒子中的預期值,從而判斷交換是否有利可圖。 ---- ## 什麼是先驗機率(Prior Probability) 先驗機率是指在進行任何觀察或實驗之前,基於已知的背景資訊和先前的經驗,對事件發生機率的主觀估計。它是根據先前的知識和假設,而不考慮新的觀察或證據的機率。 note: 穩 ---- ## 所以我們要幹嘛 這個論文將證明在觀察到第一個盒子的內容後,第一個盒子中含有較大金額的機率小於 $\frac{2}{3}$ 時,交換才是合理的。而同時,存在離散和連續分佈的情況,也就是在圖中連續的線段中會有且只有一個斷點,而這個不等式將符合這個圖形且永遠不會失效:無論你在第一個盒子中找到多少錢,你都應該進行交換。此外,始終可以找到第一個盒子中足夠少的金額,使交換成為理性的選擇。 --- ## 交換的條件 假設每個盒子內的金錢都是正的,$L$ 代表的是較多錢的盒子,$S$ 代表的是較少錢的盒子,首先可以觀察到一個先驗機率 $$Pr(L \le x) = Pr(S \le \frac{x}{2}), 0 < x < \infty$$ ---- 你開始隨機選擇其中一個盒子,假設為 $B1$,並用隨機變數 $X$ 表示其內容。另一個盒子為 $B2$,用 $Y$ 表示其內容,會注意到 $$Pr(X=L) = Pr(X=S)= \frac{1}{2}$$ 你現在觀察到了 $B1$ 的內容 $(X)$,只有當 $B2$ 的期望值大於 $B1$ 時,你才會進行交換。 ---- 現在來算一下 $B2$ 的期望值 $$\begin{equation} \begin{aligned}E[Y|X=x] &=\frac{1}{2}x \cdot Pr(X=L|X=x)+2x \cdot Pr(X=S|X=x) > x \\ &=\frac{1}{2} \cdot Pr(X=L|X=x)+2 \cdot Pr(X=S|X=x) > 1 (1)\\ \end{aligned} \end{equation}$$ 可以觀察到如果 $X \neq L$,所以 $Pr(X=L|X=x) = 1 - Pr(X=S|X=x) (2)$ ---- 因此 我們可以把(2)代入(1)得到 $$\frac{1}{2} \cdot Pr(X=L|X=x)+2 \cdot( 1 - Pr(X=L|X=x)) > 1 $$$$or$$ $$\frac{3}{2} \cdot Pr(X=L|X=x) < 1$$ 於是 $$Pr(X=L|X=x) < \frac{2}{3}$$ 也就是說,只有在 B1 裡面有較多的錢的機率小於 $\frac{2}{3}$時,交換才是合理的。 --- ## 離散分布 首先,我們假設 $X$ 、$L$ 和 $S$ 為離散隨機變數,以及存在一個固定的 $m > 0$,使得任何一個盒子中的金額都等於 $2^km$ ,其中 $k$ 是一個整數(當然也可以是非正數)。$2^k$ 反映了選擇的盒子中較小和較大的金額分別是所選金額的一半和兩倍。 定義 $Pr(X = 2^km | X = L) = Pk$ ,其中 $k = ...-1, 0, 1...$。我們要求 ${ p_{-1}, p_0, p_1, ... }$ 構成一個機率分佈,因此假設 $p_k \leq 0$ 且$\ p_k = 1$。注意到 $Pr(X = 2^km | X = S) = Pr(X = 2^{k+1}m | X = L) = p_{k+1}$。 ---- ## 貝氏定理 這個東西 ![](https://hackmd.io/_uploads/HkWUWD7Un.png =512x) ---- 現在假設你觀察到 $X = 2^km$。因為 $X$ 已經觀察到,所以可以知道 $Pr(X = 2^km | X = L) + Pr(X = 2^km | X = S) = p_k + p_{k+1} > 0 (4)$ 然後根據貝氏定理 $$\begin{equation} \begin{aligned} &Pr(X = L|X = 2^km) \\ &=\frac{Pr(X = 2^km | X = L)}{Pr(L = 2^km | X = L)Pr(X = L) + Pr(S = 2^km | X = S)Pr(X = S)} \\ &= \frac{p_k}{p_k + p_{k+1}} (5) \end{aligned} \end{equation}$$ 根據前面推論出來的交換條件 (也就是當 $Pr(X=L | X=x) < \frac{2}{3}$) 時,我們可以得到 $\frac {p_k}{p_k + p_{k+1}} < \frac{2}{3}$,或者是說 $p_k < 2 \cdot p_{k+1} (6)$,我們將其稱為離散分佈的交換條件。這意味著不管你觀察到什麼,只有在選擇 $L$ 盒子的機率 $(p_k)$ 小於選擇 $S$ 盒子的機率的兩倍 $(p_{k+1})$ 時,你才應該進行交換。換句話說,如果你選擇 $L$ 盒子的機率(相對於 $S$ 盒子)足夠大,就保留這個盒子。 <!-- ---- ## 舉例 --> ---- ## 證明 定理一:對於任何機率分布 {$...,p_{-1}, p_0, p_1, ...$} ,交換條件至少對一個 k 成立 我們使用反證法來證明這個,首先假設所有的 k 都不會成立交換條件,因此 $p_{k-1} \ge 2p_k$,這樣會導致某一個 k 會讓 $p_k$ 趨近於 $\infty$,也就不符合機率變數的形式,因此在離散分佈下,至少會有一個點 k 會滿足交換條件 --- ## 連續分佈 接下來,要考慮的是假設$X$ 、$L$ 和 $S$ 為連續隨機變數,由於交換條件以及固有條件 $(Pr(S \le x) = Pr(L \le 2x))$ $S$ 和 $L$ 的累積分佈函數存在關係 : $F_S(x) = F_L(2x)$ (7) 而對這條進行微分,就會獲得一條機率密度函數 : $F_S(x) = 2 \cdot F_L(2x)$ 現在假設你選擇 $B_1$ 並發現 $X$ 滿足 $x \leq X \leq x + dx$ 在此觀察條件下,$Bi$ 是 $L$ 箱子的條件概率類似於離散情況中 $(5)$ 給出的機率,也與結論相符合 : $$\begin{equation} \begin{aligned} Pr(X = L | x ≤ X ≤ x + dx) &= \frac{F_L(x)dx}{F_L(x)dx + F_s(x)dx} \\&= \frac{F_L(x)}{F_L(x) + 2f_L(2x)} < \frac{2}{3} \end{aligned} \end{equation} $$ 這等同於連續分佈的交換條件 : $F_L(x) < 4 \cdot F_L(2x)\ \ (8)$ note: ---- 那我們根據這條 : $F_L(x) < 4 \cdot F_L(2x)$ 可以發現,只有當 $L$ 在 $x$ 處的密度小於 $L$ 在 $2x$ 處的密度的四倍時,交換才是有價值的。換句話說,$F_L(2x)$ 的值必須大於其在 $x$ 處值的四分之一。 那就會發現,在 $x$ 增加時,$F_L$ 不能下降的太快,而論文中給出了三個滿足 $Exchange\ Condition (8)$的連續分布,分別為 均勻分布,指數分布,以及一般情況 ---- ## 均勻分布 令 $F_L(x) = 1$,對於 $0 \leq x \leq 1$。當且僅當 $x < 1/2$ 時,滿足Exchange Condition (8)。這發生的概率為$\frac{3}{4}$,因為(8)失敗的條件是 $X > 1/2$ 而 $X > 1/2$ 的條件是獨立事件 $X = L$ 和 $L > 1/2$ 同時發生,而這兩件事情的分別獨立事件機率各為 $\frac{1}{2}$,因此他有 $\frac{3}{4}$的機會在這裡 ---- ## 指數分布 令 $F_L(x) = e^{-x}$,對於 $0 < x < \infty$ 。滿足Exchange Condition (8)當且僅當 $e^(-x) < 4e^(-2x)$,這等價於x < ln4 (逼近1.39)。而這可以輕易驗證 $Pr(L < ln4) = 3/4,Pr(S < ln4) = 15/16$ Pr(X < ln4) = (1/2)(3/4) + (1/2)(15/16) = 27/32 (逼近於 0.844) 由於這可以輕易驗證,因此落在這的機率逼近於0.844 ---- ## 一般而論 //以下為看得懂數學式但是不太懂為啥會這樣的地方 Exchange Condition (8) 始終滿足。固定 $k$,使得 $0 < k < 1$,讓 $F_L(x) = (1 - k)x^{(-2+k)}$,當 $x \leq 1$ 時,並且 $F_L(x) = 0$,當 $0 < x < 1$ 時。這個函數是一個機率密度, 因為 $\int ^{\infty}_1 x^(2+k) dx = \lim_{(K → \infty)} [\frac{(K^(-1+k))}{-1+k}-\frac{(1^(-1+k))}{-1+k}] = \frac {1}{1-k}$ ---- 然後,Exchange Condition (8) 在 $x >= 1$ 的情況下滿足: $F_L(2x) = (1 - k)(2x)^{(-2+k)} = 2^{-2}(2^k)(1 - k) x^{(-2+k)} = \frac{2^k}{4} F_L(x) > \frac{F_L(x)}{4}$。 //以下的例子與圖像有關 這個例子是一個具有下限的分佈:至少存在一個觀測值(在這種情況下,任何滿足 $1/2 < x < 1$ 的 $x$)可以確定你選擇了 S 盒子。就像在離散情況下一樣,也有可能構造一個沒有下限的例子,其中 Exchange Condition (8) 始終滿足。關鍵點是概率密度函數 $F_L(x)$ 具有一個平台,在 $x$ 接近無窮大時,它下降,但不會下降得太快。 現在要證明定理2:對於任意概率密度函數 $F_L(x)$,Exchange Condition (8) 不會對所有 $x$ 值失效。 ---- 證明 : 使用反證法 //證明的前半部不太懂 快速帶過 假設對於所有 $x ∈ (0, \infty)$,有 $F_L(x/2) >= 4F_L(x)$ (9)。 假設有一個區間 $[2^k, 2^{k+1}]$ 滿足 $\int_{2^k}^{2^{k+1}} F_L(x)dx = K > 0 (10)$ 其中 k 是一個整數。根據(9,10)以及連鎖律,我們有 $\int_{2^{k-1}}^{2^k} F_L(x)dx = \int_{2^k}^{2^{k+1}} F_L(\frac{y}{2}) \cdot \frac{1}{2}dy >= 4 \cdot \frac{1}{2} \int_{2^k}^{2^{k+1}} F_L(y)dy = 2K$。 而其中對於 $n = 0,1,2...$會產生以下 ![](https://hackmd.io/_uploads/BJgIQhX82.png) 因此,$F_L(x)$ 無法成為連續隨機變數的概率密度函數。無論 $L$ 具有什麼連續分布,條件(8)都對於某些 $x$ 值成立,使得交換對於這些值是有利益的。 --- ## 實際效用 在前面的討論中,我們都是以期望值理論去做估計,也就是我們的目標是最大化我們取得的金錢,但如果說 x 是一個大獎,那 2x 對你來說的價值真的是兩倍嗎? 對此,Von Neumann 和 Morgenstern 發展了一個理論,該理論將任何結果的主觀價值定義為稱為效用的實數。合理的決策是最大化期望效用。 ---- ## 馮·紐曼-摩根斯坦效用定理 (Von Neumann–Morgenstern utility theorem) 簡單來說,這個定理會通過效用函數將實際結果轉換成特定的偏好 一個簡單的效用函數的例子是: $u(x) = (x - 50) ^ {0.5}$ 這個函數讓我們知道的是,x 小於 50 時, x 對我們來說沒有效用,而只要大於 50 後,效用會因為邊際效應逐漸降低。 ---- 我們便可以依靠上述理論對此問題有不一樣的解釋,如果說我們在 B1 觀察到 x 的值是 60,我們在期望值理論下是會選擇要換,但是在最大化期望效用的情況下,我們通過效用函數轉換出來的期望值反而會比原本的還小。 ---- ## 另一個例子:聖彼得堡悖論 有一個「擲硬幣擲到正面為止」的賭局,第一次擲出正面,就給你1元。第一次擲出反面,那就要再擲一次,若第二次擲的是正面,你便賺2元。若第二次擲出反面,那就要擲第三次,若第三次擲的是正面,你便賺2*2元……如此類推,一直擲到正面為止。你可能擲一次,賭局便結束,也可能反覆一直擲,擲個沒完沒了。問題是,你最多肯付多少錢參加這個賭局? ---- 如果是根據期望值去計算這個問題 $$\begin{equation} \begin{aligned} E&=\frac12 \cdot 1 + \frac14 \cdot 2 + \frac18 \cdot 4 + \frac1{16} \cdot 8 +\cdots \\ &=\frac12 + \frac12+\frac12+\frac12+\cdots\\ &=\infty \end{aligned}\end{equation} $$ 會發現這個遊戲的期望值會是無限大,但是一個正常的人都不會花上太多錢玩這個賭局。 --- ## 總結與我們的看法 這篇論文使用了離散和連續兩種方法去驗證,在期望值的觀點裡換盒子總是可以在某個點上是有利的,但在最後以及證明過程中也有不時提到,會有額外的狀況,而就是在文末所提到的"效用定理",從這個視角才可以知道期望值並不代表一切,結果對每個人的價值可能都有所不同。 --- ## Question Time
{"metaMigratedAt":"2023-06-18T05:46:29.694Z","metaMigratedFrom":"YAML","title":"The Box Problem: To Switch or Not to Switch","breaks":true,"slideOptions":"{\"transition\":\"fade;\"}","contributors":"[{\"id\":\"e4a3af8b-860c-46a0-96f1-558667fdcf41\",\"add\":3903,\"del\":0},{\"id\":\"5df14ba0-4dd2-4172-b309-8b5af9ede7a1\",\"add\":2687,\"del\":0}]","description":"Author: Steven J. Brams, D. Marc Kilgour"}
    210 views
   Owned this note