# 博奕論 ## 參考資料:【【公开课】耶鲁大学:博弈论(中英双语字幕)】 https://www.bilibili.com/video/BV1Kt411h7Ep/?share_source=copy_web&vd_source=d48736c0ae75060b52431e05e6b42041 ~~考古~~ ## 共24集 <!-- (希望能做完 2023/10/14) --> ### 1. 導論-五個入門結論 <!-- (2023/10/14) --> - 甚麼是博奕論? 研究策略形勢 - 什麼是策略形勢? 不完全競爭的情況下,就是策略形勢 行為影響結果,但結果不僅取決於你的行為,還取決於其他人的行為 - 博奕論適用於什麼領域? 經濟學、政治學、法學、生物學、體育 - 遊戲1:成績博弈 你需要選擇A或B,然後會跟跟陌生人配對,你們雙方都無法得知對方的選擇,而你們的選擇會決定你們的成績(存屬娛樂) | 你/陌生人 | A | B | |:-------:| ----- | ----- | | **A** | B-/B- | A/C | | **B** | C/A | B+/B+ | - 選A的理由1:感覺其他人也會選A,如果選B的話會吃虧,因此不如一起選A - 選A的理由2:不管其他人選什麼,選A的成績都會比選B的好 - 選B的理由1:選B的分數波動會小一點(OS:我可不這麼覺得) - 選B的理由2:相信人心中的善 上面分析了行為、策略、參與人 但還缺少了動機和收益 - 將成績改用數字表示,更能直接顯示收益 | 你/陌生人 | A | B | |:---------:| ---- | ---- | | **A** | 0/0 | 3/-1 | | **B** | -1/3 | 1/1 | 將問題從 "做了什麼" 換成 "應該怎麼做" 應該選什麼才能拿到較好的成績? 如果選A的話,不管另一個人選什麼都會比選B好 - 假設另一個人選A,選A得到0>選B得到-1 - 假設另一個人選B,選A得到3>選B得到1 ## **如果選A的結果一定比選B好(無論另一個人選什麼),那麼A相對於B是個嚴格優勢策略** ## 結論一:不要選擇嚴格劣勢策略 **選擇嚴格優勢策略才能得到更好的結果** 如果我們都選擇B呢? 你不可能這麼做 - 原因1:你無法跟陌生人達成一致 你們都無法得知雙方的選擇,所以無法達成一致 - 原因2:即便對方選擇了B,你也因該選A,因為選A可以拿到對你來說更好的結果 當對方選B時,你選B可以得到B+,但選A的話可以拿到A ## 結論二:理性的選擇(選擇嚴格優勢策略),使總結果變得更加糟糕 - 案例1:囚徒困境 兩名囚犯被關進不同的牢房接受審訊,它們將會面對以下幾種情況 一人供出對方:一人無罪,一人被關五年 兩人都供出對方:兩人被關兩年 兩人皆沒有供出對方:兩人被關一年 - 案例2:大學宿舍 我跟我室友都覺得環境很髒,但我們希望對方打掃 先動的人就輸了 - 案例3:離婚 我受夠他/她了,但我死也不分財產給他/她 來互相傷害阿 - 案例4:價格戰 堅持久一點,他一定會倒,如果他沒倒,那價格就在低一點 消費者的勝利 如果我們事先溝通好一起選B呢? - 一樣行不通 缺乏強制力(我選A了,你打我啊) 回到前面囚徒困境跟價格戰 他們是如何用強制力約束合同的? 囚徒為何不招供?企業為何能串通好? 答:暴力(你敢招供,我出來後就打死你/你降價,我免費送) - 回到遊戲1,假設我同樣關心其他人的成績呢? 我們把成績的收益改成以下 | 你/陌生人 | A | B | |:---------:| ---- | ---- | | **A** | 0/0 | -1/-3 | | **B** | -3/-1 | 1/1 | 假設我得到A而另一人得到C,我會良心不安睡不著覺,導致我的收益是-1 架設我得到C而拎一人得到A,我不僅成績糟糕而沮喪的同時,也想扁害我成績是C的人,導致我的收益是-3 **這時你會怎麼選?** - 選A的理由1:我的損失會是最小,選A的話0+(-1)=-1,選B的話-3+1=-2 - 選B的理由1:選A的話最高只能拿到0,但選B的話最高可以拿到1 這種情況下沒有優勢策略,我們稱為"協和謬(ㄇ一ㄡˋ)誤" ## 結論三:如欲得知,必先知之 **改變收益(目的)的同時也會改變博弈(結果)** - 現在假設在同樣的狀況下,你只在乎自己的成績,而另一個人不只在乎自己的成績,同樣也在乎你的成績 首先我們先分析一下收益 | 你/陌生人 | A | B | |:---------:| ---- | ---- | | **A** | 0/0 | 3/-3 | | **B** | -1/-1 | 1/1 | - 選A的理由1:選A是優勢策略,無論另一個人選什麼,都比我選B還要好 - 現在腳色互換,你在乎雙方的成績,而對方是個冷血無情的王八蛋 這時你們的收益長這樣子 | 你/陌生人 | A | B | |:---------:| ---- | ---- | | **A** | 0/0 | -1/-1 | | **B** | -3/3 | 1/1 | - 選A的理由1:雖然沒有優勢策略,但我們都知道那個小王八蛋的優勢策略是選A,因此我們根據他選A的結果去做選擇 ## 結論四:站在別人的立場上去分析他們會怎麼做 回到遊戲一,現實中有做過類似的實驗,而實驗結果有30%的人選擇了B 而在耶魯大學則是238:36,大約13% ## 結論五:耶魯大學的學生都很自私(他真的是這樣說的) - 遊戲2:選數字 從1到100選一個數字,不要讓其他人看到,最後用所有人的數字計算出平均數,越接近2/3平均數的人是贏家,贏家的獎金是5 - ( | 平均數 - 選的數字 | * 0.01)美元 下一集會用到 <!-- (2023/10/15) --> ### 2. 學會換位思考 <!-- (2023/10/17) --> - 上一節課的遊戲最一開始並不算是博弈,因為我們只知道我們拿到的成績,而非我們獲得的收益,當我們將成績轉為收益後,這個遊戲才算是一個標準的博弈 - 本集主題: 1.不要選擇劣勢策略 2.站在別人的立場上去分析他們會怎麼做 - 囚徒困境 案例1:合作項目(例如小組報告) 大家都想偷懶 ![](https://hackmd.io/_uploads/BJli23i-a.png) 案例2:價格競爭 你降價,我降價,大家一起沒得賺 案例3:可利用的公共資源,這裡以魚群為例 這是我附近的魚群,結果被人偷偷撈走了,為了避免再被他們撈走,我只好先全部撈完 案例4:全球暖化議題 大家都不環保,我為什麼要跟著環保,你好環保你很好(敷衍) 這些案例的失敗原因跟溝通不足無關,溝通並無法解決囚徒困境 解決方式:簽定協約、制定規章制度等方式改變收益 (改變收益->改變動機->改變結果) or 把單次博弈轉化成重複博弈(後面的內容) or 通過教育來改變收益 - 以上節課的猜數字遊戲為例 博弈的要素有哪些?怎麼樣的情況下才能形成博弈? 1. 參與人 - 所有猜數字的學生都是參與人 - 以i跟j表示 2. 策略 - 以s<sub>i</sub>表示參與人i的策略 在猜數字遊戲中,假設我選擇了1,則s<sub>i</sub> = 1 - 以S<sub>i</sub>表示參與人i的所有可能的策略的集合 在猜數字遊戲中,S<sub>i</sub> = { 1 , 2 ... 99 , 100 } - 以s來表示某一次博弈的策略組合(or策略向量or策略列表) 在猜數字遊戲中,每個人都選了一個數字,把所有人的選擇組合在一起就是s - 以s<sub>-i</sub>表示除了某一人以外的策略組合 s<sub>-i</sub> = s-s<sub>i</sub> 3. 收益 - 以U<sub>i</sub>(s)表示參與人i在策略s之下的收益 在猜數字遊戲中,U<sub>i</sub>(s)代表兩種可能 - 猜中數字:獲得獎金(五美元減去誤差) - 沒猜中數字:0 - 範例: 1. - | A/B | 左 | 中 | 右 | | ----- | ---- | ---- | --- | | **上** | 5,-1 | 11,3 | 0,0 | | **下** | 6,4 | 0,2 | 2,0 | 參與人:A,B S<sub>A</sub>={上,下} S<sub>B</sub>={左,中.右} U<sub>A</sub>(上,中)=11 U<sub>B</sub>(上,中)=3 A與B都沒有優勢策略 - A選下時,B選中會使A得到較差的結果 - A選上時,B選左或右會使A得到較差的結果 - B選右的結果一定比選中的差(但右邊並不是劣勢策略,因為我們沒有相對的優勢策略存在) - 但B選中時,A選下會導致B得到較差的結果 - 而B選左時,A選上會導致B得到較差的結果 假設上述的條件都是已知的(假設我們知道其他人的策略跟收益) - **嚴格優勢策略的定義: 參與者 i 的策略s'<sub>i</sub>嚴格劣於另一個策略s<sub>i</sub> 在所有s<sub>-i</sub>情況中,U<sub>i</sub>(s<sub>i</sub>)的收益都嚴格優於U<sub>i</sub>(s'<sub>i</sub>)** 2. 一個侵略者打算侵略另一個國家,他有兩條路線可以選擇,但只能選擇一條路線,你身為防禦者,必須決定在哪一條路線上布署防禦 一條路崎嶇,需要翻越山脈,另一條平坦,只需要沿著海岸線走 如果侵略者遇到妳防禦的路線,那他會損失一個營的兵力 如果侵略者選擇崎嶇的路,那他會損失一個營的兵力 - 收益: | 防衛者\入侵者 | 平坦 | 崎嶇 | | ------------- | ---- | ---- | | 平坦 | 1,1 | 1,1 | | 崎嶇 | 0,2 | 2,0 | 入侵者收益:保留兵力來進攻 防衛者收益:入侵者損失兵力 雖然在平坦路線防禦並不是嚴格優勢策略,但大部分的人還是選擇平坦 - 理由:雖然以防禦者的角度來看並沒有嚴格優勢策略,但是以侵略者的角度來看有弱優勢策略 因為入侵者選擇平坦的策略弱優於入侵的策略,因此我們選擇平坦度線才能拿到最大收益(換位思考後的選擇) - **弱優勢策略的定義: 參與者 i 的策略s'<sub>i</sub>弱劣於另一個策略s<sub>i</sub> 在所有s<sub>-i</sub>情況中,U<sub>i</sub>(s<sub>i</sub>)的都至少等於U<sub>i</sub>(s'<sub>i</sub>),並且在某些情況下U<sub>i</sub>(s<sub>i</sub>)的收益是嚴格優於U<sub>i</sub>(s'<sub>i</sub>)** (嚴格優勢-大於,弱優勢-大於等於(其中必定有大於)) - 猜數字遊戲 如果要選擇的話,選擇99會使收益最大化,但要拿到獎金則要猜平均的2/3,所以"應該"要猜66,但所有人都這樣想的話那就要再乘以2/3,也就是44,重複下去最後的最優解"應該"是1 44到66之間的數字原本並不示弱劣勢策略,但因為我們把66~99的數字排除了,所以44~66成為了弱劣勢策略 共同知識 : 我知道大於66的數字沒有人會選,其他人也知道,所以沒有人會選大於66的數字,因此我知道沒有人會選大於44的數字...... 以上全是理論,不是現實,最後的平均數是$13 \frac13$,乘以$\frac23$後大約是9 你是理性的,並不代表其他人也是 - 在重玩一次遊戲,會發現雖然有幾個來亂的還是選了比67大的數字,但大部分的人都選了1~5之間的數字,同時也比第一次選的數字小 因為所有人都知道這個遊戲越小越好,也知道其他人知道....(共同知識) 站在兩個人背後並替他們戴上黑色帽子,他們雖然看的到另一個人的帽子顏色,但因為看不到自己的帽子,因此並不知道自己的帽子的顏色,因此帽子的顏色並不算是共同知識 但他們可以知道至少有一頂黑色帽子,這被稱為相互知識 公同知識是所有人都知道,且確定其他人也知道的知識 <!-- (2023/12/09) --> ### 3. 迭代剔除和中位選民定理 <!-- (2023/12/10) --> - 上一章的重點:剔除劣勢策略 迭代剔除劣勢策略:找出劣勢策略,將其剔除,再次檢查,找出新的劣勢策略,再次剔除...不斷重複下去 #### 中位選民定理: - 假設有兩個候選人,為了選舉,他們必須在一系列的政治主張中選擇政治立場,政治立場被共有10個,分別是1~10,數字越小越靠近左翼,數字越大越靠近右翼,假設每一個政治立場都有10%的投票,選民會選擇鈄給政治立場最相近(數字差最小)的候選人,如果數字差相同則平分選票 - 參與人:候選人 - 策略:選擇政治立場 - 收益:最大化的選票 - 劣勢策略:選擇1跟10的政治立場 選擇2到9的政治立場都會比選擇1或10的收益還要高,除非對方也選擇1或10 * 以下證明 1. - 假設對手選擇1 u<sub>i</sub>(1,1)=50% u<sub>i</sub>(2,1)=90% 2. - 假設對手選擇2 u<sub>i</sub>(1,2)=10% u<sub>i</sub>(2,2)=50% 3. - 假設對手選擇3 u<sub>i</sub>(1,3)=15% u<sub>i</sub>(2,3)=20% 4. - 假設對手選擇4 u<sub>i</sub>(1,4)=20% u<sub>i</sub>(2,4)=25% 5. - 假設對手選擇5...... * 從以上的假設可以得知,選擇2的收益一定會比選擇1的收益高 那麼,選擇立場3會由於選擇立場2嗎? 1. - 假設對手選擇1 u<sub>i</sub>(2,1)=90% u<sub>i</sub>(3,1)=85% 對手選擇立場1時,立場2會比立場3更好 但如果將劣勢策略(1跟10)剔除掉的話,則立場2會變成新的劣勢策略 不斷重複下去,最後會只剩下5跟6 * 中位選民定理:越中間的立場可以獲得越多的選票 * 這個模型沒有考慮到一些情況,例如:每個立場的人部會剛好是10%、部是所有人都會投票、政治立場不是投票的唯一決定因素、候選人不會只有2個... #### 最佳對策 - 假設有一個博弈,參與人分別是i跟j,i的策略分別是上、中、下,j的策略是左、右,收益如下 | | 左 | 右 | | -------- | -------- | -------- | | **上** | 5,1 | 0,2 | | **中** | 1,3 | 4,1 | | **下** | 4,2 | 2,3 | 這個博弈沒有劣勢策略,因次不能跟前面的博弈採用相同方法(避免劣勢策略、迭代剔除) - 假設你是參與人i,你應該選擇? * 如果對手選擇左,則選上的收益最高 * 如果對手選擇右,則選中的收益最高 * 選下的好處呢? 假設對手選擇左跟右的機率相同,則期望值如下 * 上:$5*\frac{1}{2}+0*\frac{1}{2}=2.5$ * 中:$1*\frac{1}{2}+4*\frac{1}{2}=2.5$ * 下:$4*\frac{1}{2}+2*\frac{1}{2}=3$ 在無法確定對手選擇的情況下,選擇下的期望值最高 - 以上假設對手選擇左跟右的機率相同,如果對手選擇左的機率是選擇右的2倍呢? * 與其慢慢算,不如直接用圖表表示 X軸:對手選擇右的概率 Y軸:預期收益 ![螢幕擷取畫面 2024-01-03 180308](https://hackmd.io/_uploads/BJxxZhzup.png) 經由這張圖可以知道對手選右的概率以及不同的對策的期望值 <!-- (2024/01/03) --> ### 4. 足球比賽與商業合作之最佳對策 <!-- (2024/01/03) --> #### 最佳對策 * 在對對手已經有一定了解下所做出的最好的選擇 #### 罰球遊戲(penalty kick game) * 你是負責罰球的隊員,可以選擇3種進攻方式,分別是左路、右路、中路 * 對手是守門員,可以選擇防守左路或右路 * 收益如下 | | 左 | 右 | | -------- | -------- | -------- | | **左** | 4,-4 | 9,-9 | | **中** | 6,-6 | 6,-6 | | **右** | 9,-9 | 4,-4 | u<sub>1</sub>(中,左)=6代表罰球員從中路進攻,守門員防守左路時,罰球員的收益,其中6代表有60%的得分概率 u<sub>2</sub>(中,左)=6代表罰球員從中路進攻,守門員防守左路時,守門員的收益,其中-6代表有60%的失分概率 * 劣勢策略並不存在,因此我們使用上一堂課的方法-畫圖 X軸表示守門員防守右邊的機率 Y軸表示收益(得分機率) ![螢幕擷取畫面 2024-01-03 201928](https://hackmd.io/_uploads/HkX1W0zda.png) 根據圖片可以得知,無論守門員的概率如何,選擇中間的期望值都比較低 **結論:不要選擇一個在任何情況下都不是最佳策略的策略** * 這個模型沒有考慮到一些情況,例如:球員的慣用手會影響他的選擇、球員可能會有事前的戰術、守門員可能會選擇中路、球速、高度... #### 最佳對策(Best Response) 定義1 * 在對手的策略S<sub>-i</sub>底下,如果我有一個策略Ŝ<sub>i</sub>的最大化了我的收益,則Ŝ<sub>i</sub>是一個最佳對策BR 定義2 * 參與人i的策略Ŝ<sub>i</sub>是一個在對手可能採取的策略持信念P時的最佳策略BR * 在參與人i持信念P時,策略Ŝ<sub>i</sub>的預期收益是所有的策略中最高的 * 預期收益:所有的 策略收益\*策略概率 相加 #### 合夥人博弈(Partnership Game) * 你與另一個人都是公司的股東,你們各自持有50%的股份,賺到的錢平分 * 股東必須選擇要為公司投入多少時間,最少為0,最多為4,可以選擇任意實數,例如:3.5 * 假設公司的利潤是$4*(S_i+S_j+B*S_i*S_j)$,B為$0$到$\frac{1}{4}$ * 公司的利潤在兩人合作的情況下會較高(因為有B的存在) * 你的收益為公司的利潤跟另一個人平分後再減去成本$S_i^2$,也就是$\frac{1}{2}*4*(S_i+S_j+B*S_i*S_j)-S_i^2$ $=2*(S_i+S_j+B*S_i*S_j)-S_i^2$ * 因為這一次的參與人的選擇是連續的,因此我們無法直接用畫圖來表達 * 但我們可以先用微積分求出$S_i$的導數來進行分析 $2*(S_i+S_j+B*S_i*S_j)-S_i^2$ 求導數後變為 $2*(1+B*S_j)-2*S_i$ * 為了確認是最大值還是最小值,我們需要求出二階導數 $2*(1+B*S_j)-2*S_i$ 求導數後變為 $-2$ * 由於二階導數是負數,因此當一階導數$2*(1+B*S_j)-2*S_i$等於0的時候 $2*(S_i+S_j+B*S_i*S_j)-S_i^2$可以獲得最大值,也就是最大收益 我們將S<sub>i</sub>的最佳對策Ŝ<sub>i</sub>帶入,可以發現$\hat{S}_i=1+B*S_j$ * 同樣的方式在算一次,我們也可以得知參與人j的最佳對策$\hat{S}_j=1+B*S_i$ * 現在我們可以畫圖了,假設$B=\frac{1}{4}$ ![螢幕擷取畫面 2024-01-25 040037](https://hackmd.io/_uploads/H14dnJycT.png) * 當參與人j選擇0時,參與人i的最佳對策要大於1 當參與人j選擇4時,參與人i的最佳對策要小於2 換句話說,最佳對策一定是在1到2之間 所以我們可以在畫一張範圍在1到2之間的圖 ![螢幕擷取畫面 2024-01-25 040916](https://hackmd.io/_uploads/SkGK01J5a.png) 可以發現跟前一張圖幾乎形狀相同,不斷重複這個步驟後,最佳對策會歸為一點,也就是兩條線的相交處$\frac{1}{1-B}=\frac{4}{3}$ 我們稱這兩條線的交點維納什均衡(Nash Equilibrium),在這個點下,參與人都選擇了最佳策略 <!-- (2024/01/25) --> ### 5. 納什均衡之壞風氣與銀行擠兌 <!-- (2024/05/27) --> #### 納什均衡(NE) * 定義:策略組合是一個集合,其中包含了每個參與人所選擇的一個策略(以S1*,S2*...SM*表示) * 納什均衡是滿足以下條件的策略組合 * 任一參與人i的策略Si*,是其他參與人所選策略的最佳對策(所有人的選擇都是最正確的,多一點少一點都不行) (並非所有情況都可以滿足納什均衡,尤其並不是每個人都可以隨時做出最正確的選擇) * 納什均衡是怎麼達成的? * 當雙方都認為對方會採取納什策略,怎雙方都會採取納什策略 ##### 練習1 * 有兩個參與人,他們的策略及收益如下 | 1\2 | 左 | 中 | 右 | | ------- | --- | --- | --- | | **上** | 0,4 | 4,0 | 5,3 | | **中** | 4,0 | 0,4 | 5,3 | | **下** | 3,5 | 3,5 | 6,6 | * 參與人1有以下3種情況 * 參與人2選擇左 最佳策略是選擇中 * 參與人2選擇中 最佳策略是選擇上 * 參與人2選擇右 最佳策略是選擇下 沒有一個策略需要被剃除 * 參與人2也有以下3種情況 * 參與人1選擇上 最佳策略是選擇左 * 參與人1選擇中 最佳策略是選擇下 * 參與人1選擇下 最佳策略是選擇右 沒有一個策略需要被剃除 這個博弈中的納什均衡在右下,因為只有在右下的時候所有參與人都選擇了最佳對策 在這個博弈中,納什均衡只代表某一個特定情況下的最佳解,並不代表所有情況 ##### 練習2 * 有兩個參與人,他們的策略及收益如下 | 1\2 | 左 | 中 | 右 | | ------- | --- | --- | --- | | **上** | 0,2 | 2,3 | 4,3 | | **中** | 11,1 | 3,2 | 0,0 | | **下** | 0,3 | 1,0 | 8,0 | * 參與人1有以下3種情況 * 參與人2選擇左 最佳策略是選擇中 * 參與人2選擇中 最佳策略是選擇中 * 參與人2選擇右 最佳策略是選擇下 * 參與人2也有以下3種情況 * 參與人1選擇上 最佳策略是選擇中or右 * 參與人1選擇中 最佳策略是選擇中 * 參與人1選擇下 最佳策略是選擇左 這個博弈中的納什均衡在正中間,因為在正中間的時候所有參與人都選擇了最佳對策 在這個博弈中,納什均衡只代表某一個特定情況下的最佳解,並不代表所有情況 因為最佳對策可以不只一個,所以納什均衡也有可能不只一個 * EX:協調博弈(Coordination Games) 假設有兩個駕駛者在相對方向上行駛並且必須選擇靠左或靠右行駛。如果兩人都選擇靠左或都選擇靠右,則不會發生碰撞,這樣的情況下就有兩個納什均衡。 (By ChatGPT) #### 納什均衡與優劣 * 囚徒困境 | 你/陌生人 | A | B | |:---------:| ---- | ---- | | **A** | 0/0 | 3/-1 | | **B** | -1/3 | 1/1 | 在這個博弈中,選擇A嚴格優於B * 當我選A時 對面的最佳對策是選A * 當我選B時 對面的最佳對策是選A * 當對面選A時 對面的最佳對策是選A * 當對面選B時 對面的最佳對策是選A * 這個博弈中的納什均衡是(A,A),因為在正中間的時候所有參與人都選擇了最佳對策 在這個博弈中,納什均衡只代表某一個特定情況下的最佳解,並不代表所有情況 * Q:但(A,A)的結果並沒有優於(B,B),為什麼(B,B)不是納什均衡?嚴格劣勢策略為什麼不能達成納什均衡? A:因為嚴格劣勢策略永遠不會誠為最佳對策,因此無法達成納什均衡 (對方選擇了B,那我選A就可以得到3,所以我一定會選A) * Q:那弱劣勢跟弱優勢呢? | 1/2 | 左 | 右 | |:---------:| ---- | ---- | | **上** | 1/1 | 0/0 | | **下** | 0/0 | 0/0 | 這個博奕中的納什均衡毫無疑問是左上或右下,即便左上的收益明顯優於右下,右下依舊是一個納什均衡,因為在右下的情況發生時,即便我們改變選項也不會獲得更好的收益 #### 投資博弈 * 參與人:很多(不只2人) * 策略:甚麼都不做 or 為一個項目投資100元 * 收益:不投資=>收益為0 投資而且投資人數多於90%總人數=>收益為150(減去投資的話,收益為50) 投資但投資人數少於90%=>收益為0(100元也會消失) * 參與人之間無法互相溝通 * 投資方觀念:老子有錢、有投資才有回報 * 不投資方觀念:90%的標準太高了,傻子才丟錢 * 在這個博弈中有兩個納什均衡: 所有人都不投資也沒有損失 or 所有人都投資都有收益 * Q:納什均衡是如何被找到的? A:先猜測後驗證 * 在第一次進行這個博弈時,投資跟不投資的人數接近 但如果將博弈在重複進行幾次,會發現投資的人會不斷減少,因為會有越來越多的人知道他們會血本無歸 * 博弈的結果會不斷趨近於納什均衡 * 都投資的收益嚴格優於都不投資的收益,我們會說都不投資的收益相對於都投資的收益處於帕雷托劣勢,而都投資的收益相對於不投資的收益處於帕雷托優勢 * 假設第一次博弈時有91%的人選擇了投資,那後面的幾次博奕中選擇投資的人就會不斷增加 * 儘管這跟囚徒困境很像,但這並不是囚徒困境,因為這個博弈中的選擇並沒有嚴格劣勢策略 * 我們稱呼這為協調博弈 如果協調成功,則所有人都投資 如果失敗,則沒有人投資 #### 協調博弈 ##### 案例1:校園派對 如果參加的人少=>大家玩得不開心=>繼續參加的人更少... ##### 案例2:戰爭時期的和平協議 你先把槍放下 不,你先放下 想吃子彈是吧 當我會怕你嗎 ##### 案例3:微軟壟斷 越多人使用微軟的產品,就會越有優勢 ##### 案例4:銀行擠兌 當人們對銀行失去信心時,他們便會把錢領出來,導致銀行破產 協調博弈的結果是可以被改變的,但囚徒困境不行,因為囚徒困境有一個策略是嚴格劣勢策略, ### 6. 納什均衡之約會遊戲與古諾模型 ### 7. 納什均衡之伯川德模型與選民投票mp4 ### 8. 納什均衡之立場選擇、種族隔離與策略隨機化 ### 9. 混和策略定義及其在網球比賽的應用 ### 10. 混和戰略棒球,約會和支付你的稅 ### 11. 進化穩定-合作、突變與平衡 ### 12. 進化穩定-社會公約、侵略和週期 ### 13. 順序遊戲-道德風險、獎勵和飢餓的獅子 ### 14. 落後的感應-承諾、間諜和先行者優勢 ### 15. 落後的感應-國際象棋、戰略和可信的威脅 ### 16. 落後的感應-聲譽和決鬥 ### 17. 最後通牒和討價還價 ### 18. 信息集和子博奕完美 ### 19. 招商引資和戰略投資 ### 20. 戰爭的消耗 ### 21. 合作與結局 ### 22. 作弊、懲罰和外包 ### 23. 沉默、信令和苦難教育 ### 24. 拍賣和獲獎者的詛咒