理性行為者模型(Rational Actor Model, RAM)

--- disqus: yueswater --- # 理性行為者模型(Rational Actor Model, RAM) {%hackmd @themes/orangeheart %} <style> .likecoin-button { position: relative; width: 100%; max-width: 485px; max-height: 240px; margin: 0 auto; } .likecoin-button > div { padding-top: 49.48454%; } .likecoin-button > iframe { position: absolute; top: 0; left: 0; width: 100%; height: 100%; } </style> ###### tags: `Foreign Policy` 不同的學者對於政策(policy)有不同的定義，但基本上外交政策的概念可以被描述為： - 作為指導對外行為的一套**長期性原則、方向、目的**等，例如英國從 18 到 19 世紀的光榮孤立政策(Glorious Isolation Foreign Policy)。[^1] - 為解決當前所面對的政策問題(policy problem)，所採取和實行的具體行動。而政策問題是行為者認為必須**被改變**的狀態(a condition to be changed)，亦即政策決定者認為目前該國於國際政治場域中的處境不利其發展，致使其必須改變現狀。例如古巴飛彈危機，對於1960 年代的美國而言就是一個急迫改變的狀態。 ## 理性行為者模型內涵與基本概念作為一個解釋外交政策是經由何種決策過程產生的模型，其特徵在於，此模型認定外交決策主要是行為者針對政策問題，設定目標，然後在諸多可達成既定目標和解決問題的政策選項中，評估不同選項各自產生的結果，選出結果最有利於達成目標的選項，最終付諸行動。換言之，此處的理性之意義為**工具理性(instrumental rationality)**。 ### 工具理性所為工具理性，係指手段與目的之間的關係，而非實質理性(substantive rationality)——即 reason，例如道德價值和倫理價值。學者 Max Weber 指出，從文藝復興至工業革命以來迅速發展的科技與文明，人類的行為從實質理性轉向工具理性——找到「最佳工具」達成目標，其亦作為現代化發展的主要核心。 ### 行為者(Actors) 理性行為者模型認為，外交政策中行使決策的行為者是單一的行為者，亦即具有目的和偏好上之內在一致性的行為者。由上到下對於行為者的資訊會越來越多，故可以將國家細分為以下 4 種概念： - 民族國家(national state)：為一項概念。 - 一般國家(generic state)：國家類別，即以國家的特性、當前狀況做為分類依據。如國家的經濟是否還在發展中？本土產業是否需要扶持？不同的狀態將影響一國對於貿易乃至於外交政策的態度。 - 特定國家(identified state)：提供分析者更多的資訊，如日、韓等特定國家對於慰安婦議題的爭端。 - 個人化的國家(personfied state)：更進一步地指涉國家的決策不單只是國家的決策，而是分析者已知國家做出決策者為何，如川普的保護主義。 ### 行為者的目標任何外交政策的終極目標，必然不脫離國家利益。簡單地說，外交政策所要達到的終極、不可化約的(ultimate and irreducible)目標，大致包含領土與主權的完整，人民各項基本權益的保障、經濟的穩定與發展、國內制度與政治社會價值之維續等。但當外交政策作為解決政策問題的行動時，相關的目標，必然是**達成上述那些終極目標下的次級目標**，隱含著外交政策目標的概念，往往是**一連串的手段——目的之間的連結關係**。以下便以英國的光榮孤立政策作為分析例子。 :::info **英國光榮孤立政策** - 終極目標：英國領土的完整、安全 - 第一層手段：光榮孤立。當新強權出現時，結合其他強權壓制崛起強權。 - 第二層手段：無固定型態之結盟。當拿破崙出現時，結合其他歐陸強權尤其是俄羅斯牽制法國；之後俄國轉強，又與法國結合，發起克里米亞戰爭以壓制俄羅斯。 - 政策：跟法國結盟壓制俄羅斯。 ::: ### 政策選項[^2] 政策選項(alternatives)的範圍，由行為者可使用資源的種類和多寡，即是**物質性條件(material condition)**，以及行為者遵循的價值體系，即**理念性條件(ideational condition)**所共同塑造。在大規模乃至於世界大戰時，「是否可以於戰場上使用化學武器」成為各國探討的目標。一般而言基於人道原則，國家多半不會在戰場上使用化學武器，二戰時幾乎沒有國家使用化武，連殺人如麻的希特勒也並未採用，儘管希特勒當時面臨即將失敗的命運，其仍堅持不使用毒氣。一個較為合理的解釋是，希特勒仍受到理念規範的束縛，認為在戰場上使用毒氣不符其所信奉之理念。 ### 政策選項的結果包含效益(benefit)與成本(cost)兩部分。所謂效益係指政策選項付諸實施後，有利於達成政策目標與解決政策問題的程度高低或幅度大小。由於解決政策問題時，會影響到的國家利益或目標多半不只一個，而政策選項 $A$ 相較於選項 $B$，往往在目標 ## 政策成本效益分析當行為者在決定政策之前，會進行成本效益分析，並以不同的邏輯、脈絡加以討論。 ### 政策排序與選擇判準 - 差距邏輯：此方式即是透過成本與效益之間的差距作為政策選擇的依據，即 $B - C$。然而有時成本與概念的衡量單位、概念不盡相同，若以經濟、商業的角度觀之，較好量化、計算。 - 本益比：簡單的理解方式即是每一單位的成本投入能夠得到多少單位的效益，計算方式為 $\frac{B}{C}$。不過，如同差距邏輯一般，此種方法亦難以化約為相同單位，在實務上難以操作。 - 效益——成本邏輯：在設定某些主要目標或利益上必須達到的最小效益後，尋找成本最小的選項。 - 成本——效益邏輯：在設定某些主要目標或利益或資源使用上能承受的最大成本後，尋找效益最大的選項。當考量的成本是負面效益時，即近似外交決策上所謂的多元啟發決策模式(poli-heuristic decision-making)。 ### 機率在少數那些資訊高度充分的條件下，決策者可以獲知或估計某特定選項會在何種機率下，產生原先預期的效益或成本，此時，實際產生的效益或成本可以以期望值表達，即 $$ \mathbb{E}(B) = B \times p $$ 其中 $p \in [0,1]$。 ## 策略、互動與賽局現實中一個特定政策選項付諸行動後，產生的實際結果往往是由該行為者的行動，和其他行為者的行動，兩者相互影響、互動所共同決定的，此及策略互動(strategic interaction)的概念，可透過賽局模型描述。 ### 囚徒困境囚犯困境的主旨為，囚徒們彼此合作，堅不吐實，可為全體帶來最佳利益（縮短刑期），但在無法溝通的情況下，因為出賣同夥可為自己帶來利益（無罪開釋），也因為同夥把自己招出來可為他帶來利益，因此彼此出賣雖違反最佳共同利益，反而是自己最大利益所在。以下為一般型態(normal form)的囚徒困境賽局： $$ \begin{array} & & & & \text{Actor 1} \\ \hline & & \text{Confess} & \text{Don't confess} & \\ \hline & \text{Confess} & (2,2) & (4, \underline{1})\\ \text{Actor 2} & \text{Don't confess} & (\underline{1},4) & (\underline{3},\underline{3})^{*}\\ \hline \end{array} $$ 首先，上述賽局中，行為者的效用排序為 1 最高，4 最低。純粹奈許均衡(pure Nash equilibrium)為 $(\text{Don't confess}, \text{Don't confess})$，然而競爭均衡下的結果卻為 $(\text{Confess}, \text{Confess})$ ### 懦夫賽局一個玩家讓步對於雙方都有好處，而玩家的最佳選擇取決於其對手會做什麼：如果對手讓步，那本方就不應該讓步，但如果對手不讓步，本方就應該讓步。假設與上述囚徒困境的例子相同： $$ \begin{array} & & & & \text{Actor 1} \\ \hline & & \text{Swerve} & \text{Straight} & \\ \hline & \text{Swerve} & (2,2) & (\underline{3}, \underline{1})\\ \text{Actor 2} & \text{Straight} & (\underline{1},\underline{3}) & (4,4)\\ \hline \end{array} $$ 可以發現在此賽局中有兩個奈許均衡。因此我們可以令行為者 1 選擇轉彎(swerve)的機率為 $p$，則選擇直線加速衝撞(straight)的機率為 $1 - p$；同樣地，令行為者 2 選擇轉彎的機率為 $q$，直線加速的機率為 $1- q$。我們可以透過下列計算得出混合奈許均衡(mixed Nash equilibrium)。 ## 風險、絕對利得與相對利得不確定性(uncertainty)與風險(risk)的概念在外交政策決策者佔有重要且不可忽視的地位。一般而言，決策者在衡量風險時，多會將不確定性以機率(probability)衡量，並以期望值(expected value)的計算方式求得此決策的效用與預期效用(expected utility)的差距。 ![](https://i.imgur.com/DBh7Gbo.png) 上圖以 $x-y$ 平面描述不同風險偏好的型態。 - 風險中立(risk-neutral)：風險大小不影響效用。 - 風險趨避(risk-averse)：風險越大效用則越低。 - 風險喜好(risk-loving)：風險越大效用越高。其追尋的並非風險本身，而是成功時所附加的巨大效益。而絕對利得(absolute gain)與相對利得(relative gain)的概念亦是外交決策制定過程中的重要判準。所謂**絕對利得**，即是考慮自身效用程度變化之大小，其多應用於經貿議題；而**相對利得**則是同時考慮自身與對手的效用各自增加或損失多少，在軍事議題扮演重要角色。例如美國對於中國發動的科技戰，尤其是晶圓的抵制，雖讓中方付出慘痛代價，同時也讓美國的晶圓廠蒙受損失。綜觀美中在晶圓議題上的利得，美國在發動科技戰後，效用實際上是損失的。 ## 以 RAM 解釋古巴飛彈危機針對古巴飛彈危機，存在三個主要問題，並以 RAM 進行更進一步的說明與解釋： - 為何蘇聯要在古巴部署飛彈？ - 美國為何選擇以封鎖(blockade)作為主要因應措施？ - 蘇聯為何最後選擇撤除飛彈？華府發現蘇聯部署飛彈於古巴島上，感到相當意外，意外的原因不只是因為蘇聯進行此種可能引發核戰衝突的行動，一般而言機率不大，更因為蘇聯之前的行為，讓華府預期蘇聯不太可能如此做。對於美國的決策者（1962年10月15日，美國 U2 偵察機拍攝到古巴島上蘇聯的 SS-4 飛彈發射基地照片後，甘迺迪總統組織 ExCom）而言，要選擇以何種行動解決這個政策問題，首先必須先推斷：蘇聯部署飛彈的原因為何。換言之，決策者有資訊的部分是對手實際做的行為選擇，而必須根據此一資訊，遵循 RAM 的工具理性邏輯，倒推回來，推論出對手的目的何在。如何由觀察得到的行為選擇，來推論出觀察不到的行為者目的。假設在 $A, B, C, D$ 四種可能的目的當中,能達到每種目的的手段，包括 $a, b, c \cdots$ 等，圖示如下: 倘若行為者實際的政策選擇是 $d$,則推論的步驟大致上包括： 1. 可以排除 $A$、$D$，此二者不可能是行為者的目的，例如因為 $d$ 產生的結果無法達到 $A$、$D$，或者在 $A$,$D$上產生的成本大效益。 2. 是 $B$ 還是 $C$，可以再考慮：相較於能達到同一個目標的其他手段，$d$ 是否是相同（相近）效益下成本最小的，或者相同（相近）成本下效益最大的。如果 $d$ 在能達到 $B$ 的所有手段中無法滿足這類條件，則 $B$ 就不是行為者的目的。 3. $a, b, c, d \cdots$ 等手段的範圍，除了考量行為的內涵、種類不同外，彼此間也可以因為是在不同的時點採取類似的手段,而形成不同的選項。上述從1至3的考慮因素,往往都必須納入策略互動的層面：手段的成本和效益,是所有行為者策略互動的結果；**如果行為者採取 $d$ 後，對手所採取的不同策略反應,都有利於 $D$ 而非 $B$ 的達成，那麼 $D$ 比 $B$ 更可能是行為者的真正（或最重要的）目的**。 ### ExCom 決策過程中討論之幾種蘇聯可能實現的主要目標以下有四種假說(hypothesis)： #### 強化對於古巴的防禦: 1. 支持性理由：1960年6月，蘇聯便曾公開宣稱，若美國攻擊古巴，蘇聯會動用核武保護古巴；1961年4月，豬玀灣(Bay of Pigs)事件發生，美國仍持續進行對卡斯楚(Castro)的暗殺行動及煽動古巴國內革命；1962年2月蘇聯中央通過提供古巴大量武器及培訓軍事人員。 2. 反對性理由：當美國真的發動攻擊時，則在當地的蘇聯戰鬥人員會比飛彈更能有效防衛古巴，或者戰鬥人員的目的不一定主要是透過作戰來擊退外敵而是透過「**人質效應** (hostage effect)」[^3]來嚇阻美國進攻；如果要嚇阻美國，則甚至不用派出戰鬥人員或飛彈，蘇聯只要和古巴公開簽訂防禦條約（聯盟）便能達到一定成效；在古巴部署射程能涵蓋華府的飛彈，只會提高而非降低美國攻擊古巴的機率。 #### 冷戰中超強之間及其與其盟友間的權力互動(Cold War politics): 1. 支持性理由：如同現實主義所言，大國在彼此競爭的過程中，要不斷尋求保持或強化其在體系中的結構性地位(status)，**地位高低的最明顯指標之一，就是核武層面的優勢或劣勢**。而在冷戰這種雙方都尋求擴大本身對他國政治影響力的競爭當中，此種對於地位或形勢的塑造，尤其重要核武帶來的超強地位，會使得該國在軍事安全以外的其他議題上，也享有更多權力和影響力。此外，兩大超強當時各自在本身陣營內部的權力，都受到挑戰；蘇聯與中國大陸，從 1959 年起公開決裂，在雙方諸多的爭論點當中，也包括北京指責莫斯科不積極推動全球共產革命。而南斯拉夫(Yugoslavia)的領導人 Tito，早已在國內推動不完全符合社會主義的經濟體制，挑戰社會主義意識形態。美國面臨許多西德人民在德國分裂問題上對美國的不滿以及法國戴高樂(deGaulle)的抵制。如果美國無法有效處理飛彈危機,則會使其盟友與美國更加離心離德。 2. 反對性理由：無論蘇聯是要強化相對於美國的結構地位，或是要強化對本身陣營內部權力或削弱美國對其陣營內部權力，都必須使美國不做強硬反應，但在古巴部署攻擊性可攜帶核彈頭飛彈，卻讓美國不太可能不做強硬反應；蘇聯在甘迺迪上台後，才剛剛在1961年8月結束的第三次柏林危機中，見識到甘迺迪的強硬反應，如果在柏林問題上都如此強硬，那麼沒有理由預期在距離美國近的古巴問題上會軟弱；要達到上述目的，部署中程彈道飛彈(medium-range ballistic missiles)[^4] 即可，不需要部署較昂貴也比較容易被發現中長程彈道飛彈(intermediate-range ballistic missiles)[^5]。 #### 強化蘇聯與美國一旦發生核戰時的勝利或存活機率 1. 支持性理由：當時在核武力量對比上，蘇聯明顯居於劣勢，如果能在非常接近美國的地區部署核彈頭，則對於蘇聯的第一擊奏效程度或第二擊存活程度，都會有所提昇。美蘇當時對比： $$ \begin{array} \\ \hline \text{} & \text{美國} & \text{蘇聯}\\ \hline \text{ICBM(陸基)} & 180 & 20\\ \text{可發射核彈的潛艇（海基 SLBM）} & 12 & 6\text{（其他弱點）}\\ \text{戰略轟炸機（空投）} & 630 & 200\text{（其他弱點）}\\ \hline \end{array} $$ 其次，美國當時對於蘇聯攻擊的防禦及預警系統，都是針對來自北極和蘇聯方向的飛彈飛行路線，還沒有針對來自南方的飛彈攻擊。此外，甘迺迪政府計畫在1964年前，將 ICBM 增加3倍，SLBM 增加2倍，以及已經部署在英國、義大利、土耳其的 Jupiter 式 IRBM。最後，1962年3月到4月，美蘇在日內瓦曾談判限制核子試爆的可能性，結果談判失敗，美國接著在太平洋上進行一連串試爆，這也可能是刺激蘇聯的另一個因素。 2. 反對性理由：首先，如果蘇聯考量到可能引起的傳統乃至核子武力衝突，那麼應該有理由等待蘇聯的核武力量和美國的差距再接近一些以後，才來點燃這種爆炸性的危機引信，而不是在1962年的夏秋如此做。其次，即使美國只使用傳統武力來消滅飛彈基地，那麼由於美國將傳統武力投射到加勒比海地區，要遠比蘇聯更有效，所以蘇聯在古巴的部署，就地理區域而言並非明智的選擇。第三，美國有少數高層決策者，例如國防部長McNamara，認為在古巴部署飛彈對核武戰略平衡影響並不大。 #### 解決柏林問題: 1. 支持性理由: - 柏林問題的重要性:三次柏林危機(1948、1958、1961)的經過，顯示出柏林問題如果不解決，長期而言會形成對蘇聯與整個社會主義陣營內部最大的統治正當性威脅，這在以意識形態鬥爭作為主軸之一的冷戰時期來說，其實是一個慢性但致命性的問題。 - 從蘇聯的角度來看，無論美國如何針對古巴飛彈作出哪種反應，都比蘇聯不部署飛彈時，更有利於蘇聯解決柏林問題。若美國選擇外交談判途徑解決，則蘇聯現在手上掌握了原來沒有的籌碼可要求西方在柏林問題上讓步來換取撤除古巴飛彈。若美國選擇以武力攻擊柏林，那麼蘇聯有更佳的條件，同樣以武力解決柏林問題。若美國選擇不積極反應(inaction)，那麼蘇聯也可以擴大西歐國家在柏林問題上與美國的矛盾，增加蘇聯的優勢。 - 蘇聯領導人赫魯雪夫(Khrushchev)，已經面臨國內統治上的權力挑戰，如果能解決長期懸而未決的柏林問題，將有利於其鞏固個人權力。 - 如果也考慮事後的證據，那麼另一個輔助性理由是：1961年9月建立柏林圍牆後，赫魯雪夫還是發出數封不公開的信件給甘迺迪，多次實質性的討論柏林問題。但在飛彈危機後，信中再提到柏林問題，就只是表面上提出而已，不再顯示出積極想解決的企圖。 2. 反對性理由：美國 U2 偵察機發現到飛彈基地的周圍，也有架設 SAM 防空飛彈，但是蘇聯並未發射 SAM 飛彈來攻擊 U2 偵察機，難以解釋；美國偵察到飛彈基地時，MRBM 已經安裝完成，但 IRBM 設施後來卻一直沒有完成，這種進度上的不合理也很難解釋；古巴島上的飛彈基地，都缺乏掩護偽裝，很容易被偵查到，這也不合理。 ### 三次柏林危機 #### 第一次柏林危機 - 1948 年 2 月至 6 月 - 1949 年 5 月 30 日通過基本法 - 1949 年 10 月 7 日東德通過憲法 #### 第二次柏林危機 1958 年 11 月，蘇聯要求西方在六個月內撤出西柏林，否則蘇聯將使西柏林的過境檢查改由東德處理。英美法拒絕，並宣稱不惜訴諸武力。蘇聯軟化，表示六個月並非最後期限，最終美國同意收回期限，願意召開英美法蘇會議。 #### 第三次柏林危機 - 1961 年 6 月美蘇維也納峰會，赫魯雪夫又要求西方撤出，否則將與上次相同方式。蘇聯暫停復員並將軍費增加 $1/3$，甘迺迪要求國會增加 $32.5$ 億軍事預算，徵召[國民兵(National Guard)](https://zh.wikipedia.org/zh-tw/%E7%BE%8E%E5%9C%8B%E5%9C%8B%E6%B0%91%E8%AD%A6%E8%A1%9B%E9%9A%8A)入伍 - 1961 年 8 月，蘇聯與東德政府封鎖東西柏林邊界，8 月 15 日開始建起圍牆，西方國家無法阻擋蘇聯，同時單方面撕毀禁核試協議值得討論的問題是：「為什麼要蓋圍牆？」主要原因是蘇聯沒有辦法告訴民眾在制度上佔弱勢，而避免東德人民逃去西方。 [^1]:通常來說，孤立(isoloation)一詞在後方多會加上介系詞 "from"，代表「孤立於$\cdots$」，而英國光榮孤立政策的對象為彼時的「歐洲大陸(European Continent)」。除非歐陸出現一個國力強大，威脅到英國國土的政治實權，否則作為懸掛在北大西洋的英國不會主動介入歐洲列強鬥爭，其為一種**無固定型態之結盟**。 [^2]:新自由主義者認為，國家主要尋求的是物質性的政策選項，而建構主義者則指出，國家追求的為理念性的政策選項。 [^3]:一般國家，尤其是自認為霸權的美國，若在戰爭時面臨軍力崩潰，出現大量傷亡時，將會增加大量軍力以進行報復。因此人質效應帶來的是戰爭之前「嚇阻」(deter)的效果，而非戰爭時的政策工具。 [^4]:射程約1100英哩，能威脅到美國東南部。 [^5]:射程約2200英哩。 <div class="likecoin-embed likecoin-button"> <div></div> <iframe scrolling="no" frameborder="0" src="https://button.like.co/in/embed/xiaolong70701/button?referrer=hackmd.io"></iframe> </div>