杰弗里系列解決方案之考量-藏刊網

一、紐科姆難題對決策理論的挑戰

紐科姆難題是一個與合理行動相關的決策困境問題。處于紐科姆難題決策情形中的決策者，根據決策理論中的兩個基本原則---最大化效用原則和占優策略原則，得出了完全相反的兩個答案，使得決策者無法確定什么才是合理的行動。

物理學家威廉·紐科姆（W. Newcomb）在考慮囚徒困境問題的過程中，首先構造出紐科姆難題。羅伯特·諾齊克（R. Nozick）了解到這個難題后，于 1969 年撰寫了一篇著名的論文《紐科姆難題和決策的兩個原則》[1] 65~72,標志著紐科姆難題的正式提出。

紐科姆難題體現了作為決策論中最重要且最基本的兩個原則，也就是最大化效用原則與占優策略原則之間的沖突。諾齊克在《理性的性質》一書中談到紐科姆疑難研究之意義時寫道：

經濟學家和統計學家已經發展出一種有關合理決策的精心制作的理論，并將其廣泛運用到理論與政策研究之中。這是一種具有數學嚴格性的，既強有力而又容易掌握的理論。雖然它作為實際行為的描述之充分性已受到廣泛質疑，它仍然是有關合理決策所應滿足條件之研究中居于支配地位的標準理論。我認為，這種標準決策理論需擴充到與行為的符號意義及其他有關因素的明晰思考相結合，而關于當前標準理論之不充分性認識的一個有益入口，是由紐科姆問題提供的。

在學界，紐科姆難題因此引起了廣泛的關注。

紐科姆難題有很多版本，以下采自諾齊克最原始的表述：

假定一個擁有超能力的生物，他能夠預測你的選擇（或者你也可以把它想象成一個科幻故事中外星來的生物，擁有先進的科學技術，同時也是非常友好的等等）。你知道這個生物過去常常能正確地預測出你的選擇（至少到目前為止，對你的選擇沒有做過錯誤的預測）。此外，你還知道這個生物經常正確地預測到其他人的選擇，而且其中很多人都處于與你類似的情形中?，F在有兩個盒子：盒子 B1 和盒子 B2.B1 是透明的，里面有 1000 美元。B2 是不透明的，里面有 100 萬美元，或者什么也沒有。B2 里面是否有錢取決于接下來發生的事情。首先，超級生物做出預測。他知道你面臨兩個選擇，或者拿走兩個盒子，或者只拿走盒子 B2.接下來，（1）如果生物預測到你會拿走兩個盒子，他就不把 100 萬美金放在 B2 里。（2）如果生物預測到你只拿走 B2,他就會放 100 萬美元在里面。于是首先由超級生物作出預測，然后把錢放進 B2,或者沒有放，取決于他是怎么預測的?，F在輪到你來做決策，你知道超級生物知道的信息。你會怎么做？

在紐科姆難題的決策情形中，決策者必須在兩個可能的行動中作出決定，這意味著有兩種可能的世界狀態。據此，諾齊克給出了兩個相反的但是同樣合理的論證。根據最大化效用原則建議，應該是只拿走一只盒子，也就是盒子 B2.根據占優策略原則的建議，應該是拿走兩只盒子。

以下是諾齊克的“一盒論”論證：（T 表示時間，數字越大，表示時間越晚；數字相同，表示時間一樣。）前提 1:如果我在 T3 拿走兩只盒子，預言家將會在 T1 以很高的概率預測到這些，并且在 T2 不往B2 里面放錢，所以我幾乎能確定地拿到 1000 美元。

前提 2:如果我在 T3 拿走 B2,預言家會在 T1 以很高的概率預測到這些，并在 T2 放 100 萬美元在B2 里，所以我幾乎能確定地拿到 100 萬美元。

結論：因此我應當拿走 B2.

論證過程：令 C 表示置信度，a1 表示拿走兩只盒子，a2 表示拿走盒子 B2,s1 表示盒子里面有 100 萬美元，s2 表示盒子里面沒有錢，此時決策者的置信度為：C（s1|a1）=0.9C（s1|a2）=0.1C（s2|a2）=0.9C（s2|a1）=0.1并且假定決策者可能收益的效用是和可能結果成線性增長，那么可能行動 a1 和 a2 的條件效用是這樣計算的，其中 CU 表示期望效用，a1 表示拿走兩只盒子，a2 表示拿走盒子 B2:CU（a1）=（0.9）（1,000）+（0.1）（1,001,000）=101,000CU（a2）=（0.1）（0）+（0.9）（1,000,000）=900,000因為 CU（a2）比 CU（a1）高，最大化條件效用原則推薦拿走盒子 B2.以下是諾齊克的“2 盒論”論證：

前提 1:預言者已經在 T1 做出了他的預言，把 100 萬美元在 T2 放入了 B2 中，或者沒放。

前提 2:假定預言者 T2 時在 B2 中已經放入 100 萬美元，如果你在 T3 時拿走兩個盒子，你將得到1,001,000 美元，如果你在 T3 時拿走 B2,你將得到 100 萬美元。

前提 3:假定預言者 T2 時在 B2 中不放錢，如果你在 T3 時拿走兩只盒子，那你得到 1000 美元，如果我在 T3 時拿走一只盒子，那你得不到錢。

前提 4:如果你拿走兩只盒子而不是一只，那么任何情況下，你都能多得 1000 美元。

結論：因此你應當拿走兩只盒子。

假定對決策者而言，1000 美元的效用比 0 美元的效用高，1,001,000 的效用比 1,000,000 的效用高。拿走兩只盒子的行動明顯優于拿走一只盒子，所以占優策略原則推薦拿走兩只盒子。

這兩個論證，在同一決策情形中，給出了完全相反的建議。諾齊克認為這體現了合理決策行動中兩個決策原則之間的沖突，也就是期望效用最大化原則和占優原則之間的沖突。

二、杰弗里系列解決方案之考量

紐科姆難題提出以后，很多學者都用大量的精力和時間來提出解決方案。這些解決方案主要分為三個途徑：其一，以杰弗里、艾爾斯方案為代表的證據決策方向；其二，以吉伯德和哈珀方案為代表的因果決策方向；第三，以諾齊克方案為代表的折衷調和方向。

紐科姆難題是于 1969 年提出的，而杰弗里的決策邏輯是 1965 年提出的，嚴格地說，它應該不算是紐科姆難題的解決方案。然而，根據杰弗里的決策邏輯，可以在紐科姆難題中得到只拿走一只盒子的解決方案，因此，從這個意義上，也可以把它算作一種方案。

杰弗里后來（1983、1988、1996）的方案則更為清楚地處理了紐科姆難題。他把紐科姆難題看做是自己提出的決策邏輯的反例，從而在 1983 年提出了可能行動效用的新定義，以及一個不同的最大化原則，與他原來的決策邏輯背道而馳。然而他的新理論，也遇到和紐科姆難題不同的反例。于是 1988 年，杰弗里又回歸到他的決策邏輯立場，宣稱他的邏輯足夠給紐科姆難題以解決方案，但有一個前提，就是紐科姆難題要在兩個層面上進行概率化：第一個層面是決策者拿走盒子 B2 或者拿走兩只盒子的未知概率，而另一個層面是決策者的可信度，決策者的可信度有助于了解這個未知的概率是多少。1996 年杰弗里通過對決策者的置信度添加限制條件來改進了他的決策邏輯，并提出了對紐科姆難題的解決方案。

1.杰弗里 1965 年的解決方案

杰弗里 1965 年的解決方案是基于他的決策邏輯而提出的。他指出，決策者的置信度和效用應當服從克格莫洛夫的三條公理和他本人提出的效用公理。這四條公理一起推出的結果與杰弗里計算可能行動的條件效用結果是一致的，決策者應當使用下面的方式來計算可能行動的條件效用：

如果 C（ai）>0,那么CU（ai）=mj=1Σc（sj1ai）u（oij）此外，決策者應當使用最大化條件效用原則。在紐科姆難題中，分別計算拿兩只盒子的條件效用，和拿走 B2 的效用相比，B2 的條件效用更高，因此，決策者應當拿走 B2.

然而，杰弗里的決策邏輯提供的解決方案在紐科姆難題上連杰弗里本人都不滿意。這個方案是不準確的，因為它給出了錯誤的建議，也就是只拿走盒子 B2.這個錯誤根源于杰弗里決策邏輯自身所具有的兩個缺點：第一，在他的理論中并沒有考慮因果關系；第二，根據他的理論，每個可能的世界狀態的分區都是允許的。不克服這兩個缺點，是很難得出正確答案的。

實際上，杰弗里此時的決策邏輯具有如下特點：

（1）理論是非因果的。杰弗里之所有沒有使用因果關系，是因為他認為只有在賭博中才使用因果關系，因果關系取決于打賭雙方對彼此的信任以及雙方是否能夠兌現諾言的能力。比如，我出 1 美元跟你打賭，如果 C 出現，給你 1 美元；如果 C 不出現，你給我 1 美元。你接受了這個賭局。A 這個命題就是：當知道 C 的真假之后，你給我 1 美元；B 這個命題就是：當知道 C 的真假之后，我給你 1 美元。這樣我們就在 CAB 之間建立了一個因果關系。杰弗里指出這種因果關系和命題（如果油箱沒油，那么汽車無法啟動）之間所具有的因果關系是一樣的。因此，杰弗里認為，如果在決策中使用因果關系，就很難對命題的偏好進行排序。這有一個例子說明這一點。假定有三個命題：A.下個星期有核戰；B.下個星期天氣晴朗；C.硬幣朝上。然后有一個打賭，如果 C,那么 B;如果不是 C,那么 A.杰弗里認為在這個賭局中，決策者就沒辦法對他的偏好進行排序。

（2）決策者可以任意區分可能的世界狀態。在杰弗里的偏好理論中，決策者對可能世界狀態可以進行任意的分區。其原因在于無論用何種方式區分，決策者對可能行動效用的計算都會導出同樣的結果。

（3）決策者對他的可能行動可以指派置信度。因為用命題來表示可能行動，從而決策者可以給可能行動指派置信度。如果決策者相信，他可以實現一個可能行動，那么他指派的置信度為 1.在杰弗里的公式中，置信度是大于 0 的。如果決策者不能確定一個可能行動是否為真，就要給這個可能行動賦予很低的概率，而不能為 0.

（4）根據理論，可以在信息來源中建立偏好。主體采取某種行動不能簡單地描述為使命題 B 為真，而應當描述為改變兩個或更多的命題概率，從 prob B1,prob B2,…，prob Bn 成為 PROB B1,PROB B2,…，PROB Bn.因此在行動中，決策者相信如果他想要的話，就能使得一個可能行動為真。在概率行動的情況中，決策者相信他無法控制使得一個可能的行動為真，只能試圖使它為真?？赡苄袆?A1 的效用比可能行動 A2 的高，就是指在決策者的偏好排序中，可能行動 A1 高于 A2.也就是說，這意味著決策者更歡迎 A1所帶來的信息。據此，杰弗里建立了信息間的偏好。此外，這種理解也解釋了矛盾的命題不可能在命題的偏好排序中出現。同時也解釋了為什么必要的命題不傳遞任何信息。因為這肯定是真的。A 在必要的命題中排序最低，意味著 A 是不好的信息；對決策者而言，相對于 A 是真的消息，其他的消息都是好消息。

A 的排序最高，意味著與 A 是真的這個好消息相比，其他的消息都不是壞消息。A 的排序是必要的，意味著決策者對 A 是否為真無動于衷。

（5）理論中有一個表征性定理。這構成杰弗里決策邏輯的核心。

（6）指出決策者應當服從最大化條件效用原則。

2.杰弗里 1983 年的解決方案

1983 年，杰弗里對他的決策邏輯進行了反思，認為紐科姆難題是他的理論的一個反例，原因有兩個：

（1）他認為他的最大化條件效用原則在紐科姆問題上給出了錯誤的答案，也就是選擇拿走一只盒子；（2）杰弗里指出，如果決策被看做是可能世界狀態的證據，在這些世界中可能的行動不會發生，也不能被阻止，那么此時他的決策邏輯就是錯誤的。

據此，他提出了可接受主義理論?？山邮苤髁x的核心是什么呢？杰弗里說：“一個理性的決策就是這樣一個決策，當主體最終決定如果實施這個行動，根據他所認為的概率矩陣，能夠使預估的目標最大化，那么理性的決策就是實施這個行動?！?/p>

可接受主義指出決策者的最終決策是可能世界狀態的證據，或者是其他決策者的可能行動的證據。因此，基于這個假定，一個可能行動的效用就可以用下面的方式來計算：（此處 sj指稱可能世界狀態，或者任何與不同決策問題相關的決策者的可能行動，dai指稱這樣一個命題，就是決策者最終決定采取的決策[4] 16.）如果 c（dai）>0,那么U（ai1dai）=mj=1Σc（sj1dai）u（oij）在紐科姆難題中，如果我們用行動 A1 表示在 T3 時刻拿走兩只盒子，A2 表示在 T3 拿走 B2,S1 表示預言者在 T1 預言我拿走兩只盒子，在 T2 不往盒子里放東西，S2 表示預言者在 T1 預計到我會拿走B2里的東西，從而在 T2 時往 B2 中放入 100 萬美元，那么，根據可接受主義原則的計算，拿走兩只盒子的決策效用大于拿走一只盒子的效用，從而拿走兩只盒子的決策是理性的。

可接受主義理論也并非完美，杰弗里自己指出他的可接受主義理論有以下幾個缺點：第一，有些決策問題中，沒有可接受的決策。第二，有些決策問題中，所有的決策都是可接受的?！耙粋€主體可能會發現所有的行動都是理性的，因為對任何行動的選擇都能使他預估的愿望最大化---不是通過改變條件概率，而是通過增加支付矩陣中的意向”.在這種情況下，理性決策的數值不一定就是 1,決策者應當在做決策前，重新評估他的信念和愿望。第三，范·弗拉森（van Fraassen）認為，在一些決策問題中，有些值得選擇的可能行動并非是可接受的。作為可能世界狀態的證據，或者是其他決策者的可能行動的證據，有些可能行動比最終決策好。

除此以外，由于引進了最終決策這個術語，使得杰弗里的可接受主義和因果決策理論一樣復雜。

總而言之，在紐科姆問題中，杰弗里的可接受主義理論提出了正確的解決方案，但是對決策者而言，他要求了太多的自我知識。此外，這個理論的應用有限制，不是一個在所有場合都能使用的合理決策理論。最后，這不是一個經濟的合理決策理論。由于引進了最終決策這一概念，可接受主義理論和因果決策理論一樣不經濟。

3.杰弗里 1988 年的概率主義解決方案

鑒于可接受主義的缺點，杰弗里又回到他 1965 年的立場，采用了概率主義。他寫道：“一旦我們發現這里實際上是最終偏好起作用，那么如果紐科姆難題能夠在兩個層面上概率化，第一版（1965）決策邏輯中所提出的證據決策理論似乎是令人滿意的?！?/p>

杰弗里認為他的概率主義既有可接受主義的優點，又避免了范·弗拉森的反例。杰弗里的論證過程比較復雜，因為篇幅所限，這里只給出杰弗里計算最終條件效用的公式：如果 cn（ai）>0,那么Un（ai）=mj=1Σcn（sj1ai）u（oij）此時決策者應當采用最大化最終條件效用原則：在給定的決策情形 D 中，決策者 X1 應當采用能夠使最終條件效用最大化的可能行動。

在紐科姆問題上，杰弗里的概率主義給出了正確的解決方案。然而杰弗里計算最終條件效用的公式是不對的，因為它使用了最終置信度來評價可能行動。

4.杰弗里 1996 年的線性動態決策理論

1996 年，杰弗里提出了第四個方案即線性動態決策理論來解決紐科姆難題。根據線性動態理論，杰弗里認為紐科姆難題根本就不是一個決策問題。

對此觀點，詹姆士·M.喬伊斯[7]指出，杰弗里之所以認為紐科姆難題不是決策問題，因為處于紐科姆難題中的主體，擁有的關于他們的行動和世界關系之間關系的證據是如此之多，使得他們不能把選擇當做是收益的原因，在這個意義上他們本身是沒有自由選擇的。然而杰弗里的推理是錯誤的，因為他沒有認識到主體關于他的可供選擇的信念，是與這些行動的原因密切相連的，以至于他可以制造證據，來權衡行動和世界狀態之間的關系。

當然杰弗里不是唯一一個認為紐科姆難題不是決策問題的人?？ɑ鶢朳8]、伽登納[9]、麥基[10]和施耐辛格[11]也得出了同樣的結論。

麥基認為紐科姆問題不是一個決策問題的理由是：要求參與人在一次博弈中有一個真正的開放的選擇，其中既沒有作弊，也沒有逆向因果，從而使得預言者成功的預言是順理成章的這樣的要求實際上根本無法得到滿足。

施耐辛格的理由是沒有人能夠預測出自由決策。因為即使決策者非常傾向于拿走 B2,即使預測者知道這些，決策者依然可以使用他意志的力量來抵制這種傾向，從而拿走兩只盒子。

三、結語

杰弗里從 1965 年至 1996 年間，在紐科姆問題上的觀點發生了很多轉變，這種對自己理論進行反思的精神是非常值得敬佩的。對他的觀點以及解決方案雖然可以有不同的立場，然而他的努力推動了決策邏輯的發展，這是不容忽視的事實。

[參考文獻]

[1] Nozick,R.Newcomb's Problem and Two Principles of Choice[M]//N.Rescher,D. Davidson,C. G. Hempel.Essays in Honor of Carl G.Hempel.Dordrecht:Reidel,1969.
[2] 張建軍。邏輯悖論研究引論[M].南京：南京大學出版社，2002.
[3] Jeffrey,R. C.The Logic of Decision[M].New York:McGraw-Hill,1965.
[4] Jeffrey.R. C.The Logic of Decision（second edition）[M].Chicago and London:The University of Chicago Press,1983.
[5] Jeffrey,R. C.How to Probabilize a Newcomb Problem[M]//J. H. Fetzer.Probability and Causality.Dordrecht :Reidel,1988.
[6] Jeffrey.R. C.Decision Kinematics [M].K. J. Arrow,E. Colombatto,M.Perlman,C. Schmidt.The Rational Foundations of Economic Behaviour.Basingstoke:Macmillan,1996.
[7] James M. Joyce.Are newcomb problems really decisions?[J].Synthes ,2007,（156）。
[8] Cargile.J. Newcomb's Paradox[J].British Journal for the Philosophy of Science,1975,（26）。
[9] Gardner.M.Free Will Revisited,with a Mind-Bending Prediction Paradox by William Newcomb[J].Scientific American ,1973,（229）。
[10] Mackie.J. L.Newcomb's Paradox and the Direction of Causation[J].Canadian Journal of Philosophy ,1977,（7）。
[11] Schlesinger.G.The Unpredictability of Free Choices[J].British Journal forthe Philosophy of Science ,1974,（25）。

上一篇：雙重意義結構中的分析性... 下一篇：社會實踐中的應用邏輯與...

藏刊網提醒您

藏刊網提醒您