囚徒困境
在博弈論中,含有占優(yōu)戰(zhàn)略均衡的一個著名例子是由塔克給出的")博弈模型。該模型用一種特別的方式為我們講述了一個警察與小偷的故事。假設有兩個小偷A和B聯合犯事、私入民宅被警察抓住。警方將兩人分別置于不同的兩個房間內進行審訊,對每一個犯罪嫌疑人,警方給出的政策是:如果兩個犯罪嫌疑人都坦白了罪行,交出了贓物,于是證據確鑿,兩人都被判有罪,各被判刑8年;如果只有一個犯罪嫌疑人坦白,另一個人沒有坦白而是抵賴,則以妨礙公務罪(因已有證據表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。如果兩人都抵賴,則警方因證據不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。下表給出了這個博弈的支付矩陣。
A╲B | 坦白 | 抵賴 |
坦白 | 8,8 | 0,10 |
抵賴 | 10,0 | 1,1 |
對A來說,盡管他不知道B作何選擇,但他知道無論B選擇什么,他選擇"坦白"總是最優(yōu)的。顯然,根據對稱性,B也會選擇"坦白",結果是兩人都被判刑8年。但是,倘若他們都選擇"抵賴",每人只被判刑1年。在表2.2中的四種行動選擇組合中,(抵賴、抵賴)是帕累托最優(yōu),因為偏離這個行動選擇組合的任何其他行動選擇組合都至少會使一個人的境況變差。但是,"坦白"是任一,人的活動動影像動因復雜,所以囚徒困境只能作為簡化模型參考,具體決策還得具體分析。
智豬博弈
一、經濟學中的"智豬博弈"(Pigs'payoffs) 這個例子講的是:
假設豬圈里有一頭大豬、一頭小豬。豬圈的一頭有豬食槽,另一頭安裝著控制豬食供應的按鈕,按一下按鈕會有10個單位的豬食進槽,但是誰按按鈕就會首先付出2個單位的成本,在去往食槽的路上會有兩個單位豬食的體能消耗,若大豬先到槽邊,大小豬吃到食物的收益比是9∶1;同時行動(去按按鈕),收益比是7∶3;小豬先到槽邊,收益比是6∶4。那么,在兩頭豬都有智慧的前提下,最終結果是小豬選擇等待。
"智豬博弈"由納什于1950年提出。實際上小豬選擇等待,讓大豬去按控制按鈕,而自己選擇"坐船"(或稱為搭便車)的原因很簡單:在大豬選擇行動的前提下,小豬選擇等待的話,小豬可得到4個單位的純收益,而小豬行動的話,則僅僅可以獲得大豬吃剩的1個單位的純收益,所以等待優(yōu)于行動;在大豬選擇等待的前提下,小豬如果行動的話,小豬的收入將不抵成本,純收益為-1單位,如果小豬也選擇等待的話,那么小豬的收益為零,成本也為零,總之,等待還是要優(yōu)于行動。
用博弈論中的報酬矩陣可以更清晰的刻畫出小豬的選擇:
小豬 | |||
行動 | 等待 | ||
大豬 | 行動 | 5,1 | 4,4 |
等待 | 9,-1 | 0,0 |
從矩陣中可以看出,當大豬選擇行動的時候,小豬如果行動,其收益是1,而小豬等待的話,收益是4,所以小豬選擇等待;當大豬選擇等待的時候,小豬如果行動的話,其收益是-1,而小豬等待的話,收益是0,所以小豬也選擇等待。綜合來看,無論大豬是選擇行動還是等待,小豬的選擇都將是等待,即等待是小豬的占優(yōu)策略。
在小企業(yè)經營中,學會如何"搭便車"是一個精明的博弈策略的主要目的不正是使用謀略最大化自己的利益嗎?
美女的硬幣
一位陌生美女主動過來和你搭訕,并要求和你一起玩?zhèn)€游戲。美女提議:"讓我們各自亮出硬幣的一面,或正或反。如果我們都是正面,那么我給你3元,如果我們都是反面,我給你1元,剩下的情況你給我2元就可以了。"聽起來不錯的提議。如果我是男性,無論如何我是要玩的,不過經濟學考慮就是另外一回事了,這個游戲真的夠公平嗎?
紳士/美女 | 女正面 | 女反面 |
正面 | 3,-3 | -2,+2 |
反面 | -2,+2 | 1,-1 |
假設我們出正面的概率是x,反面的概率是1-x。為了使利益最大化,應該在對手出正面或反面的時候我們的收益都相等,不然對手總是可以改變正反面出現的概率讓我們的總收入減少,由此列出方程就是3x+(-2)*(1-x)=(-2)*x+1*(1-x)
這個方程通俗的說就是在對手一直出正面你得到的利益,和你對手一直出反面得到利益是一樣的且最大。解方程得x=3/8,也就是說平均每八次出示3次正面,5次反面是我們的最優(yōu)策略。而將x=3/8代入到收益表達式3*x+(-2)*(1-x)中就可得到每次的期望收入,計算結果是-1/8元。
同樣,設美女出正面的概率是y,反面的概率是1-y,列方程-3y+2(1-y)=2y+(-1)*(1-y)
解得y也等于3/8,而美女每次的期望收益則是2(1-y)-3y=1/8元。這告訴我們,在雙方都采取最優(yōu)策略的情況下,平均每次美女贏1/8元。其實只要美女采取了(3/8,5/8)這個方案,不論你再采用什么方案,都是不能改變局面的。如果全部出正面,每次的期望收益是(3+3+3-2-2-2-2-2)/8=-1/8元
如果全部出反面,每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。而任何策略無非只是上面兩種策略的線性組合,所以期望還是-1/8元。但是當你也采用最佳策略時,至少可以保證自己輸得最少。否則,你肯定就會被美女采用的策略針對,從而賠掉更多。看起來這個博弈模型似乎沒有什么用處,但是其實這可能牽涉了金融市場定價中最重要的一個模型:定價權重模型了。
總的來說"博弈論"其本質是將日常生活中的競爭矛盾以游戲的形式表現出來,并使用數學和邏輯學的方法來分析事物的運作規(guī)律。既然有游戲的參與者那么也必然存在游戲規(guī)則的制定者。深入的了解競爭行為的本質,有助于我們分析和掌握競爭中事物之間的關系,更方便我們對規(guī)則進行制定和調整,使其最終按照我們所預期的目的進行運作。