WFU

2019年11月30日 星期六

賽局-03


作者:蔡東霖

前面提到,萬一沒有找到「奈許均衡」,那就要考慮「混合策略奈許均衡」(Mixed Strategy Nash Equilibrium)。




「混合策略奈許均衡」(Mixed Strategy Nash Equilibrium)是說:參賽者的策略必須考慮機率,而沒有其他參賽者能夠透過其他策略來增加他的預期收益。
  • 所以,沒有考慮機率的奈許均衡稱為「純策略奈許均衡」(Pure Strategy Nash Equilibrium)。
  • 如果一個參賽者應該隨機選擇兩種策略,那麼兩者都必須產生相同的預期收益。
  • 錢幣配對賽局(The matching pennies game)具有混合策略,沒有純策略。
  • 性別戰賽局(The battle of the sexes game)有一個混合策略和兩個純策略。
  • 膽小鬼賽局(The game of chicken)與性別戰賽局相似,且有兩種純策略和一種混合策略。
@Bassball: Pitcher vs. Batter 棒球比賽中的投手對打者
  1. 若「投手」投快速球,「打者」決定「早出手」時,「打者」會打到球,球飛得又高又遠,對「打者」而言,結果最好(10);對「投手」而言,結果最差(-10)。
  2. 若「投手」投快速球,「打者」決定「晚出手」時,「打者」打不到球,對「打者」而言,結果不好(-5);對「投手」而言,結果不錯(5)。
  3. 若「投手」投慢速球,「打者」決定「出手」時,「打者」打不到球,對「打者」而言,結果不好(-5);對「投手」而言,結果不錯(5)。
  4. 若「投手」投慢速球,「打者」決定「出手」時,「打者」會打到球,球飛在內野區,對「打者」而言,結果還好(3);對「投手」而言,結果差了點(-3)。
用表格來表示:
投手
快速球
慢速球

早出手
(10 , -10)
(-5 , 5)
晚出手
(-5 , 5 )
(3 , -3)
  • 沒有前面提到的「奈許均衡」狀況,也就是沒有「純策略奈許均衡」。
考慮機率:
  • 「打者」決定「出手」的機率是 q,「晚出手」的機率是 (1-q)
  • 投手」決定「快速球」的機率是 p,「慢速球」的機率是 (1-p)
用表格來表示:
投手
快速球
機率:p
慢速球
機率:(1-p)

早出手
機率:q
(10 , -10)
(-5 , 5)
晚出手
機率:(1-q)
(-5 , 5 )
(3 , -3)
扯到機率,只好進到數學的世界來處理。

想想高中數學的「期望值(Expected value)」:
  • 投手的總報酬:快速球報酬 + 慢速球報酬
    U投手( p , q )= p ( (-10) q + 5 (1-q) ) + ( 1 - p) ( 5 q + (-3) (1-q))
  • 打者的總報酬:早出手報酬 + 晚出手報酬
    U打者( p , q )= q ( 10 p + (-5) (1-p) ) + ( 1 - q) ( (-5) p + 3 (1-p))
接著,想想高中數學「微分(Differential)」中,一個方程式被「微分 = 0」,所代表的意思。(數學細節非屬本文的內容,若需理解,請自行 Google )
  • U投手( p , q )對 p 偏微分 = 0
    ∂ U投手( p , q )/ ∂p = 0 
  • U打者( p , q )對 q 偏微分 = 0
    ∂ U打者( p , q )/ ∂q = 0 
  • 上面兩個等式是一組聯立方程式,求解,得 ( p , q ) = ( 8/23 , 8/23 )
所以,稱此賽局的「奈許均衡」就是 ( p , q ) = ( 8/23 , 8/23 )。

這有一點虛幻,簡單說,此賽局的「均衡狀況」就是:投手用 8/23 的機率投快速球,打者用 8/23 的機率提早打擊。

<PS.>所有英翻中的詞:以「國家教育研究院」所屬「雙語詞彙、學術名詞暨辭書資訊網」的「經濟學領域」的翻譯為主,一般常用翻譯為輔。


歡迎隨時指教討論