欧美xxxx做受欧美1314,免费人成视频在线播放,卡一卡2卡3卡精品网站,欧美成人看片黄a免费看,久久香蕉国产线看观看猫咪av

博弈論課程考試在線輔導(dǎo)

發(fā)布時(shí)間: 2023-04-22 12:47:54
文章來源: 考而思
摘要:
這樣一個(gè)動(dòng)態(tài)博弈被叫做mechanism selection game。而如果只考慮選擇canonical mechanism, 其reduced form被叫做 canonical (mechanism selection )game

博弈論課程在線輔導(dǎo)找專注留學(xué)生課程輔導(dǎo)的考而思,博弈論專業(yè)老師在線一對(duì)一輔導(dǎo),確保你的博弈論作業(yè),博弈論考試順利通過。

Doval, Laura, and Vasiliki Skreta. "Mechanism design with limited commitment."arXiv preprint arXiv:1811.03579 (2018). ?ECMA R&R

把mechanism定義成一個(gè)tuple [公式]

R為input message (agent的report)

S為output message (principal觀測到的結(jié)果)

b為communication device,把R映射到S

a為assignment rule,把S映射到allocation A上

agent的private information 為 [公式]

full commitment下

根據(jù)revelation principle我們有SP的optimal direct mechanism

===========

假設(shè)現(xiàn)在limited commitment

動(dòng)態(tài)環(huán)境里principal每期選擇一個(gè)mechanism [公式]

s.t [公式]

帶星號(hào)表示finite support的概率

然后這種環(huán)境下的類似revelation principle的機(jī)制被叫做canonical mechanism [公式]

timline

t期開始時(shí),收到公共信號(hào) [公式]

principal選擇當(dāng)期的機(jī)制Mt

agent選擇策略p [公式] :加入 (1)或者不加入 (0) (不加入則獲得一個(gè)null allocation)

加入則釋放私人input [公式]

根據(jù)r生成分布 [公式]

釋放公共output [公式]

根據(jù)s生成分布 [公式]

釋放allocation [公式] ?( [公式] 表示t期時(shí)可能的allocation)

公共歷史(=principal知道的)為 [公式]

私人歷史(=agent知道的)為 [公式]

agent在t期的策略為一個(gè)pair [公式] 分別是參加不參加和參加的話input什么message

[公式] ?這里下標(biāo)表示agent的type v

principal在t期的策略為根據(jù)歷史隨機(jī)選擇一個(gè)機(jī)制 [公式] ,其中M為所有機(jī)制的集合

principal額外還有一個(gè)belief,關(guān)于兩點(diǎn):agent的type和agent的私人歷史

[公式] ?這里 [公式] 為所有可能的私人歷史集合(consistent w.r.t. 公共歷史)

兩個(gè)player的payoff只關(guān)于type v和allocation [公式]

這樣一個(gè)動(dòng)態(tài)博弈被叫做mechanism selection game。而如果只考慮選擇canonical mechanism, 其reduced form被叫做 canonical (mechanism selection )game

其solution concept為PBE: 所有人的策略滿足sequential rationality,belief滿足貝葉斯法則(on path)

Main THM (revelation principle的變種)

對(duì)mechanism selection game的任何PBE而言 ,存在一個(gè)payoff equivalent的PBE滿足

1) 每期選擇的機(jī)制都是一個(gè)canonical mechanism

2) IR: 此PBE下 [公式]

3) SP: [公式]

4) belief Bayes plausible (recommended beliefs coincide with realized beliefs)

又有

Prop: Any equilibrium payoff of the canonical game can be attained in an equilibrium

of the mechanism selection game.

PS:定理的第四點(diǎn)最有趣,因?yàn)樗鼘栴}轉(zhuǎn)換成了一個(gè)information design的Bayes game (當(dāng)然這是一個(gè)帶了IR和SP的constrained information design):

principal在t期當(dāng)sender發(fā)一個(gè)belief給t+1期的principal,t+1期的principal作為receiver根據(jù)這個(gè)updated belief去選擇機(jī)制 (這個(gè)部分主要在文章的第五章,通過構(gòu)造dual problem)

計(jì)算出來的結(jié)果是這個(gè)discount要大于1/3才有理由先采取合作策略,由于案例中概率是0.75,符合條件,所以應(yīng)該采取恐怖扳機(jī)策略。不過老師在計(jì)算what of reward的時(shí)候用的是2(a+a^2+a^3+……),有些疑惑為什么不用乘以1-a,因?yàn)楸热缇屠^續(xù)了兩次,應(yīng)該是a^2*(1-a)才是這個(gè)事件的概率吧,如果是這種計(jì)算方式,計(jì)算出來概率要大于1/2才行。

  對(duì)于任意M 1,N(或M,N 1)的矩陣,假設(shè)存在后手必勝策略

博弈論課程在線輔導(dǎo)

  先手必定可以在第一步采用策略使得矩陣M 1,N轉(zhuǎn)變?yōu)镸,N矩陣

  由于對(duì)于M 1,N矩陣后手存在必勝策略

  那么對(duì)于一個(gè)任意M,N的矩陣,存在先手必勝策略

  令M’=M 1,則對(duì)于M,N存在先手必勝策略

  這與假設(shè)矛盾,所以假設(shè)不成立

  因此對(duì)于M,N=1的情況下,M 1,N矩陣不存在后手必勝策略

  即當(dāng)且僅當(dāng)M=N=1時(shí),有矩陣1x1存在后手必勝策略

  1,不要選擇劣勢策略。2、理性選擇導(dǎo)致次優(yōu)結(jié)果。3、學(xué)會(huì)換位思考。4、將欲取之,必先知之。5、大部分人都是自私的。

  不夠嚴(yán)謹(jǐn)

  1.劣勢策略是指嚴(yán)格下策嗎?嚴(yán)格下策在博弈中自然會(huì)被排除,但如果你所指的是納什均衡相對(duì)的帕累托上策,那相對(duì)劣勢的納什均衡可能還真是選擇的必然

  2.理性選擇不一定是次優(yōu)結(jié)果,在重復(fù)博弈中完全有機(jī)會(huì)通過實(shí)施觸發(fā)策略實(shí)現(xiàn)最優(yōu)結(jié)果

  3.對(duì)于完全但不完美信息動(dòng)態(tài)博弈,不完美信息一方?jīng)]有能力換位思考,因?yàn)閮烧咝畔?yán)重不對(duì)稱

  4.同樣是對(duì)于不完美信息動(dòng)態(tài)博弈,對(duì)于不完美信息一方者,你都不知道,怎么取之?

  5.博弈論的前提是理性人,有限理性等,而不是大部分是自私的,自私這個(gè)東西人人都有,但自私更深層次的是利益最大化,成本最小化,效用最大化等動(dòng)機(jī),并且這種自私并非是單獨(dú)的自私,也可能是群體性自私,比如說國際卡特爾,關(guān)稅同盟等關(guān)于MxN取石子問題:該問題一般被稱為Chomp游戲。


博弈論課程在線輔導(dǎo)


  可以證明除了1x1的情況外,先手有必勝策略。其他網(wǎng)友的評(píng)論已經(jīng)有給出證明方法了,用反證法結(jié)合一個(gè)小技巧即可證明。一般也稱該小技巧為strategy stealing argument。原始證明由 David Gale給出。

  然而,該證明方法只給出了結(jié)論,并未能給出具體的必勝策略。我目前查到的資料顯示該問題的具體必勝策略目前仍未解決。只有一些特例的必勝策略被給出,比如M=N的情況,或者2xN的情況,以及3xN的情況在2002年被解決。

  此外,當(dāng)M和N的規(guī)模較小時(shí),計(jì)算機(jī)編程可以給出具體的必勝策略(應(yīng)該也是用SG函數(shù))。N和M規(guī)模較大時(shí),目前無法解決。關(guān)于MxN取石子問題:該問題一般被稱為Chomp游戲。

  可以證明除了1x1的情況外,先手有必勝策略。其他網(wǎng)友的評(píng)論已經(jīng)有給出證明方法了,用反證法結(jié)合一個(gè)小技巧即可證明。一般也稱該小技巧為strategy stealing argument。原始證明由 David Gale給出。

  然而,該證明方法只給出了結(jié)論,并未能給出具體的必勝策略。我目前查到的資料顯示該問題的具體必勝策略目前仍未解決。只有一些特例的必勝策略被給出,比如M=N的情況,或者2xN的情況,以及3xN的情況在2002年被解決。

  此外,當(dāng)M和N的規(guī)模較小時(shí),計(jì)算機(jī)編程可以給出具體的必勝策略(應(yīng)該也是用SG函數(shù))。N和M規(guī)模較大時(shí),目前無法解決。

  目前只有反證法的那位網(wǎng)友是對(duì)的,其他的構(gòu)造性證明方法都為問題。誰能給個(gè)靠譜的構(gòu)造性證明嗎?

  這是個(gè)典型的impartial combinatorial game,我反向推導(dǎo)可以得到幾個(gè)P-position,比如呈L型且豎直方向的點(diǎn)數(shù)和水平方向的點(diǎn)數(shù)相同時(shí)是一個(gè)P-position,僅有兩行且第2行比第1行少1個(gè)點(diǎn)時(shí)也是P-position,總共N行:最底下兩行為N 1個(gè)點(diǎn),上面的N-2行為2個(gè)點(diǎn)時(shí)也是個(gè)P-position。。。

  但是NxM完整布局的情況實(shí)在過于復(fù)雜,我研究了很多天也沒有找到一個(gè)玩法可以保證先手必勝(但是我們知道先手是必勝的)。

當(dāng)前文章鏈接: http://www.mclx.com.cn/xinwendongtai/5105.html

圖片歸版權(quán)方所有,頁面圖片僅供展示。如有侵權(quán),請(qǐng)聯(lián)系我們刪除。凡來源標(biāo)注“考而思”均為考而思原創(chuàng)文章,版權(quán)均屬考而思教育所以,任何媒體、網(wǎng)站或個(gè)人不得轉(zhuǎn)載,否則追究法律責(zé)任。

17年深耕全階段留學(xué)輔導(dǎo)   數(shù)十萬留學(xué)生信賴

添加微信:「 kaoersi03 」備注官網(wǎng)申請(qǐng)?jiān)嚶?,享專屬套餐?yōu)惠!

同步課件輔導(dǎo)、作業(yè)補(bǔ)習(xí)、論文潤色、真題講解、Appeal申訴、入學(xué)內(nèi)測/面試培訓(xùn)


添加微信【kaoersi03】(備注官網(wǎng))申請(qǐng)?jiān)嚶?,享專屬套餐?yōu)惠!

客服微信

kaoersi03

課程聽不懂?作業(yè)不會(huì)寫?復(fù)習(xí)沒方向?專業(yè)老師為您答疑解惑

復(fù)制成功

微信號(hào): kaoersi03

備注“官網(wǎng)”享專屬套餐優(yōu)惠!