Chicken:博弈论中社会困境的四种形式

最近在看凯文··凯利的《失控》,相信不少朋友都读过或听过这本大作,书中第5章第5节提到了博弈论衍生出的“社会困境”分为四种变体,分别是“草鸡博弈”、“猎鹿博弈”、“僵局”、“囚徒困境”,然而书中对“僵局”的解释语焉不详,给不少读者造成了疑惑,作者没有深厚的数学知识及博弈论相关的任何专业素养,于是以大家能看懂的方式为这四种模式做个简要分享。

1.什么是博弈论?

博弈论,又称为对策论、赛局理论等,既是现代数学的一个新分支,也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

换成大家容易理解的方式就是:

我预测了你的动作;

你预测了我对你的预测;

我预测你预测到了我对你的预测;

……

然后这样不断重复,直至做出具体动作并得到博弈结果。

这本质上是一个二级混沌,一级混沌不会因为预测而改变,二次混沌则会随着预测而改变结果。

金色财经行情播报丨BTC盘整一周 多空双方仍在博弈:据火币行情显示,在昨晚再次发生短时间的画门走势后BTC终于在今天早晨迎来了小时间级别的连续上涨,但在下午出现的抛盘的压力下价格跌回了9700USDT附近。BTC在9500USDT至10000USDT的价格区间内震荡了一周,而从8500USDT起至10000USDT的价格区间内盘整了一个多月。截至18:30,主流币的具体表现如下:[2020/6/11]

2.草鸡博弈(ChickenGame):

也叫斗鸡博弈、懦夫博弈、胆小鬼博弈,书中的原文是:“草鸡博弈”是供鲁莽的青少年玩的游戏。两辆赛车朝悬崖边奔去;后摔出来的司机是赢家。可谓短小精辟,另一方面也说明了我和很多读者的情况一样,有具体的案例更容易理解。

整体来说“草鸡博弈”是一个博胆行为,狭路相逢勇者胜,我也举个身边的例子,有个朋友说他前两天遇到一个逆行超车的还是左转来着,具体记不清了,总之我朋友是直行,对方理应让行,我朋友说他根本没松油门,反正有保险,最终对方先认怂了。在这里我不是说我朋友的行为正确,而是阐述一个生活中的“草鸡博弈”案例,对方认为继续相向而行的成本太高而率先退出。

市场进入震荡阶段多空博弈加剧 酝酿新行情期间忌重仓操作:据Bgain Digital投研:宏观层面上,全球疫情在周末加剧恶化,在疫苗出现前将长时间存在,经济衰退的风险正在显现。当前,事件驱动型的市场无效性不断增强。投资市场猜底的游戏不断进行,可预见多空博弈继续加剧。

市场层面上,21日交易活跃度下降,合约/现货交易量与大单量双降,当前多空仍较为均衡,6月合约仍维持中性预期。资金方面,USDT增发停止,交易所BTC流入/流出均下降至平日水平。虽然周末币市进入震荡阶段,但疫情进一步发展与政府新一轮潜在刺激手段可能在周末酝酿,周一将充满变数,或在周日晚间提前反映,投资者忌重仓。[2020/3/22]

“草鸡博弈”的结局一定是两败俱伤或者一方败退,换位思考和协议补偿是解决“草鸡博弈”的方式,也就是我可以让步,但是你怎么补偿我?又或者是我想让你让步,我选择用什么来补偿你?古巴导弹危机是“草鸡博弈”在现实中的表现,大家可以想想还有哪些现实事件符合“草鸡博弈”理论。

分析 | BTC多空博弈阶段 下方注意10000点支撑:据Huobi数据显示,BTC现报10102美元,日内跌幅-0.86%。针对当前走势,金色盘面特邀分析师保罗大帝表示:趋势上看,BTC昨夜走出了震荡回落整理的态势,K线图上看是沿着3小时趋势线上轨的窄幅修整,整体的跨度不过100点左右。在最低下探到10053.46的位置,开始企稳向上,可见10000点关口的支撑还是很强有力的。

技术上看,BTC3小时在10200形成了小区间的压力,布林线轨道开始走平,RSI向下发散,K线与7日均线开始粘合,成交量缩量。可见,短周期走势BTC走势缓和,如果没有什么意外消息,行情将会进入窄幅震荡的走势。操作上,建议BTC在10000-10100附近有企稳趋势可试探性多单,跌破10000点止损。[2019/8/28]

3.猎鹿博弈:

也叫猎鹿模型或猎人的帕累托效率,同样祭出《失控》中的原文:“猎鹿”是一群猎手面对的难题,他们必须合作才能把鹿杀死,如果没有人合作的话,那么开小差各自去撵兔子会更好些。他们是在合作还是背叛吗?

猎鹿博弈出自法国启蒙思想家卢梭著的《论人类不平等的起源和基础》,具体内容是:古代的村庄有两个猎人。当地的猎物主要有两种:鹿和兔子。如果一个猎人单兵作战,一天最多只能打到4只兔子。只有两个一起去才能猎获一只鹿。从填饱肚子的角度来说,4只兔子能保证一个人4天不挨饿,而一只鹿却能让两个人吃上10天。这样两个人的行为决策可以形成两个博弈结局:分别打兔子,每人得4;合作,每人得10。这样猎鹿博弈有两个纳什均衡点,那就是:要么分别打兔子,每人吃饱4天;要么合作,每人吃饱10天。并配下图说明:

现场 | 中国金融博物馆理事长王巍:建立更加公平和透明的博弈环境是必要的:8月10日,《Libra:一种金融创新实验》读书论坛暨新书发布会在京举办。中国金融博物馆理事长王巍现场指出,创新与监管存在博弈,但双方都不能做道德评价。真正成功的创新一定是与监管对话和妥协的结果,建立一个更加公平和透明的博弈环境是必要的。今天包括比特币、Libra等都在不同程度的打破垄断。Libra的核心是支付,是普惠金融、P2P、跨境支付,这些特点实际上就是与法币竞争的跨境法币,超主权货币,所以引起了全世界的关注。支付是货币的第一功能,Libra就抓住了这个核心,这让我们可以看一个成熟的市场如何面对Libra创新与监管的磨合。[2019/8/10]

很显然猎兔不是最优选择,并不能充分利用现有资源,也就是没有达成“帕累托效率”,而从各自猎兔的角度看,合作猎鹿是为了达成1+1>2的效果,可以看到这就是典型的“非零和博弈”,国际和企业间的强强联合都可以视作合作猎鹿。然而在猎鹿过程中,谁出卖的力气更多,成功猎鹿后,谁获得的利益更大则是更值得思考的问题。你可以选择上班摸鱼,也可以选择配合老板命令做好项目,但是收益嘛~

现场 | Jeffrey Wernick:ICO没有实际价值 EOS只是一场博弈 比特币才是真正硬通货:金色财经现场报道,6月26日在圣何塞会议中心举行的Blockchain Connect会议上,比特币早期参与者,区块链经济学家Jeffrey Wernick在演讲中指出,ICO就是一群人募集的没有什么实际作用的资金,并没有解决实际的问题,找到更多应用场景,或解决扩展性问题。智能合约也存疑,作用更多的是支持ICO而已。Jeffrey Wernick也对EOS持反对意见,他认为21个超级节点跟技术没有关系,只是一种博弈形式和市场推广形式。比特币才是真正的价值储藏和硬通货。[2018/6/27]

4.僵局

“僵局”是不少读者疑惑的地方,书中表述为:“僵局”是挺无聊的游戏,彼此背叛收益最高。“僵局”到底是什么样的体现形式呢?其实可以参照Deadlock的直译“死锁”,也被译作死结。维基百科给出的名词解释是:计算机科学名词。当两个以上的运算单元,双方都在等待对方停止执行,以取得系统资源,但是没有一方提前退出时,就称为死结。同时维基百科也给出了配图说明:

配图的解释文字是:P1、P2两个process都需要资源才能继续执行。P1拥有资源R2、还需要额外资源R1才能执行;P2拥有资源R1、还需要额外资源R2才能执行,两边都在互相等待而没有任何一个可执行。

是不是有点绕,其实有更简单的说明方式,这里举个例子,假如你要去一个地方,必须路过一条只能通过一辆汽车的小道,这时遇到了对头车,对方和你相向而行,你俩都要通过这条路,结果显而易见,只能有一辆车退出,两辆车才都能去往自己的目的地。

此外还有一个与“死锁”类似的场景叫“活锁”或“活结”,即Livelock,解释是:与死结相似,死结是行程都在等待对方先释放资源;活结则是行程彼此释放资源又同时占用对方释放的资源。当此情况持续发生时,尽管资源的状态不断改变,但每个行程都无法取得所需资源,使得事情没有任何进展。

这个例子更容易举:比如还是这条路,这次你和对面的人都骑自行车,而这条路能容纳两辆自行车并排通过,但是你和对面人一个习惯左边骑,另一个习惯右边骑,然后你们遇上了,很显然你们在同一条车道,这时你和对方都礼貌的换到另一车道让行,不幸的事情发生了,你们“向”上了。这就是“活结”。

“死锁”的解决方案是一方退出占用资源,在计算机系统还可以用重启来重置场景,“活结”的解决方案是双方停止谦让,各自占用各自资源。

5.囚徒困境(Prisoner'sdilemma):

囚徒困境可谓博弈论中最典型的场景,同样先摘原文:

“囚徒困境”是由兰德公司的梅里尔·弗勒德于1950年设计出来的。游戏中,两个分别关押的囚徒必须独立决定否认还是坦白罪行。如果两人都认罪,那么两人都会受到惩罚。如果两人都否认的话,则都会被无罪释放。但假如只有一人认罪,那么他就会得到奖励,而另一个则受到惩罚。合作有回报,但如果策略奏效的话,背叛也有回报。

MBA智库中关于这一段的描述是:囚徒困境最早是由美国普林斯顿大学数学家阿尔伯特·塔克1950年提出来的。他当时编了一个故事向斯坦福大学的一群心理学家们解释什么是博弈论,这个故事后来成为博弈论中最著名的案例。故事内容是:两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;的政策是“坦白从宽,抗拒从严”,如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。

而后MBA智库又做补充说明:1950年,由就职于兰德公司的梅里尔·弗拉德和梅尔文·德雷希尔拟定出相关困境的理论,后来由顾问阿尔伯特·塔克以囚徒方式阐述,并命名为“囚徒困境”。同样配表格解释:

可以看出两人的最优选择是合作,次优选择是两人同时背叛,最差选择时自己选择了合作,而对方选择了背叛。单次“囚徒困境”的随机性相对较大,就像抛硬币一样,但是如果把囚徒困境的次数增加呢,如何能在长期多次的“囚徒困境”中获得最大收益,获胜的策略叫“一报还一报”,也就是“以牙还牙”,实施这个策略需要四个前提:

1.友善:不选择先背叛;

2.报复:报复背叛者,让他下次不敢;

3.宽恕:为了收益最大化,引导之前的背叛者合作;

4.不嫉妒:不去主动争取收益最大化;

从现实情况来看,无论国家行为抑或是企业行为都存在于某一个相对较长的周期中,所以“囚徒困境”很可能是促进社会合作的重要一部分。我们知道在“零和博弈”中选择对抗,在“非零和博弈”中选择合作是最优解,《失控》中同样阐述了零和游戏和非零和游戏的区别:在零和游戏中你总想隐藏自己的策略,但在非零和游戏中,你可能会将策略公之于众,这样一来,别的玩家就必须适应它。也就是之前所说的“一报还一报”。

那么如果在把“囚徒困境”的广度做延伸,不只局限于二人呢,比如高污染企业、森林的乱砍滥伐、渔业的过度捕捞,是否同样适用二人博弈时的策略。或许答案正是《失控》中驳斥的托马斯·霍布斯的理论:只有在善意的中央集权帮助下才能产生合作。

文章部分内容摘自《失控》、维基百科、MBA智库等

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

金星链

币赢Compound:监管加密货币金融的政策蓝图

图一图二 这些服务提供商可能提供与传统金融部门同行类似的服务,但也可以以新的方式提供服务,从而改变与其提供的服务有关的风险性质,或提供新的服务组合.

XLMAPP:比特币和黄金二选一?达里奥:更青睐黄金

来源:智通财经APP 最近,全球最大对冲基金桥水创始人达里奥在接受采访时表示,比特币就像数字版的黄金,但他更青睐黄金。达里奥表示:“如果你拿指着我的头,然后说,‘我只能选一个,’我会选择黄金.

[0:0ms0-0:516ms