德州扑克博弈论
作者:棋牌秀     2019-08-07 11:06:43


   扑克和石头剪刀布游戏,以及经济学活动等一切博弈一样,是人与人之间的决策博弈,假设参与博弈的所有人都是完完全全理性的,那么整个博弈就存在最优解,这个最优解叫GTo(Game Theory optimal,博弈最优解)。

    4.1扑克的博弈论

    所调GT0就相当于玩石头剪刀布的两个玩家都是绝顶高手,为了不让对手找到漏洞,采取理想的无漏洞打法,也就是33.3%的石头、33.3%的剪刀、33.3%的布。同理,扑克中的GTO打法,和石头剪刀布游戏里各1/3的策略一样,都是无漏洞策略,虽然无法被对手找到弱点,但是也无法赢对手,属于最佳防守策略。截止到2017年,全球的人工智能在德州扑克领域也一直按照扑克GTO策略制作机器人,2017年来自卡内基梅隆大学的目前世界第一德州扑克人工智 MELibratus能,已经在少量手牌交战中战胜了4位人类高手。之所以能赢人类高手,也是因为短期的波动比较大,人工智能刚好短期走运而已,当然 LIBratus的GTO策略只能保证不输,类似于石头剪刀布各1/3的GT0策略。

    下面我们通过计算石头剪刀布游戏的GTO策略,来直观地看看GT0策略的=4.1.1GTO策略的特征。

    在石头剪刀布中要想赢对手,就必须看到对手策略中的漏洞,我们采取偏离GTO策略的克制对手策略来盈利。

    例如,一个玩家采取GTO策略(石头剪刀布各1/)和我们玩石头剪刀布游戏,我们是无法获利的。

    (1)如果我们改变策略,36%出石头、32出剪刀、32%出布,下注量为100,对手策略不变,情况如下:

    我们36%的概率出石头的时候,对手有13的概率出石头,平局;1/3的概率出剪刀,我们赢100;1/3的概率出布,我们输100。
    我们32%的概率出剪刀的时候,对手有1/3的概率出石头,我们输100;1/3的概率出剪刀,平局:1/3的概率出布,我们赢100。
    我们32%的概率出布的时候,对手有1/3的概率出石头,我们赢1001/3的概率出剪刀,我们输100;1/3的概率出布,平局。

    可以发现,我们和对手都没有盈利。

    无论我们怎么调整策略,“石头:剪刀:=32:36:32”也好,“石头:剪刀:布=32:32:36也好,甚至“石头:剪刀布=100:0:0”,我们最终的盈利都为0,也就是说当对手采取GTO策略的时候,我们是无法获利的,当然对手也无法获利。

更多游戏请关注棋牌游戏导航网棋牌游戏大全在线玩棋牌游戏



评论(0

我要评论


上一篇:没有上一篇了!