双11扑克课堂 | 知己知彼百战不殆 AI的这些绝学你会了么?

2022.11.07 07:26:53 发布

你听说过Libratus么



在知名扑克人工智能Libratus战胜了一众人类顶级pro,扑克最终会被这些算法支配么?让我们来看看如何知己知彼,变得更强吧。

不把底池大小作为下注量的标准



AI真正的把无限注发挥到了极致。大部分玩家不会太经常全下,除非底池真的很大,但是这正是Libratus的招牌动作。


在无限注扑克和底池限注扑克中,翻牌后的游戏你很少会看到区别。大多数人下注不会超过一个底池。


人们的下注量似乎局限于一个很小的范围 :四分之一的底池、半个底池、四份之三的底池,AI的尺度则比这个宽的多。


学习打牌时,我们经常会问为什么要下注某个量,在没有学习solver之前,这个问题通常很难回答。


人类的下注量有明显的规律,超过一个底池的下注非常少见。就好像底池是一个界限,让你的行动局限于此。


更开放地使用更多变化的大于底池的下注量,底池并不是极限,而是一个参考值。


当然人们也会超额下注,但跟Libratus相比,人类这样做的次数太少了。


AI在做了很大的超额下注后会亮出什么类型的手牌?


它亮出牌范围非常广泛。你会看到一些完全搞不懂的牌。他会用第二大对子持续下注两倍的底池,只要范围中有nuts,就一定打到你上头。



(双11赛事节 最好的实战训练场)


理解阻隔牌的力量



Libratus表现特别好的另一个地方是,能把阻隔牌效应作为整体策略的一部分。


阻隔牌效应就是明白你手里持有的牌会减少对手拿到相同牌的概率。反过来,这会影响你范围的计算和下注策略。


它考虑了阻隔牌的牌面排除然后再创建范围,使得它非常难对付。它非常明白手里的牌会影响对手的范围。


人类能从中学到什么呢?


人类只要思考自己手里的牌会对对手有什么牌造成影响,就能得到提高了。他们在跟注和下注时都应该思考这一点。我是能阻隔诈唬,还是能阻隔他的弃牌呢?


平衡、平衡、平衡



AI和人类最重大的区别在于Libratus策略上的平衡。人类要像AI那样定义一个范围是相当相当困难的。


Libratus会根据每种类型的行动来分配手牌,这事人类做得则没那么好。


它在玩同一手牌时,有时会下注,有时会过牌-跟注,有时会过牌-弃牌。这不会受到对手可能有什么牌的牌面排除的影响。它会平均所有的概率,达到更好的平衡。


人类平均来说在每个方向都会有不平衡存在。在某些情况下,他们的阻隔牌太多了,价值牌又不够。在其他情况下,他们的阻隔牌不够,价值牌又太多了。还有时候你会看到人们弃牌太多了或是下注不够。


如果人们的策略不平衡的话,该如何开始学习?


你唯一能做的就是坐下来,在玩牌之余进行学习。你看到一种情况要思考,‘我这时能下注的所有牌有哪些?有多少是诈唬牌,多少是价值牌?


人们计算过就会发现,‘天哪,我在这里的诈唬好少。’


这是很耗时间的练习,但有时你需要一次又一次来做这个练习才能雕琢出策略,成为更好的扑克玩家。


不要害怕尝试新事物



它直到挑战开始时才跟人类玩家对战。之前它自己跟自己玩了几十亿手牌。


当线上扑克的出现让扑克玩家一个月内玩的手牌数目比Doyle Brunson一生玩的还要多时,线上的天才们改变了游戏的面貌。


Libratus通过跟自己玩了几十亿手牌进行学习。人类做不到这一点。但是玩家不应该害怕尝试新事物,可以客观分析事物是如何运作的。


你有可能尝试新的打法,运气不好输牌然后放弃了。这是不应该的,我们应该更加客观。


在转牌和河牌重新校准游戏



Libratus在转牌后做决策所花的时间更长。


Libratus在更短的时间内做出的决策显然会比人类更准确,但它在转牌会放慢速度,因为它就是这样设计的。当Libratus进入转牌时,它会重新校准策略,用的是一种叫做‘The End Game Solver’的程序。它会在转牌和河牌重新计算策略,使其更接近这个阶段的完美策略。


Libratus会停下来思考30到40秒,考虑从转牌后该怎么打。


人类应该想清楚他们在做什么,转牌时手牌刚好进行到一半,很适合思考到底发生了什么,以及你接下来的计划。


有了这些理论知识,你是否想实践一下在赛场中一展身手呢?





双十一赛事节来袭 最好的实战竞技场


11月7日至11月13日,双11赛事节重磅来袭,福利多多惊喜多多,凑满减不如打比赛,又能享受竞技的快乐还能随手清空购物车! 


顶级的赛事体验,绝佳的实战训练基地,丰富多彩的比赛形式,双11赛事节,总有一款比赛适合你。




打双11系列赛,收获多多,快乐多多。

收藏转发

发布
还没有评论,快来发表第一个评论吧 还没有评论,快来发表第一个评论吧