你听说过Libratus么
在知名扑克人工智能Libratus战胜了一众人类顶级pro,扑克最终会被这些算法支配么?让我们来看看如何知己知彼,变得更强吧。
不把底池大小作为下注量的标准
AI真正的把无限注发挥到了极致。大部分玩家不会太经常全下,除非底池真的很大,但是这正是Libratus的招牌动作。
在无限注扑克和底池限注扑克中,翻牌后的游戏你很少会看到区别。大多数人下注不会超过一个底池。
人们的下注量似乎局限于一个很小的范围 :四分之一的底池、半个底池、四份之三的底池,AI的尺度则比这个宽的多。
学习打牌时,我们经常会问为什么要下注某个量,在没有学习solver之前,这个问题通常很难回答。
人类的下注量有明显的规律,超过一个底池的下注非常少见。就好像底池是一个界限,让你的行动局限于此。
更开放地使用更多变化的大于底池的下注量,底池并不是极限,而是一个参考值。
当然人们也会超额下注,但跟Libratus相比,人类这样做的次数太少了。
AI在做了很大的超额下注后会亮出什么类型的手牌?
它亮出牌范围非常广泛。你会看到一些完全搞不懂的牌。他会用第二大对子持续下注两倍的底池,只要范围中有nuts,就一定打到你上头。
(双11赛事节 最好的实战训练场)
理解阻隔牌的力量
Libratus表现特别好的另一个地方是,能把阻隔牌效应作为整体策略的一部分。
阻隔牌效应就是明白你手里持有的牌会减少对手拿到相同牌的概率。反过来,这会影响你范围的计算和下注策略。
它考虑了阻隔牌的牌面排除然后再创建范围,使得它非常难对付。它非常明白手里的牌会影响对手的范围。
人类能从中学到什么呢?
人类只要思考自己手里的牌会对对手有什么牌造成影响,就能得到提高了。他们在跟注和下注时都应该思考这一点。我是能阻隔诈唬,还是能阻隔他的弃牌呢?
平衡、平衡、平衡
AI和人类最重大的区别在于Libratus策略上的平衡。人类要像AI那样定义一个范围是相当相当困难的。
Libratus会根据每种类型的行动来分配手牌,这事人类做得则没那么好。
它在玩同一手牌时,有时会下注,有时会过牌-跟注,有时会过牌-弃牌。这不会受到对手可能有什么牌的牌面排除的影响。它会平均所有的概率,达到更好的平衡。
人类平均来说在每个方向都会有不平衡存在。在某些情况下,他们的阻隔牌太多了,价值牌又不够。在其他情况下,他们的阻隔牌不够,价值牌又太多了。还有时候你会看到人们弃牌太多了或是下注不够。
如果人们的策略不平衡的话,该如何开始学习?
你唯一能做的就是坐下来,在玩牌之余进行学习。你看到一种情况要思考,‘我这时能下注的所有牌有哪些?有多少是诈唬牌,多少是价值牌?
人们计算过就会发现,‘天哪,我在这里的诈唬好少。’
这是很耗时间的练习,但有时你需要一次又一次来做这个练习才能雕琢出策略,成为更好的扑克玩家。
不要害怕尝试新事物
它直到挑战开始时才跟人类玩家对战。之前它自己跟自己玩了几十亿手牌。
当线上扑克的出现让扑克玩家一个月内玩的手牌数目比Doyle Brunson一生玩的还要多时,线上的天才们改变了游戏的面貌。
Libratus通过跟自己玩了几十亿手牌进行学习。人类做不到这一点。但是玩家不应该害怕尝试新事物,可以客观分析事物是如何运作的。
你有可能尝试新的打法,运气不好输牌然后放弃了。这是不应该的,我们应该更加客观。
在转牌和河牌重新校准游戏
Libratus在转牌后做决策所花的时间更长。
Libratus在更短的时间内做出的决策显然会比人类更准确,但它在转牌会放慢速度,因为它就是这样设计的。当Libratus进入转牌时,它会重新校准策略,用的是一种叫做‘The End Game Solver’的程序。它会在转牌和河牌重新计算策略,使其更接近这个阶段的完美策略。
Libratus会停下来思考30到40秒,考虑从转牌后该怎么打。
人类应该想清楚他们在做什么,转牌时手牌刚好进行到一半,很适合思考到底发生了什么,以及你接下来的计划。
有了这些理论知识,你是否想实践一下在赛场中一展身手呢?
双十一赛事节来袭 最好的实战竞技场
11月7日至11月13日,双11赛事节重磅来袭,福利多多惊喜多多,凑满减不如打比赛,又能享受竞技的快乐还能随手清空购物车!
顶级的赛事体验,绝佳的实战训练基地,丰富多彩的比赛形式,双11赛事节,总有一款比赛适合你。
打双11系列赛,收获多多,快乐多多。