人工智能接管扑克世界

11月17日,2020年经过大卫纳门

扑克人工意识形欲为机器施加另一个胜利。

在这篇文章中,我们将讨论叫做Plulibus的人工智能如何终于破坏了扑克中最大的挑战 - 赢得了一个多人职业锦标赛。

但是,为了帮助您更好地了解这一里程碑的特殊程度,我们也会告诉您:

我们不会让您等待,因为我们确定您想要了解更多关于这个令人难以置信的故事。所以,让我们走到它。

另一个人工智能胜利

Tuomas Sandholm.虽然这场胜利是AI的重要里程碑,但它不是扑克演奏计划第一次设法击败扑克专业人士。即,在2017年赌场锦标赛期间AI程序名为Birtarus击败了四名职业球员的双手扑克12万人。

但是,当时,该计划的共同体创造者Tuomas Sandholm.留下了左边)确信,当一次对抗几名球员时,AI无法达到类似的表现。

只有两年后,他已经证明自己错了。他的创作是一个名为Pluribus的AI计划,赢得了无限制的德克萨斯州举行的锦标赛,在此期间,它一次与五名人类专业人士一起玩。在20,000多人手中的在线扑克中,Pluribus赢得了一个虚拟价值48,000美元,击败了世界顶级扑克玩家的15次。每天从池中选择挑战的五名精英人类参与者。每个专业人士赢得了超过100万美元的专业播放比赛。

是什么让这个里程碑如此特别?

AI已经超过了两组或两名球员游戏中的人类,如国际象棋,去,跳棋和两名球员的无限扑克。所有这些游戏都是零和 - 只有一个胜利和一个失去的一面。此外,在这些游戏中,玩家可以看到所有碎片的位置。另一方面,六扑克与类似现实生活的情况更接近 - 一个玩家必须在不了解多个对手资源和决策过程的任何内容的情况下做出决定。

Pluribus计划通过对抗本身的副本来学习扑克。一开始,它播放了六球播的游戏,它只有一个人和五个独立版本的自身。后来,它继续赢得锦标赛的五个职业人类参与者在10,000手中赢得扑克和12天的比赛。虽然Plulibus并没有像Libertus那样高的胜率,但它仍然缺乏非常可敬的胜利率。

虽然有一些证据表明,两位玩家扑克中使用的AI技术将在三位运动员竞争中运作良好,但尚不清楚达到最高专业水平是否足以实现。这一事实是它对六位玩家扑克工作的事实无疑是一个值得注意的里程碑。Tuomas Sandholm说,

在如此复杂的虚空游戏中击败五名球员的能力为AI解决了现实世界问题的新机会开辟了新的机会

这一切顺利

为了达到这个级别,Pluribus从头开始了。它首先随机播放,但随着时间的推移,该计划稳步提高了其性能。经过一周左右,它开发了一种称为蓝图的策略,用于第一轮赌注。庞大的突破导致在六位玩家锦标赛中击败扑克专业人士来自其深度限制的搜索功能。基于可能的对手决策,此功能允许AI预测若干动作并弄清楚迄今为止的游戏的盈利策略。

许多其他扑克播放程序已经使用了类似的搜索组件,但其中大多数是设计用于零和匹配的,其中可能结果的数量有限。对抗五个对手的比赛更复杂,并且需要一个荒谬的计算内存。简单地说,在六扑克游戏中,有太多的情景来预测,基于每个玩家据说的卡片,他们每个人都认为其他玩家,以及基于这些预测的所有投注决策。

Libratus才通过在最终两个(四分之一)投注的搜索中使用搜索来围绕此障碍。尽管如此,该解决方案仍然需要在游戏中使用100个CPU(中央处理单元),只有两个玩家。

因此,Plulibus部署了其深度有限的搜索。使用此技术时,AI首先考虑几个接下来的动作。除此之外,它只会缩小每个模拟的球员的选择,只有四个结果。这种修改的搜索是为什么与游戏AIS中的过去的超人成就相比,程序所需的计算资源和内存较少的原因。具体而言,Pluribus在一台机器上运行,其中两个中央CPU和128千兆字节的内存。将事物放入角度,深入的着名alphano程序在1,920次CPU上运行击败专业的去玩家李塞米尔

卡内基·梅隆大学

据德克萨斯州举行,Pluribus部署了一些令人惊讶的策略,否则它会被播放的专业人士使用。首先,它使用了不同的赌大尺寸 - 一种人类似乎很难做到。此外,该计划采用了一种人类通常避免的策略 - “Donk投注”战略。Donk博彩是一种用呼叫结束第一轮赌注的做法,并在下一轮打开下注。虽然Donk投注被视为扑克专业人士在扑克专业人士中没有意义的薄弱的举动,但是否则发现的Pluribus。

肖恩·罗讷是一个针对vilibus的球员之一解释了为什么争夺计划是如此艰苦的任务。据他介绍,对于人类来说,扑克是一款奖励你的精神纪律,一致性和焦点的游戏,当你缺乏三个时惩罚你。另一方面,AI Bot不必担心这些缺点,这就是使其成为一个强硬的对手。

没有保证

虽然Pluribus表现出人类扑克玩家,但根据称为NASH均衡的博弈原则,没有保证将始终获胜。

纳什均衡发生在非合作游戏中,每个玩家都有一个策略列表,并且没有通过实现不同的方法来提高他们的性能。虽然纳什均衡仍然无法识别德州持有人,但开发人员仍然必须为游戏的六球员找到一个。

我们是否有机会?

杰森les.是一个可能拥有更多经验的玩家,这些玩家比世界上任何其他扑克专业人士都有更多的经验,被黎巴利斯的胜利惊呆了。他声称要了解弱点的所有景点,以及利用AI缺点所需的所有技巧,但尽管他最大的努力,但仍然出现了。据他介绍,Pluribus使用了一个声音,游戏理论最优策略,只能从顶级人类专业人员看,这是意外的。为了结束他的陈述,他说他不会参加这个扑克锦标赛,其中这个AI机器人在桌面上。

许多优势和科学家认为扑克AIS可能会杀死他们试图征服的游戏。事实上,AI可能已经杀死了头上的限制。扑克就像是一款金字塔方案:它需要各种各样的技能水平来支持为大雄鹿队使用的优点。由于人类从机器人迅速学习,每个人都变得良好,技能水平变得均匀,金字塔向下坍塌,游戏模具。

最后的想法

不幸的是,对这些假设有很多绩效。生命改变的发展从根本上改变人类互动,成长和生存的方式。人工智能正在改变世界,我们所能做的就是适应并尽量充分利用它。

谈到涉及大量概率计算和诸如国际象棋或扑克的数学的游戏时,计算机将永远比我们更好。我们的大脑刚刚在这么短的时间内执行大量的数学计算。这是否意味着AI将会破坏扑克?根本没有,这只是意味着游戏会像其他一切一样进化。

你怎么看待这一切?这款机器的胜利是否标志着扑克的结尾?我们很高兴听到您的印象和思想,因此请在评论部分开始辩论。

大卫纳门编辑

首先,我想打个招呼,祝愿热烈欢迎各自赌博的赌博!我的名字是David Nugent,我是主人和主编legalgamblingandthelaw.com。我一直享受各种运动,主要是足球,因为我是一个顽固的埃弗顿的粉丝。

随着时间的推移,我了解更多有关体育博彩的信息,并发现了迷人的网上......

来宾
0.注释
内联反馈
查看所有评论