您的位置:首页 >科技 >

被称为Pluribus的人工智能是六人无限制德州扑克的强大对手

2022-09-09 21:16:00   编辑:杜强若   来源:
导读 UPPING ANTE计算机首次在多人扑克中击败了精英人类专业人士。人工智能已经超过掌握扑克的最后一个重要里程碑:六人无限制德州扑克。像扑克...

UPPING ANTE计算机首次在多人扑克中击败了精英人类专业人士。

人工智能已经超过掌握扑克的最后一个重要里程碑:六人无限制德州扑克。

像扑克这样的游戏,隐藏的牌和虚张声势的玩家,对人工智能的挑战要大于每个玩家都可以看到整个棋盘的游戏。在过去几年中,计算机已成为日益复杂的一对一扑克形式,但多人游戏将这种复杂性提升到了一个新的水平(SN Online:5/13/15)。

研究人员在7月11日的“科学”杂志网络版上报告说,现在,被称为Pluribus的卡片鲨鱼已经在六人德州扑克中击败了十几名精英专业人士。可以利用这些不稳定的信息对几个对手进行策划的算法可以成为精明的商业谈判者,政治战略家或网络安全监管机构。

Pluribus通过对抗自己的副本来磨练其最初的策略,从头开始逐步学习哪些行动有助于赢得。然后,人工智能使用这种直觉来确定何时保持以及何时在每手牌的第一轮下注期间对五个人类玩家进行折叠。

在随后的下注轮次中,Pluribus通过想象游戏如果采取不同的行动将如何发挥作用来微调其战略。与为双人扑克训练的人工智能不同,Pluribus没有一直推测到游戏结束 - 在处理这么多玩家时需要进行太多的计算(SN:4/1/17,第12页) 。相反,人工智能想象了未来的几个步骤,并根据那些假设的未来以及玩家可以采用的不同策略决定做什么。

在德州扑克的10,000手牌中,Pluribus与来自13名专业人士的五名参赛者进行了比赛,他们都赢得了超过100万美元的扑克玩家。每100手牌,Pluribus平均从其人类竞争者手中收入约480美元。

“这大致是精英人类专业人士渴望击败弱势玩家的数量,”暗示Pluribus是一个比人类对手更精明的玩家,纽约市Facebook AI Research的诺姆布朗说。布朗与匹兹堡卡内基梅隆大学的托马斯·桑德霍尔姆一起创建了Pluribus。

现在人工智能已经扑克,算法可以测试他们在具有更复杂的隐藏信息的游戏中的战略推理,布拉格捷克技术大学的计算机科学家ViliamLisý说,他没有参与这项工作。Lisja说,在像Kriegspiel这样的游戏中,玩家无法看到对方的棋子 - 未知数可能会比靠近对手胸部的几张牌变得复杂得多。

像“星际争霸”这样的视频游戏,允许更多类型的动作和免费玩家进行严格的回合制游戏,也可以作为人工智能聪明的新测试(SN:5/11/19,第34页)。

免责声明:本文由用户上传,如有侵权请联系删除!

猜你喜欢