全部内容:人工智能打败了世界上最好的扑克玩家

全部内容:人工智能打败了世界上最好的扑克玩家

世界上最好的人造智能扑克玩家似乎知道什么时候持有’em和什么时候折叠’。

据匹兹堡河流赌场(Rivers Casino)的数据显示,一名名为Libratus的人工智能计划在20天的无限德州扑克锦标赛中击败了世界绝对最好的人类扑克玩家,击败了四名对手,扑克筹码达177万美元。 “大脑与人造智能”扑克锦标赛举行。

每天结束时,至少有一个人类玩家正在击败AI计划。但最终还不够。

Rivers赌场总经理克雷格·克拉克(Craig Clark)表示:“我们非常感谢他们的辛勤工作,但遗憾的是电脑赢了。

计算机科学家现在可以将德州扑克添加到越来越多的游戏列表中,包括国际象棋,Go和“Jeopardy!”。AI可以击败世界上最好的人类竞争对手。[ 超智能机器:7机器人期货 ]

自1997年IBM的Deep Blue最佳棋手Garry Kasparov以来,机器人一直在追求人类。去年,AI 在涉及黑白石头的战略游戏中,在世界上最好的Go玩家的一系列比赛中击败了世界。任务非常困难,因为Go包含比宇宙中的原子更多的潜在动作。为了解决这个问题,计算机被称为AlphaGo,使用了一种深入学习的策略,这是一种强大的方法,涉及到在一层计算计算,然后在算法中将其提供给另一层。

然而,在许多方面,德州扑克更加困难,卡内基梅隆大学的计算机科学家Tuomas Sandholm表示,他帮助设计Libratus并帮助组织了比赛。(德州扑克锦标赛中,两名球员每人持有两张牌,然后必须从最后面对面放置在桌子上的五张卡牌中取得最好的牌数,每张卡牌转牌后,玩家可以呼叫或匹配另一个玩家的赌注;提高赌注;或折叠他们的牌,或放弃。)

事实证明,这种类型的游戏可能比掌握Go更棘手,每个玩家都完美地了解对方的位置。

“在不完整的信息游戏像扑克,这很难,”桑德霍尔姆告诉现场科学。

例如,想像你正在对抗对手。你不仅需要考虑你手中的ace ace,还要考虑桌子上的什么,其他玩家可以持有什么,他的下注告诉你他的牌,以及他正在尝试用他的投注学习什么。

所以Sandholm和他的同事们依靠一个不同的概念来编写Libratus。被称为纳什均衡,它是一种数学方法来确定最佳游戏策略,以最大限度地发挥自己的收益,同时最大限度地减少对手的收益。在扑克的任何一个方面,随机机会指出纳什均衡发挥可能会失去,但在许多手中,纳什均衡转化为“无与伦比的游戏”策略,桑德霍尔姆说。

然而,“游戏有10个到160个不同情况的力量”,这意味着它具有比Go更多的计算可能性。因此,该程序无法计算出完美的纳什均衡解,而必须改为近似。

在过去,这是一个绊脚石。Libratus参与了2015年的扑克锦标赛,不能打败人类,比赛结束统计。然而,Sandholm在最近的比赛中使用的Libratus的最新版本具有更好的终端游戏解决策略。

对于“大脑与人工智能”比赛,世界上最好的扑克玩家中有四名在扑克牌手中遇到了一对一对阵Libratus。歹徒是一个20万美元的锅,即使他们输了,人类玩家也会收到。

“他们是专业人士,所以他们正在努力奋斗,真的很难,”桑德霍尔姆说。“他们每天晚上在电脑上都很努力学习,试图在AI上找到洞。”

最后,这不是一个比赛:AI胜过。

作为该计划的一部分,桑德霍姆指出,虚张声势自然地成为一种数学上合理的策略。

它的胜利也涉及到一些惊人的举动。例如,AI比人类更有可能做出巨额的超额收购 – 这意味着他们会打赌三分之一,五甚至20倍的筹码数量。有趣的是,这些overbets有时会在两种非常不同的情况下产生数学意义。

桑德霍尔姆说:“用一把非常强的手和最弱的手,你想要做这些大的超额费用。”

Sandholm说,Libratus在某些令人惊讶的情况下也比人类更容易吞噬。而且每一个晚上,它都回到家里,根据自己的手来改变战略。

Sandholm说:“适应不是要学习利用对手,而是要确定对手在AI战略中发现的洞,并自动补丁这些洞。”

然而,只有凡人有希望。在德州扑克锦标赛中,两名选手参赛。但Libratus不知道如何在五到六名玩家中打败一个扑克牌的玩家。那里,纳什均衡解决方案不起作用,桑德霍尔姆说。

Sandholm说:“我会说这样的顶级人物可能会比最好的AI更好。”

原创文章,转载请注明: 转载自w88优德娱乐中文

本文链接地址: 全部内容:人工智能打败了世界上最好的扑克玩家

文章的脚注信息由WordPress的wp-posturl插件自动生成

Leave a Reply