当人工智能与猜拳狭路相逢,石头剪刀布还随机吗?
人工智能AI
2020-09-04 11:22:17
  • 点赞
  • 评论
  •   ♥  收藏
  • A
    分享到:

如果说,有一种决策的方法能跨越文化、种族和地域的限制,那么除了抽签这种纯靠运气的方式,恐怕只剩下猜拳了。

猜拳被长久地使用在生活中不需要太多思考的决策里,一般认为,玩家获胜的概率应该是一样的,即恒定的30%左右,从长远来看,这使任意玩家同样有可能赢、平或输。这就是所谓的混合策略纳什均衡,在这种均衡中,每个参与者在每一轮中以相等的概率选择三个行动。

但事实可能并非如此,来自浙江大学的研究团队的研究发现,真正的玩家的策略看起来是随机的,但实际上是由可预测的模式组成的,狡猾的对手可以利用这些模式来获得重要的优势。

具体来说,研究团队开发了一个基于基于n-阶马尔可夫链的人工智能模型——Multi-AI ,这意味着Multi-AI 拥有记忆性,能够向前追溯最多 n 个历史状态并加以利用。研究人员将单个模型结合起来,应对人类玩家的不同性格和策略。

如果人类玩家连续胜利,就会促使 Multi-AI 转向选择其他人工智能模型的更优解。如果人类玩家连续失败,大概率会转换策略,或者打破之前的出拳规律,这时 Multi-AI 也可以随之调整。

这意味着一种不同的博弈策略。即Multi-AI 模型更强调针对不同玩家之间的个性差异、出拳策略,来及时的进行调控,选取当下最适宜的博弈策略。

最终实验结果发现,在和52名人类玩家分别大战300回合之后,人工智能击败了95%的玩家。由于比赛规则是赢+2分,平+1分,输不得分,且参与者均知道获胜会获得金钱奖励,总分越高,赢的钱越多,因此玩家故意放水或者随便乱选的可能性极小。

即便如此,人工智能仍然大胜人类。在最悬殊的一场较量中,人工智能获得了198次胜利,55次平手,仅输了47次,胜率超过人类对手4倍。

当然,这项关于猜拳的最新研究,成果不仅仅是一个很厉害的猜拳人工智能,还是一个很厉害的循环制衡模型分析师,这意味着人类的竞争行为确实有规律可循,而通过使用适当的简单模型就能利用这些规律。研究人员认为,该人工智能模型未来有望拓展到其他博弈场景,比如预测竞争对手的下一步举动,规划更有效的竞选策略,或者制定更有利的定价方案等等。

文章来源:界面新闻

风险提示:本资料仅为服务信息,不构成对于投资者的实质性建议或承诺,也不作为任何法律文件。本资料中全部内容均为截止发布日的信息,如有变更,请以最新信息为准。产品过往业绩不代表未来表现。市场有风险,投资者需谨慎。投资者购买基金时,请仔细阅读基金的《基金合同》和《招募说明书》,自行做出投资选择。

免责声明:转载内容仅供读者参考,版权归原作者所有,内容为作者个人观点,不代表其任职机构立场及任何产品的投资策略。本文只提供参考并不构成任何投资及应用建议。如您认为本文对您的知识产权造成了侵害,请立即告知,我们将在第一时间处理。

(来源:人工智能AI的财富号 2020-09-04 11:22) [点击查看原文]

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500