当前位置:发号网 > 看资讯 > 手游资讯 > 为了击败DOTA2职业选手,这个AI“自我学习”了两周
DOTA2
2 款礼包 0人已领
5 人已订 订阅礼包
订阅新增礼包微信通知服务!
2013-09-25 | 开放测试

为了击败DOTA2职业选手,这个AI“自我学习”了两周

2017-08-14 18:01:59 来源:九游

近日,来自OpenAI开发的人工智能bot击败《DOTA2》顶级选手Dendi,引起电竞圈轩然大波。

为了击败DOTA2职业选手,这个AI“自我学习”了两周

Dota2 是一款由玩家操作单一游戏角色,进行多人对战的竞技游戏。Open AI 尝试把游戏规则教会给人工智能,之后开始让它不断和自己对战来提高水平。

Open AI 的开发工程师 Jakub Pachocki 介绍说:” Dota 2 的人工智能最开始只会在地图上乱跑,莫名地死于敌人攻击后,它开始学会哪些行为是错误的,逐渐地它开始学会补兵,攻击对面英雄,训练过程中其实没有突然的大突破,就是一点点地升级。基本的学会以后就也逐渐学会比较复杂的操作了。“

Open AI 的网站介绍了人工智能如何通过自我训练来掌握敌人出现后可能会做出的操作数据,并作出最正确的应对。OpenAI 的 CTO Greg Brockman 解释说,Dota2 的人工智能从零开始,训练了一个小时以后就已经可以打过内置的 AI 了,连续训练了 2 个星期的时间后就达到战胜职业玩家的水平。

为了击败DOTA2职业选手,这个AI“自我学习”了两周

令人惊讶地是,在 Open AI 的内部测试中,人工智能已经完全战胜了世界知名Dota2 选手 SumaiL 和 Arteezy 等人。

钥匙体育馆内的比赛也和之前内部测试的结果一样,Dendi 在第一局比赛中以 2:0 告负,而第二局比赛开始仅短短十分钟之后,Dendi 就选择了直接认输,此时AI的实力相比第一局已经更上一个层次,而在此期间并没有程序员为AI添加代码,这就是自我学习。

比赛中AI正在卡兵:

为了击败DOTA2职业选手,这个AI“自我学习”了两周

在此之前的游戏 AI 大多建立在由策划设计的游戏脚本上,AI 的行为完全由脚本触发执行,它的智能程度取决于游戏策划考虑的细致程度,所以和游戏 AI 会在比赛中出现固定的行动模式和大量模仿玩家策略的战术表现。

但 Open AI 的人工智能带来了新的体验。它并不是通过脚本行动,也没有使用模仿学习或者数据搜索,而是从头记录 Dota2 的规则,通过和自我对战来了解每一种行动会产生什么后果,从而预测其他玩家下一步可能的操作,做到了在复杂环境下的随机应变。而仅仅训练 2 个星期就打败 Dendi的 Dota2 人工智能,也计划用长达 1 年的时间来实现可以和人类进行团体对战的功能。

推荐给好友: