具有学习能力的AlphaGO不等于游戏AI
在进行这个话题之前,首先我们需要了解AlphaGO是什么,熟悉RTS游戏的玩家可能会有一种误区,认为AlphaGO就跟电脑AI差不多,因为星际2和魔兽争霸3等游戏都有着人机交互模式,无论何种难度的AI,都会有固定的行为模式,一旦玩家熟练游戏摸到套路,就很容易利用电脑的这些固定行为吊打电脑。
而AlphaGO不同之处是AI是通过屏幕像素去获取信息,而不是从游戏内部读取数据,AI通过观察游戏画面学习精通所有游戏,通过Google提供的强大计算能力,AI能加快训练其他多元素游戏来提高游戏水平,换言之AlphaGO没有固定套路,它能够通过学习进行进化,在之前众人皆知的AlphaGO对阵李世石围棋大赛中,AlphaGO就是在此前通过不停的观看围棋比赛进行学习和不停进行围棋训练,从最初的新手水准,成功进化并最终击败了李世石。因此AlphaGO不存在套路模式问题,这也是AlphaGO震撼世人的原因。
AlphaGO的优势:快速的学习进化能力、无限的APM且操作精准不会失误、同时计算行为的N种结果。
人类对抗AlphaGO的优势有哪些
其实就围棋而言,AlphaGO也是一路输上来的,只是相比人类而言更能缩短训练时间,毕竟它不吃不喝不用休息,AlphaGO打败了李世石并不代表击败了围棋界中的所有人,相比围棋,《星际争霸2》拥有着更为复杂的图像元素和动态即时性,这对于AlphaGO或许是极大的挑战。
看过对阵李世石围棋大赛的人会了解,目前Alphago的直觉和大局观是在大量计算时间的支撑下形成的,每一步棋并没有比李世石耗时间少太多。不同于围棋的回合制,《星际争霸2》挑战即时对策能力,这样就不会提供给AlphaGO相应的思考时间,它必须快速做出反应,而快速做出反应的这一前提条件就是进行大量的演算训练并且有了熟知的套路,一旦有了套路电脑在操作环节会发挥操作上的最大优势,但这也决定了电脑很难临时改变套路和策略,通过战争迷雾看到的信息很容易给AlphaGO造成信息误导从而采取错误的套路。
其次AlphaGO的固有认知来自于大量已经发生过的对局场景,那么只要选手准备一套从未被AlphaGO学习过的战术,AlphaGO就只能以最稳妥保守的战术来应对人类选手的偷袭,这种情况下极容易发生AlphaGO应对不了的局面,也就是人类的可胜之机。
暴雪娱乐制作总监Tim Morten也认为人类会很有优势,《星际争霸2》的特点是你无法提前看到下一步。
当然《星际争霸2》作为最复杂的电子竞技游戏,若能与目前人工智能的顶点AlphaGO真的能够发生碰撞的话,也不失为星际玩家们的一大话题乐事,相信在出现最终结果之前,人机对战的争论还会持久的进行下去。