Menu
Woocommerce Menu

人类又被AI碾压,这次是星际争霸

0 Comment


图片 1

图片 2

还记得2017年,那个血洗围棋界的“阿尔法狗”吗?

2016年3月,一个名叫AlphaGo的人工智能机器人进入大众的视野。这款由谷歌公司开发,具有“深度学习”的机器人在与世界围棋冠军,职业九段棋手李世石的五局较量中,以4:1的比分获得了胜利。自那之后,AlphaGo便逐渐登上神坛,成为不可战胜的神话。

北京时间1月25日凌晨2点,暴雪与谷歌DeepMind团队合作研究的星际争霸人工智能AlphaStar正式通过直播亮相。按照直播安排,AlphaStar与两位《星际争霸2》人类职业选手进行了5场比赛对决演示。加上并未在直播中演示的对决,在人类vs
AlphaStar人工智能的共计11场比赛中,人类只取得了一场胜利。

图片 3

关于人工智能进军电竞领域的消息,近几年一直流传不止。1月25日凌晨2点,由AlphaGo团队与暴雪合作研究的星际争霸人工智能“AlphaStar”正式通过直播亮相。

这场大战以人工智能的近乎完胜而告终。从结果来看,人类似乎很快就无法在《星际争霸2》这款难度非常高的游戏上与人工智能相抗衡。

这个由谷歌旗下 DeepMind 公司开发的 AI
,对阵世界顶尖围棋选手,打出完全碾压式的战绩:

在直播中,AlphaStar与两位《星际争霸2》职业高手进行了11局对抗。结果并没有太出乎大家的意料,AlphaStar与以10:1的比分完胜人类。根据官方透露,为了这场对决,AlphaStar足足准备两年之久。早在2016年,AlphaStar团队就收集了6.5万场比赛的数据来对AI进行训练。当前版本的AlphaStar,在疯狂难度模式下的胜率已经达到了50%。要知道,即便是天赋异禀的职业选手,也很难在两年时间内达到世界顶尖水平。这场“人机大战”人工智能再次展现出了他恐怖的学习能力。

本文将会以较专业的星际技战术角度出发,通过较为通俗的讲解,帮助大家理解这场胜利的意义究竟在哪里。

AlphaGo vs. 樊麾 – 5 : 0

赛后,电竞圈知名人士,一直在星际领域颇有研究的黄旭东也发表了自己的看法。他表示,虽然AlphaStar还有很多缺陷,但是已经对它的学习能力感到哦折服。同时,AI进入星际领域,肯定会对现有的战术打法和游戏平衡性产生深远的影响。

(特别鸣谢KevinLiu对本文中人工智能专业内容指导)

AlphaGo vs. 李世石 – 4 : 1

机器和人虽然是在同一个领域对抗,但还是有着非常大的差别。AlphaStar在操作上不会失误,心态也不会发生变化。而对于人类来说,这是很难办到的。那么,当人工智能与英雄联盟职业选手进行对抗时,又会是怎样的结局呢?

1.
这场胜利真的意味着《星际争霸2》中人工智能已经可以战胜顶尖人类了吗?

AlphaGo vs. 柯洁 – 3 : 0

尽管这次比赛人类没有派出当前实力最强状态最好的职业选手出战,但显然已经有很多朋友希望通过人工智能是否已经具备战胜人类职业选手的实力来参考不久的未来人工只能是否有机会击败全人类。

那时人们都绝望地说,在围棋上,人类可能再也赢不了AI了。

所以回答这个问题其实需要一个必要条件。那就是看如何看待挑战人类的人工智能。以绝大部分星际2的专业人士看法,如果人工智能战胜人类,应该是通过和人类差不多的操作或是比人类对游戏更先进的战术理解来取胜,才足以让人信服。

很遗憾,这就是棋类游戏的现状。

那么这次比赛中两位输给人工智能的选手能够让人信服吗?

去年,阿尔法狗的终极版AlphaZero,已经在国际象棋、将棋和围棋三种棋类游戏中,全面超越人类。

恐怕很难。

DeepMind 与它的阿尔法 AI 大军,在吊打了各路顶级选手之后,甩下一句话:

第一个出战的TLO在比赛中使用了他不擅长的种族,所表现出的技战术实力只能达到普通业余玩家的水平,甚至连业余高手都略有勉强。那么自然也就没有了参考战胜职业选手的意义了。只能说,与TLO对决的这款AlphaStar,已经拥有了在PvP(神族vs神族)对抗中略强于一些业余玩家的技战术水平了。

“下次我们想试试打星际争霸。”

第二个出战的MaNa可是正经的使用最擅长种族的职业选手了,巅峰时期也曾拿过暴雪世锦赛的亚军。但MaNa依然输给了人工智能。

那时候,是2016年。经过两年多的训练,这一天,终于来了。

这场胜利有参考意义吗?

昨天,DeepMind
和暴雪进行一场直播,秀了一把他们在《星际争霸II》中,与人类选手对战吊打的成果。

客观的说,还有异议。

图片 4

大部分人持反对意见的原因非常明显,战胜MaNa的这款AlphaStar拥有着超乎人类生理极限的操作能力。

这一回,出场的选手,是阿尔法狗的亲戚 AlphaStar

毕竟人类希望和围棋一样,在一个相对平等的条件下与人工智能对决,从而让人类认识对这个游戏玩法的认知积累是否还存在缺陷。

暴雪邀请了,来自职业战队 Team Liquid 的两位职业选手, TLO 和 MaNa,和
AlphaStar 各打了5局。

所以在如何保证平等条件的争论中,是否需要像人类一样模拟受迫性失误、是否需要像人类一样有反应阈值一直都存在激励争议。但在是否拥有超越人类胜利极限的运动能力上,确是争论极少的,毕竟人们在对人工智能对抗人类的主流认知中,是希望人工智能对手也是个虚拟的人。

结果…

回顾MaNa和AlphaStar的那五场大战,以在直播中播放的一场比赛为例,AlphaStar所展示的三线追猎牵制操作是人类几乎不可能完成的。完成这种操作必须要在那长达1分多的时间内保持非常快的手速、精准的鼠标点击、精准的屏幕移动以及距离判断,更重要的是要杜绝人类基本无法克服的受迫性失误。

图片 5图片 6

通俗点说,如果同样是带兵打仗,我的排兵布阵和打仗策略和你差不多,但你的部队不知疲倦,我军打累了要休息而敌军依然还能扛着大刀往前杀,那就有点赖皮了。

被剃了光头,AlphaStar 十局全胜。

除此以外,目前的AlphaStar在技术上仍有很大的局限性。从当天的比赛来看,目前DeepMind能向大家展示的只能局限在唯一的地图、唯一的种族对抗以及唯一的平衡性环境中。相比需要应对每个赛季至少4-5张不一样的地图、三个不同种族对抗、经常修改的平衡性版本的人类职业选手来说,就好比踢足球AlphaStar只和你比射点球,那怎么能算战胜人类?

机哥非常好奇,像星际2这样操作如此复杂的RTS游戏,究竟AI需要强到什么程度,才可以做到“吊打”人类选手?

但从纯粹的技战术角度来讨论,这一次人工智能大战还是给了人类一些启发,主矿的农民分配以及一些运营补农民的思路,确实给了一些核心星际玩家新的思路。

于是机哥借着写稿的机会,在上班时间,公然撸完了,这一场快三个小时的直播,看了个究竟。

尽管抛开单纯的比分结果并不能让我们信服人工智能已经可以挑战甚至战胜职业选手,但从它所表现出的潜力已经学习程度来看,仍然是值得期待的。

AlphaStar 和 AlphaGo 血缘关系密切,训练的方式都非常相似。

2. 人工智能有哪些值得星际专业人士赞叹的地方?

借着暴雪开放星际2 API 的机会,AlphaStar 获得了大量来自玩家的 Replay
档案,借此大量地学习并模仿,真实玩家的操作和战术。

在第一个问题中我们似乎一直在唱衰DeepMind团队研发的AlphaStar。但严格来说,DeepMind首次公开AlphaStar对于星际专业人士来说,仍然超出了预期,非常值得赞叹。

图片 7

和一些命名为人工智能的星际脚本程序相比,AlphaStar更像我们想象的人工智能了,它会灵活的使用战术,作出更像是经过思考后的游戏指令。

像星际争霸这样的即时战略游戏,和之前的各种棋,有着一处关键性的不同——战争迷雾。一种限制玩家获取对方完整信息的机制。

AlphaStar所展现出的学习能力已经非常强大。它甚至已经学会判断优先攻击哪个目标、学会怎样使用对手的战术、以及基础的判断对手的打法和使用反制打法的能力,完成这些在我们看来比较抽象化的逻辑能力,就需要更加强大的算法能力了。

图片 8

更加复杂的算法带来更加拟人化的高级逻辑推理能力也是DeepMind选择用《星际争霸2》来攻克人工智能技术瓶颈的原因之一。对于星际玩家来说
,更加强大的逻辑能力自然有可能会诞生更多人类还没想到的新战术、新运营和新打法体系,这是非常值得期待的。

这样,AlphaStar
就不能像在下棋的时候一样,获得敌我双方的完整信息,必须要有非常强大的预判和即时决策的能力。

3. 未来的《星际争霸2》人工智能vs人类大战会是怎样?

AlphaStar的目标是模拟人类的操作,为了让操作更接近人类,DeepMind
甚至对它的操作做出了各种限制。

要知道这次参赛的AlphaStar只进行了为期一周的自我对练和学习,但学习量已经相当于正常人的200年,这和AlphaGo一样,人工智能有着非常恐怖的算力。但毕竟目前技术水平的人工智能还不能像相对变数更少的的围棋那样完全驾驭和领悟《星际争霸2》这款游戏(在笔者之前撰写的《星际争霸人工智能AlphaStar比赛速记》中对此有详细阐述),因此即使有着
200年的学习量,今天所展示出的AlphaStar对游戏的整体理解能力依然不如只有短短数年学习量的人类强。

比如说,将它的反应速度限制在偏低的 350 毫秒。

以目前的技术水平来看,AlphaStar的技术提升可能会存在很大的瓶颈。如果未来在算法上有较大的技术进步,AlphaStar可能会有非常大的学习进步,那么战胜人类最强职业选手或
是为人类启发新的《星际争霸2》打法就真的可以实现了。

图片 9

届时,AlphaStar自然也就不用再限定死地图和对抗种类,也不用再依靠超过人类极限的操作能力,它会真正意义上的告诉你《星际争霸2》应该怎么玩,会像AlphaGo那样告诉人类:你们的地标最强,在我们看来只是简单电脑;你们公认的最优玩法,完全就是乱打一通。

再比如说,AlphaStar的平均 APM 也在 277 左右,远低于星际职业选手的水平。

4. 你一定会搞混它们:《星际争霸2》中的人工智能与脚本

即使如此,在和两位职业选手的对战中,还是获得了十战全胜,这 AI
真的就这么无敌吗。

其实早在AlphaStar在今天公开打《星际争霸2》之前,很多星际玩家会误以为AlphaStar是一个类似于悍马2000。

图片 10

悍马2000是一个《星际争霸2》的程序脚本,它能够为人类展示人类理想中最完美的游戏操作。比如最广为人知的散枪兵无损杀光毒爆、2000只小狗最低损失冲锋坦克阵。

不好意思,是的,真的是打不过。

这类似
于之前我们提到的超出人类生理极限的操作。此类极限的操作是通过提前在程序中写好了
条件动作
的指令,例如毒爆与枪兵的距离小于某个阀值的时候,触发枪兵向毒爆运动的反方向移动,等等类似指令来实现的。

即使有着诸多限制,AI操作的精度,仍然是人类选手无法达到的。别看人家APM低,不过它可以说没有任何的冗余操作,每一次操作都是有效的。

但如果用悍马2000这样的脚本和人类进行对决其实没有什么实际的意义,因为人类的知识和理解总是有限的,在有限的知识下,写死大量的
条件动作
指令,最后总会有人类无法预知的情况出现,脚本Bot就会陷入困境,从而被人类轻松击败。而AlphaStar是学习型的,通过大量的对局自主学习,优化自己的每一次决策,从而提高自己的游戏水平。这样的人工智能,是能够做出逻辑推导能力,局势分析能力甚至是和对手的心理、战术交互。毕竟《星际争霸2》是一款即时战略游戏。

而人类选手就不一样,人类选手的高APM,参杂了各种热手、误操作和多余的操作,很多时候你以为的骚操作,都是瞎JB浪。

至于脚本与人工智能的区别,相信很多朋友已经能从上文中理解了,脚本只是写死的程序,它不能和你来一次真正意义上的,智能的即时战略游戏对抗;而人工智能会判断你的打法,通过对局势的判断,输出一个最有价值的策略,在人类看来就是它用了多变的打法来挑战你。其实严格的来说,目前以AlphaStar为代表的顶尖技术人工智能也是一个更加高级复杂的脚本,它的所有抉择都是基于相比人类编写的脚本更加高级复杂的推导,学习与拟合。只是最后打出来的结果,以人类的感性视角看来,人工智能具备独立思考能力。

图片 11

5. DeepMind研究AlphaStar的意义?

这回AlphaStar之所以能赢的如此彻底,靠的就是骚操作,精确到每一个单位的骚操作。

在当天在直播结尾,DeepMind提到,AlphaGo通过围棋战胜人类是人工智能AI的一个里程碑。但人类之所以为人类,就是能从不同结果中学习,DeepMind希望找出能和人类一样的自我学习算法。这个长期的计划对于人类在未来意义重大。

图片 12

通过挑战这款每一帧都存在变化、信息不对等还有其他复杂条件的游戏,让人工智能实现新的技术突破,最终以寄希望它能用于人类社会中,造福人类生活。

蓝方:AlphaStar,丝血反杀后撤退

并且,在这10场比赛中,AlphaStar
有着覆盖了所有可见区域的全局视野,就像开了挂一样。人类被碾压,很正常。

图片 13

不过还好,MaNa选手在直播的最后,和AlphaStar打了一场表演赛。这回,人类赢了。

这全都是因为,这一次,AlphaStar使用了另一个版本。这次,它失去了上帝视角,必须像人类一样切换视角观察战场,被MaNa用放风筝战术拖死。

没了视野,任你操作再骚,也要翻车。

果不其然,星际圈流传的老梗诚不我欺:

图片 14

玩笑归玩笑,DeepMind的这次“成果展示”,代表着AI玩家的触手,已经正式深入到了电子竞技领域。

AlphaStar,现已正式约战世界冠军serral。机哥对下一场,还是非常期待的。

人类就真的没有未来么?我不信。

图片 15

换我来,肯定能赢

为了帮助大家让学习变得轻松、高效,给大家免费分享一大批资料,让AI越来越普及。在这里给大家推荐一个人工智能Python学习交流群:705673780欢迎大家进群交流讨论,学习交流,共同进步。

当真正开始学习的时候难免不知道从哪入手,导致效率低下影响继续学习的信心。

但最重要的是不知道哪些技术需要重点掌握,学习时频繁踩坑,最终浪费大量时间,所以拥有有效资源还是很有必要的。

发表评论

电子邮件地址不会被公开。 必填项已用*标注

相关文章

网站地图xml地图