AlphaStar真的智能了吗?

来源:   时间:2019-03-18 点击数:

“人类发明汽车,飞机,潜艇……实现对自身体力的碾压,但却从未开发出什么工具,实现对智力的碾压。”

2019年1月,谷歌的人工智能AlphaStar在《星际争霸2》中战胜了人类,但它真的实现对人类智力的碾压吗?

人工智能又一次在游戏中击败了人类

2016-2017年,谷歌的人工智能AlphaGo接连在围棋比赛中击败世界顶级围棋选手,点燃了人们对人工智能的热情。

2019年1月,谷歌的人工智能又一次在游戏中击败了人类。这次的人工智能叫AlphaStar,由谷歌旗下的人工智能团队DeepMind开发。它在经典的即时战略游戏《星际争霸2》中,分别以5:0,5:1的成绩战胜了职业选手 TLO和MaNa。

AlphaStar项目由谷歌旗下的人工智能团队DeepMind和暴雪娱乐公司合作展开

(图片来源:DeepMind)

星际玩家:AlphaStar获胜靠的是手速,并不智能

对于这样的结果,星际玩家普遍表示失望,因为在他们看来,比赛中AlphaStar展现的更多是人类难以企及的微操,并没有什么特别具有借鉴意义的战术、战略出现,而他们期望看到的是AlphaStar进行新战术的开发,大局观的理解,并和人类进行智慧互动——所谓真正的人工智能。

在多场比赛中,AlphaStar的APM(每分钟操作)飙到了1000+,持续时间长于1秒,且都是有意义的动作。而目前在星际2,已知的人类最高APM是800+,由顶级职业选手Serral达成,但仅持续1秒不到,且很有可能是垃圾操作。

(图片来源:DeepMind)

AI科学家:AlphaStar获胜是AI研究道路上的里程碑

从玩家的角度,此次AlphaStar对战人类没有展现出让人惊艳的“人工”智能。对人工智能科学家来说,此次胜利却是一个重要的里程碑,它标志着AI技术攻克了即时战略游戏的堡垒。

作为即时战略游戏的经典代表,星际2操作复杂,要求玩家能兼顾局部操作和宏观大局,进行实时决策与行动,对玩家的智力要求较高。开发星际2人工智能的难点集中在,

a. AI要能进行战略学习与探索,因为星际2没有单一的最佳策略(博弈论);

b. AI要能过“侦察”发现信息为星际2玩家的关键信息对对手是隐藏的(不完全信息);

c. AI要学会长远规为星际2当下的一些操作不是立即就有效果的(长远布局);

d. AI需不断进行操作,星际2的操作是实时的,而不是双方轮流(实时);

e. 操作空间足够大且操作需分层,可以修改和扩展(操作空间巨大)。

尽管项目难度大,但研究进展迅速。DeepMind在2016年宣布研发针对《星际争霸2》的人工智能,两年时间就取得了阶段性研究成果,在星际2操作复杂的背景下,显得十分不容易。

在具体技术上,DeepMind采用了监督学习+强化学习的框架,并从多智能体的集体强化学习中汲取灵感,设计出了一个虚拟竞技场AlphaStar League,让每个早期智能体在其中训练(相互PK、学习,并不断迭代)。随着训练时间的推移,智能体的对战水平(MMR)不断提高,部分在14天时间内超越了人类玩家TLO和MaNa。这项技术是极具创新意义的。

智能体在AlphaStar League中进行对战、迭代与强化学习,最终与MaNa对战的智能体是依据纳什分布筛选出来的

详见原文:http://www.sohu.com/a/294455221_610473