8 月 11 日,人工智能又给人类带来了惊喜,伊隆·马斯克(Elon Musk)旗下的人工智能研究机构 OpenAI 宣布他们所打造的一个 AI 机器人已经在电子竞技游戏 Dota 2 中击败了一个名为 Dendi 的人类职业玩家,而比赛所采取的形式也是很直接的 1v1。
图丨马斯克第一时间转发了OpenAI获胜的消息
OpenAI 官方解释说,这款 AI 机器人是完全通过自我训练出来的,研究人员从零开始通过过往的比赛视频来对它进行训练。OpenAI 的 CTO 格雷格·布罗克曼(Greg Brockman)表示,训练仅仅花费了两周的时间,AI 就已经击败了包括世界排名第一在内的顶级 1v1 选手。
Brockman 补充道,“通过 1v1 这种形式的训练,我们已经针对 AI 的优势和劣势进行了针对性的训练。”接下来,OpenAI 将训练 AI 一次扮演 5 个选手,这样就可以组成一个完整的战队了。同时,他们还准备将这款 AI 对外开放,让所有人都有机会和人工智能进行对战。
而人工智能介入游戏领域也并非新鲜事,包括 DeepMind 和 Facebook 都已经针对即时战略游戏“星际争霸2”开展了探索之路,他们收集大量的人类玩家游戏比赛记录数据,并用这些数据来训练深度学习算法,最终可以做到在人机大战中击败人类选手。
就在 8 月 10 日,DeepMind 联合暴雪公司正式推出合作开发的星际争霸2机器学习工具组:SC2LE(星际2学习环境),双方希望通过这些工具,帮助研究人员加快星际争霸 2 AI 的开发速度。
SC2LE 包括:
一个由暴雪开发的机器学习API,为研究人员和开发者们提供接入游戏的端口。其中将首次完整包含为Linux系统开发的工具。(GitHub 地址:https://github.com/Blizzard/s2client-proto)
DeepMind的工具集PySC2的开源版,让研究人员可以轻松地在各自的模型中使用暴雪的特征层API。(GitHub 地址:https://github.com/deepmind/pysc2)
一系列小游戏,让研究人员可以对自己系统的性能进行真实的测试。
一个含有6万5千局匿名游戏的数据集,并将在接下来的几周里扩展至50万局游戏以上。
一篇介绍整个环境并提供基线成绩的论文。基线成绩是由小游戏,从游戏回放进行的监督学习,以及与星际2 自带的电脑对手进行单挑的结果得出的。(论文地址:https://deepmind.com/documents/110/sc2le.pdf)
当然,星际争霸 2 还有一些难题暂时没有技术手段解决,比如“战略”。作为一个战略游戏,很多时候,玩家做出的决定往往只会在十几甚至几十分钟之后才会产生效果。因此,为了让 AI 学会“战略”,它必须拥有“计划”和“记忆”的能力。“存储是至关重要的”,DeepMind 星际争霸 2 项目的负责人Oriol Vinyals 说道。
而由于游戏的长度,DeepMind善用的加强学习却并不适合星际争霸 2,“我现在做出的操作可能在很久之后才有后果”,Vinyals说道。由于现有的技术手段无法攻克这一难题,DeepMind 希望降低开发星际争霸 2 AI 的门槛,集众人之力开发出新的技术手段,解决“战略”难题。
可以说,DeepMind 和暴雪联合开发的工具一举打开了通往终极星际争霸2 AI 的大门。目前,已经有数名世界顶级星际2选手表示,愿意与AI一战。
除了星际争霸2,更值得一提的就是在此之前火遍全球的“AlphaGo”热潮,在围棋这个最复杂的棋盘游戏中,人工智能已经将包括柯洁在内的人类最顶尖的棋手都一一击败,这甚至在当时还一度使“AI威胁”的论点甚嚣尘上。
图丨马斯克认为 Dota2 的难度比象棋和围棋大得多
虽然我们还无法评价 OpenAI 的这次实验与 Facebook 和 DeepMind 打造的“星际争霸II” AI 以及 DeepMind 的围棋 AI AlphaGo 孰优孰劣。但到目前为止,的确还没有人工智能研究团队可以击败人类游戏玩家,OpenAI 算是开了个先河。
不过,这对于人类来说可能就没有那么乐观了,“感觉它就像人类选手一样,但又有人类所不具备的优势,”Dendi 对 OpenAI 的人工智能做出了这样的评价。
相关文章
猜你喜欢