社交账号登录

社交账号登录

0/34

上传头像

拖拽或者缩放虚线框,生成自己满意的头像

头像

预览

忘记密码

设置新密码

智能

击败了 Dota 2 前世界冠军,人工智能只自学了两个星期

罗骢2017-08-14 14:26:57

第二局比赛仅用十分钟就结束了

昨天 8 月 13 日,西雅图钥匙体育馆内,这里正在进行奖金高达 2400 多万美元的第七届 DOTA 2 国际邀请赛(TI7)总决赛。

比赛开始前,世界知名职业选手,曾带领 Navi 战队拿下 TI1 冠军和 TI2、TI3 亚军的 Dendi 准备接受一次神秘的单挑比赛。

但挑战者的座位上却始终空无一人。就在全世界的 Dota 2 玩家都在期待这位挑战者出场的时候, 工作人员走上前,把一个普通的 U 盘插在了挑战者座位上的电脑中,随后,一场由人工智能对战 Dendi 的 DOTA2 比赛正式开始。

这是由特斯拉 CEO 马斯克投资的人工智能研究机构 Open AI 研发的 Dota2 AI 首次公开亮相。

Dota2 是一款由玩家操作单一游戏角色,进行多人对战的竞技游戏。Open AI 尝试把游戏规则教会给人工智能,之后开始让它不断和自己对战来提高水平。

Open AI 的开发工程师 Jakub Pachocki 介绍说:” Dota 2 的人工智能最开始只会在地图上乱跑,莫名地死于敌人攻击后,它开始学会哪些行为是错误的,逐渐地它开始学会补兵,攻击对面英雄,训练过程中其实没有突然的大突破,就是一点点地升级。基本的学会以后就也逐渐学会比较复杂的操作了。“

Open AI 的网站介绍了人工智能如何通过自我训练来掌握敌人出现后可能会做出的操作数据,并作出最正确的应对。OpenAI 的 CTO Greg Brockman 解释说,Dota2 的人工智能从零开始,训练了一个小时以后就已经可以打过内置的 AI 了,连续训练了 2 个星期的时间后就达到战胜职业玩家的水平。

令人惊讶地是,在 Open AI 的内部测试中,人工智能已经完全战胜了世界知名Dota2 选手 SumaiL 和 Arteezy 等人。

钥匙体育馆内的比赛也和之前内部测试的结果一样,Dendi 在第一局比赛中以 2:0 告负,而第二局比赛开始仅短短十分钟之后,Dendi 就选择了直接认输。

AI 正在卡兵

在此之前的游戏 AI 大多建立在由策划设计的游戏脚本上,AI 的行为完全由脚本触发执行,它的智能程度取决于游戏策划考虑的细致程度,所以和游戏 AI 会在比赛中出现固定的行动模式和大量模仿玩家策略的战术表现。

但 Open AI 的人工智能带来了新的体验。它并不是通过脚本行动,也没有使用模仿学习或者数据搜索,而是从头记录 Dota2 的规则,通过和自我对战来了解每一种行动会产生什么后果,从而预测其他玩家下一步可能的操作,做到了在复杂环境下的随机应变。

同时,像围棋、国际象棋等棋类运动,主要在策略和思维层面进行比拼,规则对人类瞬间反应速度要求比较低,在这种模式下人类已经对人工智能弃子认输。更何况是需要通过键盘,鼠标进行快速反应操作的电子竞技游戏,人工智能几乎没有延迟的处理能力带来了极大的优势。

通过游戏,更准确地说,游戏内的模拟场景对于人工智能的研发来说是一个非常理想的场所。在围棋之后,DeepMind、Open AI 和微软都开始了对于游戏训练的研究。

今年 6 月,微软收购的初创公司 Maluuba 开发的人工智能成为第一个在吃豆人游戏里拿到 999990 分完美成绩的玩家。

DeepMind 在上一代雅达利老游戏里轻易击败人类,得分甚至较专业人类玩家高出 20 倍。

但并不是说目前人类就已经在电子竞技游戏里完全输给人工智能。

DeepMind 在最近公布针对暴雪游戏《星际争霸 2》的人工智能项目进展中表示,面对在 84x84 的游戏空间当中,可采取的动作超过了 1 亿个的《星际争霸2》,目前 AI 还需要通过大量学习才能准确执行操作。

而仅仅训练 2 个星期就打败 Dendi的 Dota2 人工智能,也计划用长达 1 年的时间来实现可以和人类进行团体对战的功能。

题图来源:Dota

喜欢这篇文章?去 App 商店搜 好奇心日报 ,每天看点不一样的。