马斯克的 OpenAI 单挑 Dota 世界冠军,人类 10 分钟惨败

Dendi 输了。如果你玩过 Dota 2,那你多少会对这个名字有点印象。这位出生于 1989 年的乌克兰男孩,是世界上最顶尖的电竞选手之一,曾随队在第一届 Dota 2 国际邀请赛上(The International DOTA2 Championships,简称 Ti)获得冠军,又在后面两届 Ti 斩获亚军。8 月 11 日,万众瞩目的 Ti7 当日正式比赛落下帷幕,之后上演的是一场表演赛。第一位登场的选手是 Dendi,而他的对手是一个 U 盘,里面装着由 OpenAI 开发的 Dota AI。Dota 选手 Dendi,图片来源:liquipediaOpenAI 是由特斯拉 CEO 埃隆·马斯克成立的一家非营利公司,旨在开发更安全的 AI 技术,预防人工智能带来的危害。目前,OpenAI 的全职员工已经超过 50 人。在赛前的宣传片里,OpenAI 开发的 Dota AI 已经打败了现役的 Arteezy、SumaiL 等世界冠军。人机大战一触即发。黑人小哥手中的 U 盘就是参赛 AI规则不是常见的 5V5,而是 Solo 单挑。不能使用瓶子、凝魂之泪、灵魂之戒、神坛等道具,双方都使用影魔(Shadow Fiend)。通过制定这些规则,大大减少了战场的变量、计算量,更彰显出选手的操作硬实力。Dendi 曾经是最强的中单选手之一,但谁也没想到,短短 10 分钟,他就败下阵来。一开局,OpenAI 就展现出堪称完美的卡兵技巧。卡兵,是 Dota 中的一种技术手段,可以让游戏刷出的第一波兵更接近已方的防御塔,从而在对线期时可以获得更大的优势。等到双方开始交锋时,Dendi 与 OpenAI 的差距开始明显地显现出来。无论是补兵还是对点攻击,AI 对距离和时机都把握都更加准确,毫无迟疑。根据 OpenAI 官方给出的数据,AI 每分钟的操作次数(APM)仅仅是人类的平均水准,换言之,AI 的每次出手收益都比 Dendi 更高,无效操作更少。最让人讶异的是,AI 在比赛过程中居然做出了漏补刀的假动作,故意诱骗 Dendi 上前补刀,然后击杀他!以致于 Dendi 在比赛中无奈地抱怨:求不虐……第二局依旧是同样的结果,AI 完虐人类。比赛结束后,OpenAI 的老板马斯克还不忘在 Twitter 上嘚瑟一下:OpenAI 第一次在电竞上完胜世界顶级选手,这可比象棋围棋复杂多了。图片来源:Twitter尽管这场赛事存在诸多限制,1v1 的复杂性与 5v5 也不在一个量级,但 OpenAI 的胜利至少说明,在电竞领域,人工智能的进步比我们想象的还要快。与其他人工智能算法稍有不同的是,OpenAI 并没有通过模仿学习和树搜索策略来进行训练,而是完全通过「自我对决」(Self-Play)的方式来提升自己的水平。在这个过程中,AI 从最早随机浑噩的状态逐渐进化到世界冠军级的单挑水准,仅仅花费了两周的时间。众所周知,一场完整的 Dota 比赛战况是复杂而又难以预料的。由两支队伍进行对决,共有 10 名选手,英雄数量多达上百名,装备更是数不胜数,玩家可以从中做出各种选择——而 OpenAI 的下一个目标,就是组建一支能够与世界冠军们匹敌的 AI 队伍。有了 AlphaGo 的先例,相信这个目标离我们不会太远。题图来源:The Verge

关注微信公众号爱范儿(ID:ifanr),后台回复以下关键词获取热文。  

《智米空调评测:为发烧而生的小米,这次要来帮你退退烧》

  关键词:空调

《关于坐飞机上网,你需要知道的二三事》

  关键词:上网

《ofo 或在年底推出「除霾小黄车」,共享治霾要来了?》

  关键词:霾

《擅长做全面屏的夏普归来,还顺道做了 iPhone 8 的工艺发布会》

   关键词:归来

 谁将杀死《战狼2》里的超级英雄?

  关键词:战狼

相关文章推荐