admin发布:2025-04-05 23:25 115
文|胡俊杰
2017年初,化名为Master的AlphaGo(阿尔法狗)在网络上一连击败了60位围棋大师,其中不乏聂卫平、古力等传奇人物,再一次让世界震惊。在围棋界中,人工智能(AI)已经成功挑战甚至超越了人类的极限。
AlphaGo背后的重要“黑科技”,是人工智能的深度强化学习技术。不仅是围棋,很多其他领域也早已受到人工智能的冲击。开发了AlphaGo的Google DeepMind早已将自己的“魔手”伸向了游戏世界,从2014年开始,Deep Mind相继挑战了25款游戏并大获成功,其中就包括知名的雅达利知名街机游戏《功夫大师》。
横扫简单游戏之后,DeepMind开始尝试《魔兽争霸》和《星际争霸》等更复杂的暴雪游戏,但这些挑战以失败告终。
为什么呢?因为《星际争霸》比较“难”。
《星际争霸》是暴雪娱乐研发的一款战争题材的电脑游戏。像真实的玩家一样,AI必须能够学会如何获取资源,建设设施,防守和攻击敌人等等复杂的技能,才能获胜。人工智能的研究分为多个技术问题,其核心问题包括知识、规划、学习、感知、移动和操作物体等等能力。当AI在《星际争霸》中与真人玩家对战的时候,就需要应用这些核心能力。
再加上星际争霸对战的设定和庞大的数据库,在研究员的指导下,AI可以进行机器的自我学习,完成深度学习过程(深度学习是机器学习的一个分支),提高相关方向的能力。
发行了近20年的《星际争霸》,积累了丰富的游戏内容和大量的用户数据,非常适合进行人工智能的开发。DeepMind的研究员Oriol Vinyals说:“游戏对于开发和测试AI算法来说是一个完美的环境。它可以帮助我们更有效、更迅速的开发出灵活的AI算法,并且还可以通过数据提供及时的反馈。”
简而言之,《星际争霸》可以为许多AI开发者提供深度强化学习技术的练兵场。
2016年11月,暴雪娱乐与DeepMind宣布在《星际争霸2》上展开人工智能研究的合作,并且将在2017年第一季度把《星际争霸2》向全世界的人工智能研发者们开放。
AI的自我学习能力是人工智能领域中非常重要的研究方向。李开复在清华演讲时说:“如果这种进步(深度学习)持续,未来人工智能必然会超过人类的表现。”他还列举了许多未来的应用场景:社交媒体营销、智能炒股、互联网金融、医疗诊断等等。他还称:“人工智能会重塑很多亿万级别的领域。”
不过,李开复也提到了现在人工智能研究主要的困难之一就是没有相关的标准或者说统一算法框架。有了公认的算法框架后,就可以利用平台的力量,让更多非专业的人参与进来。李开复说:“为什么iOS、安卓能够做的很好,就是因为它产生了平台化效应。”
具体到用《星际争霸》开发AI上来说,现在还没一套达到平台级的开源开发环境。有了合适的环境之后,星际争霸AI的研究将会迎来快速发展期。
Facebook虽然发布了相关的论文和工具平台TorchCraft帮助机器学习研究者在星际争霸上展开研究。但是TorchCraft并不支持常见的Python编程语言和Google的TensorFlow。TensorFlow是现在主流的人工智能开源工具之一,可以用于各种感知和语言理解任务的机器学习研发。
特斯拉创始人和CEO 埃隆·马斯克(Elon Musk)投资的OpenAI也发布了Gym算法平台,帮助研究者在游戏环境中展开实验,却缺少对《星际争霸》的支持。
在现有的针对星际争霸AI研究的开发工具当中,最有潜力成为平台级工具的,是阿里的Gym StarCraft平台。除了可以使用常见的Python语言进行开发以外,它还整合了现在主流的人工智能开发工具。Gym StarCraft中包含了常见TorchCraft和OpenAI Gym的数据库,也支持基于TensorFlow和Keras等主流算法框架进行开发。
阿里的强化学习技术,曾入选美国权威科学杂志《麻省理工科技评论》(MIT Technology Review)发布2017年全球十大突破性技术榜单。
今年2月,阿里开源了Gym StarCraft平台,开发者们只需要熟悉Gym StarCraft本身的方法和接口,就可以方便地完成星际争霸AI的开发。为了便于评测,Gym StarCraft还被集成在了主流OpenAI Gym评测平台中,支持世界各地的星际AI研究者基于它去进行公平、快捷的效果评估。
在阿里的开发平台上会生长出称霸《星际争霸》的“阿尔法狗”吗?我们拭目以待。
本文章内容与图片均来自网络收集,如有侵权联系删除。
版权说明:如非注明,本站文章均为 凑渣网 原创,转载请注明出处和附带本文链接;
取消回复欢迎 你 发表评论: