近日,国外一位名叫Peter Whidden的玩家对AI模型进行了50000小时的训练,试图教AI如何玩《宝可梦 红(Pokémon Red)》。
【古榕树】《宝可梦 红》AI游玩视频
由于AI本质上并不关心如何通关游戏,Whidden设定了奖励目标,每当AI发现新东西时就能获得奖励点。这一机制是利用屏幕中像素点变化来触发的,但也导致了AI会长时间盯着有动画效果的水面发呆。
为了让AI更好地进行学习,Whidden还添加了与宝可梦等级相关的奖励机制。然而,这一系统也导致了意外,AI在存放和替换宝可梦时会让奖励分数下降,因此在之后的行动中AI完全避开宝可梦中心,使得队伍得不到治疗,Whidden不得不再次调整奖励系统。
尽管AI不擅长人类行为,但是却能做出了一些更为深奥的行动。Whidden意识到,AI走出奇怪的路径其实是为了保证只需扔出一个精灵球就能捕获野生宝可梦,并非是无意义的行动。
最终,AI花费7千个小时击败了第一个道馆,但在月见山却迷路许久,耗时5万小时后还是没能找到第二个道馆。不过AI也贡献了许多神奇操作,比如最喜欢购买鲤鱼王,累计购买次数超过1万次。并在野外抓捕到小拉达时,会将其命名为AI。