肯尼斯·奥·斯坦利(Kenneth O. Stanley)和杰夫·克莱恩(Jeff Clune)共同培训。
在深度加强学习(RL)中,解决了Atari游戏蒙特祖玛的复仇和陷阱一直是一个巨大的挑战。这些游戏代表了一系列具有挑战性的现实世界中的问题…