跳到页脚
作者 Joost Huizinga的帖子

Joost Huizinga

Joost Huizinga
1篇雷竞技到底好不好用博客文章 2个雷竞技是骗人的研究论文
Joost Huizinga是Uber 雷竞技是骗人的AI的研究科学家。

工程博客文章雷竞技到底好不好用

Montezuma的复仇是由Go-explore解决的,这是一种用于硬探索问题的新算法(在陷阱上也设置了记录)

0
Montezuma的复仇是由Go-explore解决的,这是一种用于硬探索问题的新算法(在陷阱上也设置了记录)

肯尼斯·奥·斯坦利(Kenneth O. Stanley)和杰夫·克莱恩(Jeff Clune)共同培训。

在深度加强学习(RL)中,解决了Atari游戏蒙特祖玛的复仇陷阱一直是一个巨大的挑战。这些游戏代表了一系列具有挑战性的现实世界中的问题

雷竞技是骗人的调查报告

Go-explore:一种新方法来解决硬探索问题

A. Ecoffet,,,,J. Huizinga,,,,J.雷曼,,,,K. Stanley,,,,J. Clune
强化学习的巨大挑战是智能探索,尤其是当奖励稀疏或欺骗性时。两次Atari游戏是这种艰苦探索领域的基准:蒙特祖玛的复仇和陷阱。在这两种游戏中,当前的RL算法的性能都很差,即使是那些具有内在动机的算法,这是提高硬探索域性能的主要方法。[...][PDF]
2019

通过与组合多目标进化算法的许多步进结石一起发展的多模式机器人行为

J. Huizinga,,,,J. Clune
加强学习(包括进化机器人技术)的一个重要挑战是解决多模式问题,在这种问题上,代理必须根据情况以质量不同的方式行事。由于多模式问题通常很难直接解决,因此利用分阶段的优势很有帮助,在此艰巨的任务被分为更简单的子任务中,可以用作解决总体问题的踏脚石。[...][PDF]
2017

流行文章