跳到页脚
作者 肯尼斯·斯坦利的帖子

肯尼斯·o·斯坦利

肯尼斯·o·斯坦利
10个雷竞技到底好不好用博客文章 17研雷竞技是骗人的究论文
在加入优步AI实验室之前,Ken是佛罗里达州中部大学计算机科学副教授(他目前在休假)。他是NeuroVolution的领导者(将神经网络与进化技术相结合),在那里他帮助发明了突出的算法,如整洁,CPPN,超容易和新奇搜索。他的想法也通过最近的受欢迎的科学书达到了更广泛的受众,为什么无法计划伟大:目标的神话。

工程博客文章雷竞技到底好不好用

光纤:AI的分布式计算简单

光纤:AI的分布式计算变得简单

项目主页:GitHub.

在过去的几年里,增加加工能力计算机器的发展导致了机器学习的进步。越来越多的算法利用并行性,依赖分布式训练来处理大量的数据......

增强的诗人:通过无限的发明来学习挑战和解决方案的开放式加强学习

0.
增强的诗人:通过无限的发明来学习挑战和解决方案的开放式加强学习

Jeff Clune和Kenneth Stanley在这项工作中是联合高级作者我们的相关研究论文雷竞技是骗人的

机器学习(ml)力量许多技术服务这是UntPin的平台,我们投资于推进基本的ML研究和与之参与雷竞技是骗人的......

生成式教学网络:通过学习生成综合训练数据来加速神经体系结构搜索

0.
生成式教学网络:通过学习生成综合训练数据来加速神经体系结构搜索

Kenneth O. Stanley和Jeff Clune担任本文的共同高级作者其相应的纸

在优步,我们致力于解决的许多难题都能从机器学习中受益,比如改善安全,改善eta,......

介绍Evograd:基于梯度的演化的轻量级库

0.
介绍Evograd:基于梯度的演化的轻量级库

工具,实现快速灵活的实验民主化和加速机器学习研究。雷竞技是骗人的例如,用于自动差异化的图书馆的开发,例如Theano.咖啡纹orflow.,Pytorch.这些图书馆在这方面起了很大作用......

诗人:不断产生越来越复杂和多样化的学习环境和他们的解决方案通过配对的开放式开拓者

0.
诗人:不断产生越来越复杂和多样化的学习环境和他们的解决方案通过配对的开放式开拓者

杰夫·克伦和肯尼斯·o·斯坦利文章的第二作者。

我们感兴趣开放式结束在优步人工智能实验室(Uber AI Labs),因为它提供了一种完全靠自己创造多样化、不断扩大的机器学习课程的潜力。有大量......

Go-Explore解决了Montezuma的复仇,Go-Explore是一种新的算法,用于解决困难的探索问题(在Pitfall上也有记录)

0.
Go-Explore解决了Montezuma的复仇,Go-Explore是一种新的算法,用于解决困难的探索问题(在Pitfall上也有记录)

Kenneth O. Stanley和Jeff Clune是文章的第二作者。

在深增强学习(RL)中,解决Atari Games蒙特萨州的复仇陷阱一直是一个大挑战。这些游戏代表着广泛的挑战性,现实世界问题......

加速深神经发展:在单个个人电脑上用几个小时列车Atari

0.
加速深神经发展:在单个个人电脑上用几个小时列车Atari

我们最近出版的一篇文章在深神经发展中宣布五篇论文包括发现遗传算法可以解决深增强学习问题以及流行的替代品,如深Q学习和政策梯度。这项工作遵循......

可微可塑性:学习学习的新方法

0.
可微可塑性:学习学习的新方法

神经网络,其中许多超级机器学习系统,在解决复杂问题方面,包括图像识别,语言理解和游戏。但是,这些网络通常培训到停止点梯度下降,这......

vine:神经系的开源交互式数据可视化工具

0.
vine:神经系的开源交互式数据可视化工具

在优步的规模下,机器学习方面的进步可以显著增强技术,为更安全、更可靠的交通解决方案提供动力。优步人工智能实验室最近宣布的一项进步是D.燃灯neuroevolution,进化算法,如进化策略......

欢迎深度神经进化的时代

欢迎深度神经进化的时代

肯尼斯·o·斯坦利,杰夫·克伦著

代表优步人工智能实验室团队的还有Joel Lehman、Jay Chen、Edoardo Conti、Vashisht Madhavan、Felipe Petroski Such和Xingwen Zhang。

在深度学习领域,深度神经网络......

雷竞技是骗人的调查报告

纤维:用于加固学习和基于人口的方法的高效开发和分布式培训平台

J. Zhi.r .王Clune j .K.斯坦利
通过越来越多的计算,可以始终如一地实现了机器学习的最新进展。钢筋学习(RL)和基于人口的方法,特别是对潜在的分布式计算框架的效率和灵活性构成了独特的挑战。这些挑战包括与模拟的频繁交互,对动态缩放的需要,以及对不同后端的采用成本低的用户界面的需求。在本文中,我们通过引入光纤,可扩展的分布式计算框架来解决这些挑战,同时仍然保留了对研究和实际应用的开发效率和灵活性,可扩展的分布式计算框架用于RL和基于人口的方法。雷竞技是骗人的[...][PDF]
arxiv

增强的诗人:通过无限的发明来学习挑战和解决方案的开放式加强学习

r .王j·雷曼A. rawal.J. Zhi.Y. Li.Clune j .K.斯坦利
创建开放的算法,产生它们自己的无穷无尽的新奇且具有适当挑战性的学习机会,可能有助于自动化并加速机器学习的进展。在这个方向上,最近的一个步骤是配对开放式开拓者(POET),这是一种生成并解决自己挑战的算法,并允许解决方案在挑战之间进行目标切换,以避免局部最优。在此,我们介绍并验证了原始算法的两个新创新,以及两个旨在帮助阐明其全部潜力的外部创新。[...][PDF]
国际机器学习会议(ICML.),2020年

Evolvenesity es:可扩展和直接优化的进化性

A. Gajewski.Clune j .K. O. Stanleyj·雷曼
设计能够揭示高度不断变化的表示的进化算法是一个开放的挑战;这种进化性很重要,因为它加速了演化并实现了快速适应改变的情况。本文介绍了一种进化性ES,这是一种旨在明确有效地优化进化的进化算法,即进一步适应的能力。[...][PDF]
遗传和进化计算会议(Gecco.),2019年

配对的开放式开拓者(诗人):无休止地生成越来越复杂,不同的学习环境及其解决方案

r .王j·雷曼Clune j .K.斯坦利
到目前为止,机器学习的历史包含了研究人员提出的一系列问题,以及学习这些问题解决方案的算法,但一个重要的问题是,这些问题是否可以在被解决的同时由算法产生。雷竞技是骗人的[...][PDF]
2019年

探索:一种新的硬探索问题方法

答:EcoffetJ. Huizationa.j·雷曼K.斯坦利Clune j .
强化学习的一大挑战是智能探索,特别是当奖励很少或具有欺骗性的时候。有两款雅达利游戏作为这类艰难探索领域的基准:《Montezuma’s Revenge》和《Pitfall》。在这两款游戏中,当前的RL算法表现不佳,即使是那些具有内在动机的游戏也不例外,内在动机是提高艰难探索领域性能的主要方法。[...][PDF]
2019年

Backprapamine:培训具有可分离的神经统计可塑性的自我修饰神经网络

T. Miconi.A. rawal.Clune j .K.斯坦利
强化学习的一大挑战是智能探索,特别是当奖励很少或具有欺骗性的时候。有两款雅达利游戏作为这类艰难探索领域的基准:《Montezuma’s Revenge》和《Pitfall》。在这两款游戏中,当前的RL算法表现不佳,即使是那些具有内在动机的游戏也不例外,内在动机是提高艰难探索领域性能的主要方法。为了解决这个不足,我们引入了一个新的算法,叫做Go-Explore。[...][PDF]
国际学习陈述会议(ICLR),2019年

vine:神经系的开源交互式数据可视化工具

r .王Clune j .K.斯坦利
深度神经发展的最新进展已经证明了进化算法,例如进化策略和遗传算法(GA),可以规模培训深度神经网络以解决困难的加强学习(RL)问题。然而,在这种高维度中分析和解释神经发展的基础过程仍然是一项挑战。要开始解决这一挑战,本文提出了一个互动数据可视化工具,称为Vine(Visual Insevolution),旨在帮助神经发展研究人员和最终用户更好地理解和探索这家算法。雷竞技是骗人的[...][PDF]
遗传与进化计算会议上的可视化研讨会(GECCO),2018年

可微塑性:用反向传播训练塑性神经网络

T. Miconi.Clune j .K.斯坦利
我们如何才能构建出在最初的培训之后,能够从经验中快速而有效地学习的代理?在这里,我们从生物大脑的主要学习机制中获得灵感:突触可塑性,通过进化精心调整,产生高效的终身学习。我们证明了塑性,就像连接权值一样,可以通过带有Hebbian塑料连接的大型(数百万参数)循环网络中的梯度下降来优化。[...][PDF]
国际机会学习会议(ICML),2018年

《数字进化的惊人创造力:来自进化计算和人工生命研究社区的奇闻轶事集》雷竞技是骗人的

j·雷曼Clune j .,D. Misevic,C.Adami,L.Altenberg,J.Beaulieu,P. Benulley,S. Bernard,G.Beslon,D. Bryson,P.Charabaszcz,N. Cheney,A. Cully,S. Doncieux,S. Doncieux,S. Doncieux,S. Doncieux,S. Doncieux,S. Doncieux,S. Doncieux,S. Doncieux,F。Dyer,K.Ellefsen,R.Feldt,S.Fischer,S. Forrest,A.Frénoy,C.Gagné,L. Goff,L.Grabowski,B. Hodjat,F. Hutch,C. Keller,C. Keller,C. Keller,C. Keller,C. Keller,C. Keller,C. Keller,C. Keller,C. Keller,C. Keller,C. Keller,C. Keller,C. Keller,C. Keller,C. Keller,C. Keller,C. Keller,C. Keller,C. Keller,C. Keller,C. Keller,C. Keller,C. Keller,C. Keller,C. Keller,C.凯勒那P. Krcah, R. Lenski, H. Lipson, R. MacCurdy, C. Maestre, R. Miikkulainen, S. Mitri, D. Moriarty, J. Mouret, A. Nguyen, C. Ofria, M. Parizeau, D. Parsons, R. Pennock, W. Punch, T. Ray, M. Schoenauer, E. Shulte, K. Sims,K.斯坦利F.塔代伊,D.塔拉波,S.蒂鲍尔特,W.魏默,R.沃森,J. Yosinski.
生物进化为复杂和微妙的适应提供了一种创造性的辉煌,经常令人惊讶的是发现它们的科学家。然而,因为进化是一种超越其发生的基材的算法过程,所以进化的创造力不限于自然。[...][PDF]
2018年

通过一群求新agent改进深度强化学习的进化策略探索

e .孔蒂诉Madhavanf .这样j·雷曼K.斯坦利Clune j .
Evolution strategies (ES) are a family of black-box optimization algorithms able to train deep neural networks roughly as well as Q-learning and policy gradient methods on challenging deep reinforcement learning (RL) problems, but are much faster (e.g. hours vs. days) because they parallelize better. [...][PDF]
守夜@ NeurIPS 2017(内潜藏),2017年

关于开放式演化策略与随机梯度下降的关系

X.张,Clune j .K.斯坦利
由于随机梯度下降(SGD)已经显示了希望优化具有数百万个参数的神经网络,并且如果已知存在任何替代方案,则据已知存在替代方案,因此它已经移动到强化学习(RL)的领先方法的心脏。[...][PDF]
2017年

通过输出梯度对深度和循环神经网络的安全突变

j·雷曼j·陈Clune j .K.斯坦利
虽然神经发展(不断发展的神经网络)在从加强学习到人造生命的各种域中具有成功的轨道记录,但它很少适用于大型深度神经网络。一种核心原因是,虽然随机突变通常在低维上工作,但是千万或数百万重量的随机扰动可能会破坏现有的功能,即使某些单独的重量变化是有益的,也没有学习信号。[...][PDF]
遗传和进化计算会议(GECCO),2018年

深度神经进化:遗传算法是一种竞争性的替代训练深度神经网络强化学习

f .这样诉Madhavan,E. Conti,j·雷曼K.斯坦利Clune j .
深度人工神经网络(DNN)通常通过基于梯度的学习算法训练,即反向化。进化策略可以对基于BackProp的算法,例如Q-Learning和政策梯度在挑战的深度加强学习(RL)问题上。[...][PDF]
深rl @ neurips 2018

开放性:你从未听说过的最后一个大挑战

K.斯坦利
人工智能(AI)是计算机科学面临的重大挑战。一生的努力和数十亿美元的资金为它的追求提供了动力。然而,时至今日,它最雄心勃勃的愿景仍未实现:尽管进步仍在继续,但与人类竞争的通用数字情报却不是我们力所能及的。[. .][HTML]
O ' reilly在线,2017年

ES不仅仅是一个传统的有限差分近似器

j·雷曼j·陈杰夫疝气肯尼斯·o·斯坦利
基于简化自然演化策略的进化策略最近引起了注意力,因为它在挑战的深度加强学习域中表现出令人惊讶。它通过生成当前参数集的扰动,检查它们的性能并在更高奖励的聚合方向上移动来搜索神经网络参数。[...][PDF]
遗传和进化计算会议(GECCO),2018年

神经进化:一种不同的深度学习

K.斯坦利
神经发展正在卷土重来。突出的人工智能实验室和研究人员正在尝试它,一串新成功都有挥霍热情,并且在深入学习的影响雷竞技是骗人的的新机会正在出现。[...][HTML]
O ' reilly在线,2017年

在一个开放的、互动的进化系统中渠化和可进化性的出现

j .惠钦格K.斯坦利Clune j .
自然进化产生了种类繁多的功能性生物。许多人认为,这一过程的一个重要组成部分是可进化性的进化,通过产生更适应环境的后代,进化加速了创新的能力。[...][PDF]
人工生命(出现),2017年

受欢迎的文章