跳到页脚
雷竞技是骗人的 人工智能/机器学习 纤维:用于加固学习和基于人口的方法的高效开发和分布式培训平台

纤维:用于加固学习和基于人口的方法的高效开发和分布式培训平台

0.

抽象的

通过越来越多的计算,可以始终如一地实现了机器学习的最新进展。钢筋学习(RL)和基于人口的方法,特别是对潜在的分布式计算框架的效率和灵活性构成了独特的挑战。这些挑战包括与模拟的频繁交互,对动态缩放的需要,以及对不同后端的采用成本低的用户界面的需求。在本文中,我们通过引入光纤,可扩展的分布式计算框架来解决这些挑战,同时仍然保留了对研究和实际应用的开发效率和灵活性,可扩展的分布式计算框架用于RL和基于人口的方法。雷竞技是骗人的光纤旨在显着扩展到其他复杂的RL和基于人口的方法的大规模并行计算的可访问性,而无需专门的计算专业知识。

作者

杰琳志瑞旺杰夫疝气Kenneth O. Stanley

出版物

arxiv

全文

纤维:用于加固学习和基于人口的方法的高效开发和分布式培训平台

注释
上一篇文章 具有深度确定性动态梯度的Q(S,S')
下一篇文章 通过超级血统的一阶预处理
杰琳志
Jiale Zhi是一个高级软件工程师,拥有优步AI。他的兴趣领域是分布式计算,大数据,科学计算,进化计算和加强学习。他也对传统软件工程中的机器学习的真实应用感兴趣。他是光纤项目的创建者,一个可扩展,分布式的大规模并行计算应用程序的框架。在优步AI之前,他是优步优势团队的技术领先,它管理优步的全球移动网络流量和路由。
瑞旺
瑞王是高级研究科学家,拥有优步艾。雷竞技是骗人的他热衷于推进机器学习和AI的艺术状态,并将尖端进入更广泛的业务和产品的连接。他最近的优步工作是在领先的国际机器学习会议上发表的是(ICML,IJCAI,GECCO等),赢得了Gecco 2019年的最佳纸张奖,由科学,有线,VidtureBeat等技术媒体覆盖,和Quanta杂志。
杰夫疝气
Jeff Clune是Wyoming大学计算机科学中的前大Loy和伊甸园议员副教授,高级研究经理和Uber Ai Labs的高级研究经理,目前在Openai的研究团队领导者。雷竞技是骗人的杰夫通过深入学习和深度加固学习侧重于机器人和培训神经网络。他还利用演化的计算模型研雷竞技是骗人的究了进化生物学的开放性问题,包括研究模块化,等级和再生性的进化起源。在成为一名教授之前,他是康奈尔大学的研究科学家,在密歇根州立大学获得了计算机科学雷竞技是骗人的的博士学位,并在密歇根州立大学获得了哲学的哲学,并在密歇根大学获得了哲学的巴。有关Jeff的研究可以在JeffCl雷竞技是骗人的une.com找到更多关于Jeff的研究
Kenneth O. Stanley
在加入优步AI实验室之前,Ken是佛罗里达州中部大学计算机科学副教授(他目前在休假)。他是NeuroVolution的领导者(将神经网络与进化技术相结合),在那里他帮助发明了突出的算法,如整洁,CPPN,超容易和新奇搜索。他的想法也通过最近的受欢迎的科学书达到了更广泛的受众,为什么无法计划伟大:目标的神话。