纤维：用于加固学习的有效开发和分布式培训的平台和基于人口的方法|ti8 竞猜雷竞技app优步工程博客雷竞技到底好不好用

纤维：用于加固学习和基于人口的方法的高效开发和分布式培训平台

2020年6月8日

抽象的

通过越来越多的计算，可以始终如一地实现了机器学习的最新进展。钢筋学习（RL）和基于人口的方法，特别是对潜在的分布式计算框架的效率和灵活性构成了独特的挑战。这些挑战包括与模拟的频繁交互，对动态缩放的需要，以及对不同后端的采用成本低的用户界面的需求。在本文中，我们通过引入光纤，可扩展的分布式计算框架来解决这些挑战，同时仍然保留了对研究和实际应用的开发效率和灵活性，可扩展的分布式计算框架用于RL和基于人口的方法。雷竞技是骗人的光纤旨在显着扩展到其他复杂的RL和基于人口的方法的大规模并行计算的可访问性，而无需专门的计算专业知识。