跳到页脚
首页 作者 作者:Rui Wang

瑞王

瑞王
5篇雷竞技到底好不好用博客文章 研究雷竞技是骗人的论文7篇
王锐是优步人工智能的高级研究科学家。雷竞技是骗人的他热衷于推动机器学习和人工智能的发展,并将前沿技术与优步更广泛的业务和产品联系起来。他最近在Uber的工作发表在机器学习和人工智能领域的领先国际会议上(ICML, IJCAI, GECCO等),获得了GECCO 2019年的最佳论文奖,并被Science, Wired, VentureBeat和Quanta Magazine等技术媒体报道。

工程博客文章雷竞技到底好不好用

光纤:让AI变得简单的分布式计算

光纤:让AI变得简单的分布式计算

项目主页:GitHub

在过去几年里,增强处理能力计算机的发展已经导致了机器学习的进步。越来越多的算法利用并行性并依赖分布式训练来处理大量的数据...

增强POET:通过无限发明学习挑战及其解决方案的开放式强化学习

0
增强POET:通过无限发明学习挑战及其解决方案的开放式强化学习

杰夫·克伦和肯尼斯·斯坦利是这项研究的共同资深作者我们的相关研究论文雷竞技是骗人的

机器学习(ML)能力许多技术而且服务我们投资于推进基本的ML研究,并与之互动雷竞技是骗人的...

创建一个雅达利玩代理的动物园来催化对深度强化学习的理解

0
创建一个雅达利玩代理的动物园来催化对深度强化学习的理解

这项研究是雷竞技是骗人的在谷歌Brain和OpenAI的合作者的宝贵帮助下进行的。

雅达利动物园里一群训练有素的特工。

最近人工智能领域一些最令人兴奋的进展来自深度强化领域...

POET:通过成对开放式开拓者无休止地生成日益复杂和多样化的学习环境及其解决方案

0
POET:通过成对开放式开拓者无休止地生成日益复杂和多样化的学习环境及其解决方案

杰夫·克伦和肯尼斯·o·斯坦利文章的第二作者。

我们感兴趣的开放性优步AI实验室,因为它提供了完全独立生成多样化且不断扩展的机器学习课程的潜力。拥有大量的...

VINE:用于神经进化的开源交互式数据可视化工具

0
VINE:用于神经进化的开源交互式数据可视化工具

在优步的规模上,机器学习的进步可以显著增强技术,为更安全、更可靠的运输解决方案提供动力。优步人工智能实验室最近宣布的一项进步是d燃灯neuroevolution,其中进化算法,如进化策略...

雷竞技是骗人的研究论文

超梯度下降的一阶预处理

t·莫斯科维茨r .王j .局域网美国卡普尔t . Miconij . Yosinski答:拉瓦尔大声回答
标准梯度下降方法容易受到一系列问题的影响,这些问题会阻碍训练,例如高相关性和参数空间中的不同缩放。这些困难可以通过二阶方法解决,即对梯度应用预处理矩阵以提高收敛性。不幸的是,这样的算法通常很难扩展到高维问题,部分原因是特定的预处理条件的计算,如逆Hessian或Fisher信息矩阵是非常昂贵的。我们介绍了一阶预处理(FOP),这是一种快速、可扩展的方法,它概括了以前关于超梯度下降的工作(Almeida等人,1998;Maclaurin等人,2015;Baydin等人,2017)学习一个只使用一阶信息的预处理矩阵。[…][PDF]
神经信息处理系统研讨会(NeurlPS), 2019

Fiber:用于强化学习和基于群体的方法的有效开发和分布式训练的平台

j .智r .王Clune j .k·斯坦利
机器学习的最新进展是通过不断增加的计算量来实现的。强化学习(RL)和基于群体的方法对底层分布式计算框架的效率和灵活性提出了独特的挑战。这些挑战包括与模拟的频繁交互,动态扩展的需求,以及对低采用成本和跨不同后端一致性的用户界面的需求。在这篇论文中,我们解决了这些挑战,同时通过引入光纤,一个可扩展的分布式计算框架,用于RL和基于人群的方法,为研究和实际应用保持开发效率和灵活性。雷竞技是骗人的[…][PDF]
arXiv

用深度确定性动态梯度估计Q(s,s’)

答:爱德华兹,希曼舒·萨尼,r·刘j .挂a . Jainr .王答:Ecoffett . Miconi, C.伊斯贝尔,j . Yosinski
在本文中,我们引入了一种新形式的值函数Q(s,s’),它表示从一个状态s转换到相邻状态s’,然后在此后采取最优行动的效用。为了获得最优策略,我们开发了一个正向动力学模型,学习做出下一个状态预测,使该值最大化。[…][PDF]
机器学习国际研讨会(ICML), 2020

增强POET:通过无限发明学习挑战及其解决方案的开放式强化学习

r .王j·雷曼答:拉瓦尔大声回答j .智y李Clune j .k·斯坦利
创建开放式算法,这些算法可以产生自己永无止境的新颖和具有适当挑战性的学习机会,这有助于自动化和加速机器学习的进步。成对开放式开拓者(成对开放式开拓者,POET)是朝着这个方向迈出的最新一步,它是一种生成并解决自身挑战的算法,并允许在挑战之间进行目标切换以避免局部最优。在这里,我们介绍并实证验证了原始算法的两个新创新,以及两个旨在帮助阐明其全部潜力的外部创新。[…][PDF]
机器学习国际研讨会(ICML), 2020

成对开放式开拓者(POET):无休止地生成日益复杂和多样化的学习环境及其解决方案

r .王j·雷曼Clune j .k·斯坦利
到目前为止,机器学习的历史包含了一系列由研究人员和算法提出的问题,这些算法学习了它们的解决方案,但一个重要的问题是,这些问题本身是否可以在被解决的同时由算法产生。雷竞技是骗人的[…][PDF]
2019

一个用于分析、可视化和比较深度强化学习代理的Atari模型动物园

f .这样诉Madhavanr·刘r .王,卡斯特罗,y李,舒伯特,贝勒马雷,Clune j .j·雷曼
许多人力和计算工作旨在提高深度强化学习算法在雅达利学习环境等基准上的表现。相对较少的努力集中在理解通过这种方法学习了什么,以及调查和比较不同家族的强化学习(RL)算法学习的表示。[…][PDF]
2018

VINE:用于神经进化的开源交互式数据可视化工具

r .王Clune j .k·斯坦利
深度神经进化的最新进展表明,进化算法,如进化策略(ES)和遗传算法(GA),可以扩展到训练深度神经网络,以解决困难的强化学习(RL)问题。然而,在如此高的维度上分析和解释神经进化的潜在过程仍然是一个挑战。为了解决这一挑战,本文提出了一个名为VINE(神经进化视觉检查器)的交互式数据可视化工具,旨在帮助神经进化研究人员和最终用户更好地理解和探索这一算法家族。雷竞技是骗人的[…][PDF]
遗传与进化计算会议的可视化研讨会(GECCO), 2018年

受欢迎的文章