跳转到页脚
首页 雷竞技是骗人的 人工智能/机器学习 通过超梯度下降的一阶预处理

通过超梯度下降的一阶预处理

摘要

标准梯度下降方法容易受到一系列问题的影响,如高相关性和参数空间的不同尺度。这些困难可以通过二阶方法来解决,该方法将预处理矩阵应用于梯度以提高收敛性。不幸的是,这类算法通常难以处理高维问题,部分原因是计算特定的预处理(如反Hessian或Fisher信息矩阵)非常昂贵。我们引入了一阶预处理(FOP),这是一种快速、可扩展的方法,它推广了以前关于超梯度下降的工作(Almeida et al., 1998;Maclaurin等人,2015;Baydin等人,2017)学习仅利用一阶信息的预处理矩阵。实验表明,FOP能够以最小的计算开销提高标准深度学习优化器在视觉分类和强化学习任务上的性能。我们也研究了学习预处理矩阵的性质,并对算法进行了初步的理论分析。

作者

泰德•莫斯科维茨,瑞王,珍妮丝兰,Sanyam卡普尔,托马斯Miconi,杰森Yosinski,Aditya拉瓦尔大声回答

论文全文

通过超梯度下降的一阶预处理(PDF)

评论
前一篇文章 Fiber:一个用于强化学习和基于人群方法的高效开发和分布式培训的平台
下一篇文章 物理上可实现的对抗例子激光雷达目标检测
瑞王
王锐是优步人工智能的高级研究科学家。雷竞技是骗人的他热衷于提升机器学习和人工智能的水平,并将前沿技术与优步更广泛的业务和产品联系起来。他最近在优步的工作发表在机器学习和人工智能的领先国际会议(ICML, IJCAI, GECCO等),并在GECCO 2019年获得最佳论文奖,并被Science、Wired、VentureBeat、Quanta Magazine等科技媒体报道。
珍妮丝兰
詹尼斯·兰(Janice Lan雷竞技是骗人的)是优步人工智能的一名研究科学家。
托马斯Miconi
托马斯·米科尼(Thomas Mico雷竞技是骗人的ni)是优步人工智能实验室的研究科学家。
杰森Yosinski
杰森·约辛斯基(Jason Yosinski)是优步人工智能实验室(Uber AI Labs)的创始成员,在那里领导着Deep Collective研究小组。雷竞技是骗人的他以理解神经网络建模、表示和训练而闻名。在加入优步之前,贾森在加州理工学院从事机器人技术工作,与人联合创办了两家网络公司,并在洛杉矶的中学启动了一个机器人项目,目前该项目服务于500多名学生。他在康奈尔创新机器实验室、蒙特利尔大学、喷气推进实验室和谷歌DeepMind完成了博士学位。他是NASA空间技术研究奖学金的获得者,合著了50多篇论文和专利,是ML公司几何智能(被Ube雷竞技是骗人的r收购)的副总裁。他的作品被NPR、BBC、Wired、《经济学人》、《科学》和《纽约时报》报道过。在他的空闲时间,杰森喜欢烹饪,阅读,滑翔伞,假装自己是一个艺术家。
Aditya拉瓦尔大声回答
Aditya Rawal是优步人工智雷竞技是骗人的能实验室的一名研究科学家。他的兴趣集中在两个研究领域——神经进化和深度学习。雷竞技是骗人的他认为,进化式搜索可以取代人类创造下一代深度网络的独创性。此前,Aditya在德克萨斯大学奥斯汀分校(University of Texas at Austin)获得计算机科学硕士/博士学位,导师是Risto Miikkulainen教授。在他的博士学位期间,他开发了神经进化算法来进化序列预测问题的循环架构,并构建了协作、竞争和通信的多智能体系统。