通过超级血统的一阶预处理
T. Moskovitz,r .王,J. LAN.,S. Kapoor.,t . Miconi,j . Yosinski,A. rawal.
标准梯度下降方法易于一系列可能阻碍训练的问题,例如参数空间中的高相关性和不同的缩放。这些困难可以通过将预调节矩阵应用于梯度来改善收敛的二阶方法来解决这些困难。。遗憾的是,这种算法通常努力扩展到高维问题,部分原因是特定的预处理器,例如反向Hessian或Fisher信息矩阵非常昂贵。我们介绍一阶预处理(FOP),一种快速,可扩展的方法,概括了先前的血统下降的工作(Almeida等,1998; Maclaurin等,2015; Baydin等,2017)学习预处理矩阵只利用一阶信息。
[…][PDF]
神经信息处理系统会议(neurlps.), 2019
纤维:用于加固学习和基于人口的方法的高效开发和分布式培训平台
J. Zhi.,r .王,J. Clune.,K.斯坦利
机器学习的最新进展一直是通过增加计算量来实现的。特别是强化学习(RL)和基于群体的方法对底层分布式计算框架的效率和灵活性提出了独特的挑战。这些挑战包括与模拟的频繁交互、对动态伸缩的需求、以及对具有低采用成本和跨不同后端一致性的用户界面的需求。在本文中,我们通过引入光纤(一种可扩展的分布式计算框架,用于RL和基于种群的方法)来解决这些挑战,同时仍然保持研究和实际应用的开发效率和灵活性。雷竞技是骗人的[…][PDF]
arXiv
具有深度确定性动态梯度的Q(S,S')
A. Edwards.,Himanshu Sahni,R. Liu.,j .挂,a . Jain,r .王,A. Ecoffet.,t . Miconi,的时候,j . Yosinski
在本文中,我们引入了一种新颖的价值函数形式Q(S,S'),其表示从状态S转换到相邻状态S',然后此后的最佳地作用。为了获得最佳策略,我们开发了一个前向动态模型,该模型学会进行下一个最大化此值的下一个状态预测。[…][PDF]
国际机器学习会议(ICML), 2020
Enhanced POET:通过无限创造学习挑战及其解决方案的开放式强化学习
r .王,j·雷曼,A. rawal.,J. Zhi.,y李,J. Clune.,K.斯坦利
创建开放式算法,它生成自己的永无止境的小说并适当挑战学习机会,可以帮助自动化和加速机器学习的进步。近期沿着这方面的一步是配对的开放式开拓者(POET),一种算法,它产生并解决自己的挑战,并允许解决方案 - 在挑战之间进行攻击以避免本地最佳。在这里,我们介绍并经验验证了原始算法的两个新创新,以及旨在帮助阐明其全部潜力的两个外部创新。[…][PDF]
国际机器学习会议(ICML), 2020
基于异质性因果学习的用户营销有效性优化
W. Y. Zou.,美国杜,j·李,J. Pedersen.
用户营销是基于消费者的互联网公司的关键重点。学习算法是有效优化增加用户参与的营销活动,并促进与相关产品的交叉营销。通过使用奖励吸引用户,营销方法有效地促进所需产品中的用户活动。奖励产生的大量成本可以通过增加未来收入增加。[…][PDF]
2020.
学习持续治疗策略与二部嵌入匹配异质因果效应
W. Y. Zou.,S. Shyam.,M. mui.,王,J. Pedersen.,Z.Ghahramani.
因果推理方法广泛应用于医学、政策和经济学等领域。这些应用的核心是对治疗效果的估计,以便作出决定。目前的方法是基于单一结果维度的治疗效果作出二元的是或否的决定。这些方法无法获得具有强度衡量的连续空间治疗政策。[…][PDF]
2020.
通过大规模优化发现必要的多基因效应:在人类癌症代谢中的应用
T. Durieux,y Hamadi, m . Monperrus
在过去的几年里,web应用程序的复杂性增加了,为用户提供了更多的动态web应用程序。这种复杂性的缺点是前端应用中错误的数量不断增加。在这篇论文中,我们提出了一种为网络提供自愈合的方法。[…][PDF]
软件测试、验证和可靠性30(2),2018年3月
即插即用语言模型:可控文本生成的简单方法
S. Dathathri,A. Madotto,J. LAN.,j .挂,E.弗兰克,P. Molino.,j . Yosinski,R. Liu.
在巨大的文本语料库上训练的大型基于变压器的语言模型(LMs)显示出了无与伦比的生成能力。然而,控制生成语言的属性(例如切换主题或情感)是很困难的,如果不修改模型架构或对属性特定的数据进行微调,还需要进行大量的再培训。我们提出了一个简单的替代方案:即插即用语言模型(PPLM),用于可控语言生成,它将一个预先训练的LM与一个或多个简单的属性分类器结合起来,这些属性分类器指导文本生成,而无需对LM进行任何进一步的训练。[PDF]
学习表现国际会议(ICLR), 2020
完全自动化的HTML和JavaScript重写,用于构建自我修复的Web代理
T. Durieux,y Hamadi, m . Monperrus
在过去的几年里,web应用程序的复杂性增加了,为用户提供了更多的动态web应用程序。这种复杂性的缺点是前端应用中错误的数量不断增加。在这篇论文中,我们提出了一种为网络提供自愈合的方法。[…][PDF]
软件测试、验证和可靠性30(2),2018年3月
使用图形神经网络自主驾驶的联合交互与轨迹预测
d·李,Y. Gu,j .黄平君,M. Marchetti-Bowick
使用弱意向标签可能会更好地预测相互作用和产生的轨迹。我们使用GNN来模拟交互。[PDF]
神经信息处理系统会议(NeurIPS), 2019
识别自动驾驶的未知实例
K. Wong,美国王,M. ren.,梁,r . Urtasun
我们提出了一种新的开放集的点云实例分割算法,从已知和未知类中识别实例。特别是,我们训练了一个深度卷积神经网络,它将属于同一实例的点投射到一个类别不可知的嵌入空间中。[PDF]
机器人学习会议(考), 2019
用于概率行人行为预测的离散剩余流量
A. Jain,S. Casas.,r·廖,Y.熊,S. Feng.,美国西格尔,r . Urtasun
我们的研雷竞技是骗人的究表明,非参数分布可以非常好地捕获(不稳定)的行人行为。我们提出了离散的剩余流量,一种用于人类运动预测的卷积神经网络,可准确地模拟时间依赖性并捕获远程运动预测中固有的不确定性。特别是,我们的方法非常逼真地捕获未来的人类运动的多模态后簧。[PDF]
神经信息处理系统会议(NeurIPS), 2019
引起吸引人的网络增量少量学习
M. ren.,r·廖,E. Fetaya,R. Zemel
本文利用增量式少镜头学习方法解决了这一问题。在这种方法中,一个常规的分类网络已经被训练来识别一组基类,并考虑了几个额外的新类,每个类只有几个带标记的例子。学习完新类后,对模型在基础类和新类上的总体分类性能进行评价。为此,我们提出了一种元学习模型——注意吸引子网络(Attention Attractor Networks),它可以规范新类的学习。[PDF]
神经信息处理系统会议(NeurIPS), 2019
基于图循环注意网络的高效图生成
r·廖,李妍,宋妍,美国王,C. Nash,W.L. Hamilton,。Duvenaud,r . Urtasun,R.S.Zemel.
我们提出了一种新的高效、富有表现力的图的生成模型,称为图循环注意网络(GRANs)。在标准基准测试中,我们的模型生成的图形在质量上可以与以前的最先进的图形相媲美,并且至少快一个数量级。[PDF]
神经信息处理系统会议(NeurIPS), 2019
优化SWIFT协议
R. Barik.m .曾经,m·k·拉马纳坦,m . Chabbi
Swift是一种日益流行的编程语言,它提倡使用协议,协议定义了一组符合类型所需的方法和属性。协议通常在Swift程序中用于抽象实现细节;例如,在优步的一个大型工业应用程序中,它们被大量用于单元测试的模拟对象。不幸的是,大量使用协议可能导致显著的性能开销。[…][PDF]
面向对象程序设计、系统、语言及应用(OOPSLA), 2019
学习联合2D-3D表示深度完成
y陈,b .杨,梁,r . Urtasun
我们设计一个简单但有效的架构,使多个级别的2D和3D表示之间的信息融合,以便在多个级别学习完全融合的关节表示,并在基蒂深度完成基准上显示最先进的结果。[PDF]
计算机视觉国际会议(ICCV.), 2019
利用越野损失和偏差减缓改进交通行动者的运动预测
M. Niedoba,H. Cui.k·罗,d .对冲基金,F.-C。周,N. Djuric.
在这项工作中,提高了具有两种新方法的交通演员的预测:越野损失和行动类别均升高。越野损失通过惩罚不切实际的越野预测来赞美传统的L2距离损失。[PDF]
神经信息处理系统会议(NeurIPS), 2019
Dagmapper:通过发现Lane拓扑学习地图
N. Homayounfar.,观测。马\ *,J. Liang \ *,x吴,J. Fan.,r . Urtasun
我们通过将问题作为深度指导的图形模型来映射高速公路的复杂车道拓扑。作为一个有趣的结果,我们可以在I40中培训我们的模型,并在SF中推广到看不见的高速公路。[PDF]
计算机视觉国际会议(ICCV.), 2019
DMM-Net:用于视频实例分割的可区分掩码匹配网络
x曾庆红,r·廖l .顾,Y.熊,s. fidler,r . Urtasun
我们提出了可差异化的掩模匹配网络(DMM-Net),用于解决提供初始实例掩码的视频实例分段问题。在Davis 2017 DataSet上,DMM-Net在没有在线学习的情况下实现最佳性能,而不是在线学习和第二帧。如果没有任何微调,DMM-Net会媲美SEGTRACK V2数据集的最先进方法。[PDF]
计算机视觉国际会议(ICCV.), 2019
基于不确定性感知的自动驾驶交通行为人短时运动预测
N. Djuric.,V. radosavljevic,H. Cui., t·阮F.-C。周,T.-h.林,N. Singh,J. Schneider
我们引入一种考虑当前世界状态的方法,并产生每个交通行动者附近的栅格化表示。然后,栅格图像被用作深度卷积网络的输入,以推断参与者未来的运动,同时也考虑和捕捉预测任务的固有不确定性,通过对真实数据的大量实验,强烈表明了所提出的方法的好处。[PDF]
计算机视觉应用冬季会议(WACV.), 2020
哈密顿神经网络
格雷达努斯,赞巴,j . Yosinski
尽管神经网络享有广泛使用,但他们仍然努力学习物理学的基本定律。我们如何以更好的归纳偏见赋予它们?在本文中,我们汲取了汉密尔顿力学的灵感来培训以无人监督的方式学习和尊重精确保护法的模型。[…][PDF]
神经信息处理系统会议(NeurIPS),2019年
LCA:神经网络培训的损失变更分配
J. LAN.,R. Liu.,H.周,j . Yosinski
神经网络享有广泛的使用,但他们的培训,代表和操作的许多方面都很明显。特别是,我们的视图进入培训过程是有限的,单个标量损失是最常见的视口进入这种高维,动态过程。我们向训练提出了一个新的窗口,称为损耗变化分配(LCA),其中衡量网络丢失的变化保守地分区为参数。[…][PDF]
神经信息处理系统会议(NeurIPS),2019年
解构彩票:零,标志和超级掩码
H.周,J. LAN.,R. Liu.,j . Yosinski
由于深度学习的复苏,近年来,光学字符识别(OCR)方法已被广泛推进。最先进的模型主要接受由受约束场景组成的数据集。从现实世界图像中检测和识别文本仍然是技术挑战。[…][PDF]
神经信息处理系统会议(NeurIPS),2019年
DeepPruner:通过可微分的斑点学习高效立体声匹配
S. Duggal.,美国王,观测。马,r. hu,r . Urtasun
我们提出了一种使用立体图像对的实时密集深度估计方法,该方法利用可分辨率的补丁匹配来逐步修剪立体声匹配搜索空间。尽管实时运行,但我们的模型尽管运行,但仍然可以在基蒂基准上实现竞争性能。[PDF]
计算机视觉国际会议(ICCV.), 2019
营销机学习平台的最大相关性和最小冗余特征选择方法
Z. Zhao.r . Anand,王
在机器学习应用程序的在线产品产品和营销策略,通常有数百或数千个功能可供构建此类模型。特征选择是多个目标应用中的一种基本方法:通过消除无关的功能,加速模型训练和预测速度来提高预测精度,从而降低特征数据流水线的监控和维护工作量,并提供更好的模型解释和诊断能力。[…][PDF]
IEEE数据科学与高级分析国际会议(Dsaa.), 2019
具有成本优化的多重处理隆升模型
Z. Zhao.,t . Harinen
隆起建模是一种用于估算个人或亚组水平的治疗效果的新兴机器学习方法。它可用于优化营销活动和产品设计等干预措施的性能。[…][PDF]
IEEE数据科学与高级分析国际会议(Dsaa.), 2019
DSIC:深度立体图像压缩
j .刘,美国王,r . Urtasun
我们设计一种用于压缩立体图像对的新颖架构,其尝试从第一图像中提取尽可能多的共享信息,以便减少第二图像的比特率。我们在低比特率下展示了令人印象深刻的30-50%比特率。[PDF]
计算机视觉国际会议(ICCV.), 2019
面向任务对话的灵活结构化模型
L. Shu.,P. Molino.,M. Namazifar.,徐h,刘b,H.郑,G. Tur
本文提出了一种面向任务的对话系统的端到端结构。它基于一种简单实用但非常有效的序列到序列方法,其中语言理解和状态跟踪任务与结构化复制增强序列解码器和每个槽的多标签解码器联合建模。策略引擎和语言生成任务在此基础上共同建模。[…][PDF]
2019年
用因果学习改善用户保留
美国杜,j·李,F.渴戈阿里奥扎
用户留存是以消费者为基础的互联网公司关注的重点,而促销是提高留存率的有效手段。然而,公司要么依靠非因果流失预测来获取异质性,要么通过定期的A/B测试来获取平均处理效果。在本文中,我们提出了一个异质性处理效应优化框架,以同时捕捉异质性和因果效应。[…][PDF]
SIGKDD知识发现和数据挖掘会议(知识发现(KDD)), 2019
NullAway:实用的基于类型的Java空安全
S. Banerjee,l·克拉普先生,曾经
nullpointerexception (NPEs)是现代Java程序中崩溃的一个主要来源。以前的工作已经展示了如何通过代码注释和可插入类型检查在编译时防止此类错误。然而,由于巨大的构建时间开销和/或高注释负担,这样的系统很难部署到大型软件项目中。本文提出了一种新的基于类型的Java空安全检查程序NullAway,它克服了这些问题。[…][PDF]
ACM联合欧洲软件工程会议和专题讨论软件工程基础(工程师),2019年