跳到页脚
雷竞技是骗人的 人工智能 /机器学习 通过Tastaware生成不确定性对分发输入的鲁棒性

通过Tastaware生成不确定性对分发输入的鲁棒性

抽象的

当观测结果类似于训练数据时,深度学习为机器感知提供了强大的工具。但是,即使在意外情况下,现实世界的机器人系统也必须对其观察结果有明智的反应。这需要一个系统来推理其自身的不确定性,并且鉴于陌生的,分布的观察结果。近似贝叶斯的方法通常用于估计神经网络预测的不确定性,但可能会与分布外观察斗争。生成模型原则上可以检测到估计密度较低的模型。但是,仅出现分布的输入本身并没有表明不安全的情况。在本文中,我们提出了一种不确定性意识的机器人感知的方法,该方法结合了生成建模和模型不确定性,以应对分布态的不确定性。我们的方法估计了对模型预测的不确定性度量,考虑到观察分布的明确(生成)模型,以处理分布外输入。这是通过将观测值投射到训练分布上来实现的,使得分布输入映射以不确定分发观测值,这又产生与任务相关的不确定的预测,但只有在图像更改的任务中与任务相关的部分。我们通过模拟和真实数据评估我们的方法,以动作条件的碰撞预测任务,并证明我们预测分布外观测的方法可改善四种标准贝叶斯和非贝叶斯神经网络方法的性能,从而更有利 trade-offs between the proportion of time a robot can remain autonomous and the proportion of impending crashes successfully avoided.

作者

罗恩·麦卡利斯特(Rowan McAllister),格雷戈里·卡恩(Gregory Kahn),杰夫·克莱恩(Jeff Clune),谢尔盖·莱文(Sergey Levine)

会议

ICRA 2019

完整的纸

“通过Tastaware生成不确定性对分布的稳健性”(PDF)

Uber AI

注释
上一篇文章 Lanczosnet:多尺度深图卷积网络
下一篇文章 神经指导性约束逻辑编程用于程序合成
杰夫·克莱恩(Jeff Clune)
杰夫·克莱恩(Jeff Clune)是怀俄明大学(University of Wyoming)计算机科学的前Loy和Edith Harris副教授,他是Uber AI Labs的高级研究经理和创始成员,目前是OpenAI的研究团队负责人。雷竞技是骗人的杰夫通过深度学习和深入的强化学习专注于机器人技术和培训神经网络。他还使用进化的计算模型研雷竞技是骗人的究了进化生物学的开放问题,包括研究模块化,层次结构和进化性的进化起源。在成为教授之前,他曾是康奈尔大学的研究科学家,获得了计算机科学博士学位和密歇根州雷竞技是骗人的立大学的哲学硕士学位,并获得了密歇根大学的哲学学士学位。有关Jeff研究的更多信息,请访问j雷竞技是骗人的effclune.com