跳转到页脚
首页 雷竞技是骗人的 人工智能/机器学习 背丙胺:训练具有可微神经调节可塑性的自修正神经网络

背丙胺:训练具有可微神经调节可塑性的自修正神经网络

摘要

动物大脑中令人印象深刻的终身学习主要是由突触连通性的可塑性变化实现的。重要的是,这些变化不是被动的,而是由神经调节主动控制的,而神经调节本身是受大脑控制的。由此产生的大脑自我修正能力在学习和适应中起着重要作用,是生物强化学习的主要基础。在这里,我们首次表明,具有这种神经调节可塑性的人工神经网络可以用梯度下降训练。扩展先前可微的Hebbian可塑性的工作,我们提出了一个可微的可塑性神经调节公式。我们表明,神经调节可塑性提高了神经网络在强化学习和监督学习任务中的性能。在一项任务中,具有数百万个参数的神经调节塑料LSTMs在基准语言建模任务(控制参数数量)中优于标准LSTMs。我们得出结论,可塑性的可微神经调节为神经网络训练提供了一个强大的新框架。

作者

托马斯MiconiAditya拉瓦尔大声回答杰夫Clune肯尼斯·o·斯坦利

会议

ICLR 2019

论文全文

“背丙胺:训练具有可微神经调节可塑性的自修正神经网络”(PDF)

超级人工智能

评论
前一篇文章 lsq++:多码本量化中较低的运行时间和较高的召回率
下一篇文章 无单一内禀图像的单幅图像内禀分解
Aditya拉瓦尔大声回答
Aditya Rawal是Uber 雷竞技是骗人的AI实验室的研究科学家。他的兴趣在于两个研究领域的融合——神经进化和深度学习。雷竞技是骗人的他相信,进化搜索可以取代人类的创造力,创造下一代深度网络。此前,Aditya在德克萨斯大学奥斯汀分校获得了计算机科学硕士/博士学位,导师是Risto Miikkulainen教授。在他的博士学位期间,他开发了神经进化算法,以进化序列预测问题的循环架构,并构建了合作、竞争和通信的多智能体系统。
杰夫Clune
Jeff Clune是怀俄明大学计算机科学的前Loy和Edith Harris副教授,Uber AI实验室的高级研究经理和创始成员,目前是OpenAI的研究团队负责人。雷竞技是骗人的Jeff专注于机器人和通过深度学习和深度强化学习训练神经网络。他还利用进化的计算模型研雷竞技是骗人的究了进化生物学中的开放问题,包括研究模块化、层次和可进化性的进化起源。在成为教授之前,他是康奈尔大学(Cornell University)的研究科学雷竞技是骗人的家,获得密歇根州立大学(Michigan State University)的计算机科学博士和哲学硕士学位,并获得密歇根大学(University of Michigan)的哲学学士学位。更多关于杰夫的研究可以在JeffCl雷竞技是骗人的une.com上找到
肯尼斯·o·斯坦利
在全职加入Uber AI实验室之前,Ken是中佛罗里达大学(University of Central Florida)计算机科学副教授(目前正在休假)。他是神经进化(将神经网络与进化技术相结合)领域的领军人物,在该领域他帮助发明了诸如NEAT、CPPNs、HyperNEAT和新奇搜索等著名算法。通过最近出版的科普书籍《为什么伟大是无法计划的:目标的神话》,他的观点也获得了更广泛的读者。