摘要
动物大脑中令人印象深刻的终身学习主要是由突触连通性的可塑性变化实现的。重要的是,这些变化不是被动的,而是由神经调节主动控制的,而神经调节本身是受大脑控制的。由此产生的大脑自我修正能力在学习和适应中起着重要作用,是生物强化学习的主要基础。在这里,我们首次表明,具有这种神经调节可塑性的人工神经网络可以用梯度下降训练。扩展先前可微的Hebbian可塑性的工作,我们提出了一个可微的可塑性神经调节公式。我们表明,神经调节可塑性提高了神经网络在强化学习和监督学习任务中的性能。在一项任务中,具有数百万个参数的神经调节塑料LSTMs在基准语言建模任务(控制参数数量)中优于标准LSTMs。我们得出结论,可塑性的可微神经调节为神经网络训练提供了一个强大的新框架。
作者
托马斯Miconi,Aditya拉瓦尔大声回答,杰夫Clune,肯尼斯·o·斯坦利
会议
ICLR 2019
论文全文
“背丙胺:训练具有可微神经调节可塑性的自修正神经网络”(PDF)
超级人工智能
评论