跳到页脚
雷竞技是骗人的 人工智能 /机器学习 插件语言模型:一种简单的控制文本生成方法

插件语言模型:一种简单的控制文本生成方法

抽象的

在大型文本语料库中培训的大型基于变压器的语言模型(LMS)表现出无与伦比的发电能力。但是,在不修改模型体系结构或对属性特定数据的微调并带来重大的再培训成本的情况下,很难控制生成语言的属性(例如,切换主题或情感)。我们提出了一个简单的替代方法:可控语言生成的插头和播放语言模型(PPLM),该模型将预处理的LM与一个或多个简单的属性分类器结合在一起,可指导文本生成,而无需对LM进行任何进一步的培训。在我们提出的规范场景中,属性模型是简单的分类器,该分类器由用户指定的单词袋或单个学习层组成,其参数比LM少100,000倍。采样需要向前和向后通行证,其中属性模型的梯度推动了LM的隐藏激活,从而引导了一代。模型样本显示了对各种主题和情感样式的控制,并且广泛的自动化和人类注释的评估显示出属性比对和流利度。PPLM具有灵活性,因为任何可区分属性模型的组合都可以用于引导文本生成,这将允许除本文中给出的示例外,还可以进行多种和创意的应用程序。

作者

Sumanth Dathathri,Andrea Madotto,珍妮丝·兰(Janice Lan),,,,简洪,,,,埃里克·弗兰克(Eric Frank),,,,皮耶罗·莫利诺(Piero Molino),,,,杰森·尤辛斯基(Jason Yosinski),,,,罗莎恩·刘(Rosanne Liu)

会议

ICLR 2020

完整的纸

‘插入和播放语言模型:一种简单的控制文本生成方法”(PDF)

Uber AI

注释
上一篇文章 完全自动化的HTML和JavaScript重写用于构建自我处理的Web代理
下一篇文章 通过大规模优化发现必需的多个基因效应:对人类癌症代谢的应用
珍妮丝·兰(Janice Lan)
Janice Lan是Uber 雷竞技是骗人的AI的研究科学家。
简洪
简·洪(Jane Hung)是雷竞技是骗人的Uber AI实验室的研究科学家。
埃里克·弗兰克(Eric Frank)
在加入Uber AI实验室的研究人员之前,ERIC发明了面向AI的雷竞技是骗人的玩具,用于风筝和火箭研究。他还是罗切斯特大学的研究助理雷竞技是骗人的,并在业余时间制作艺术。
皮耶罗·莫利诺(Piero Molino)
皮耶罗(Piero)是斯坦福大学朦雷竞技是骗人的胧研究小组的员工研究科学家。他是Uber AI的前创始成员,他创建了路德维希(Ludwig),从事应用项目(COTA,Uber Eats的图形学习,Uber的对话系统),并发表了有关NLP,对话,可视化,图形学习,加强学习和计算机视觉的研究。雷竞技是骗人的
杰森·尤辛斯基(Jason Yosinski)
杰森·尤辛斯基(Jason Yosinski)是Uber AI实验室的创始成员,在那里领导了深度集体研究小组。雷竞技是骗人的他以理解神经网络建模,表示和培训的贡献而闻名。在加入Uber之前,Jason在加州理工学院(Caltech)为机器人技术工作,并共同创立了两家网络公司,并在洛杉矶中学启动了一个机器人计划,该计划现在为500多名学生提供服务。他在康奈尔创意机实验室,蒙特利尔大学,JPL和Google DeepMind完成了博士学位。他是NASA太空技术研究奖学金的接受者,已共同撰写了50多篇论文和专利,并且是Uber获得的《雷竞技是骗人的几何情报》中ML的副总裁。他的作品已由NPR,BBC,Wired,经济学家,科学和《纽约时报》介绍。杰森(Jason)在空闲时间里喜欢做饭,阅读,滑翔伞,并假装自己是一名艺术家。
罗莎恩·刘(Rosanne Liu)
Rosanne是一位高级研究科学家,也是雷竞技是骗人的Uber AI的创始成员。她在西北大学获得了计算机科学博士学位,在那里她利用神经网络帮助发现新颖的材料。她目前在机器学习和神经网络神秘的多个方面工作。她试图在业余时间写信。