无论何时,只要有乘客在他们的位置下车,我们的一个司机合作伙伴结束了一段满载旅程,或者用餐者将食物送到他们的门口,这些数据都是Uber平台上这些互动的基础。如果没有一批在机器学习和人工智能方面经验丰富的人,我们的团队就无法有效地为这些互动服务。

对此,我们很高兴地欢迎1月他超级人工智能。Jan在技术和科学领导方面有着丰富的经验,曾担任微软Core Search的首席科学家、Twitter的数据科学副总裁,以及最近的eBay首席科学家。他以杰出科学家的身份加入优步,并将帮助我们驾驭和发展我们的人工智能和机器学习。

我们采访了Jan,了解了他过去的经历以及他加入优步的决定:

是什么吸引你学习统计学的?

当我进入普林斯顿大学读本科时,我想学习物理,但我很快意识到计算机科学(CS)真的让我感兴趣。但是,当时CS是工学院的,而我是文理学院的。换学校需要多学习一年,这一点我不能强加于我的父母。相反,我选择了一个能够提供最大灵活性的理科专业,结果是统计学。虽然一开始只是为了方便,但我渐渐喜欢上了这个领域。统计学的核心是关于科学的方法论,这使得它非常吸引人。在普林斯顿,我接触到了这个领域的一些伟人,比如约翰·图基


你职业生涯的早期是在施乐帕克研究中心这家公司创造了许多革命性的技术。在那里工作感觉怎么样?做了哪些项目?

我是帕洛阿尔托研究中心人工智能实验室的一员,主要研究InterLisp-D和专家系统。我在自然语言处理(NLP)组。

我开始在帕洛阿尔托研究中心实习,同时在斯坦福大学完成我的统计学博士学位。在我的博士学位,我实现了一个编程环境的数据分析在Lisp称为交互式数据语言。这项工作让我有资格加入PARC的Lisp系统小组,该小组的重点是商业化Interlisp_D Lisp机,这是一种个人计算机,具有集成的Lisp编程环境。我实现了Lisp操作系统的各个方面,包括算术和序列函数库以及包系统。

我毕业后进入了研究小组,加入了NLP小组,雷竞技是骗人的在那里我专注于基于语料库的计算语言学,写了一些经常被引用的早期论文,比如马尔可夫模型词性标记、文本分类、文档聚类和文档摘要。和我的一个好朋友兼同事,Doug Cutting(他是开源社区中著名的LuceneHadoop),我用Lisp写了一个文本检索系统称为文本数据库(TDB),这是一个很好的介绍搜索技术。TDB的开发与第一批网络搜索引擎(如Lycos、Excite、Alta Vista和InfoSeek)的出现相吻合,这为我在帕洛阿尔托研究中心之外的工作提供了机会。


在你的职业生涯中,互联网的使用大幅增长,并已成为社会的一大组成部分。随着互联网和数据的增长,你对统计学的专业应用发生了怎样的变化?

每一个伟大的互联网业务都建立在对数据的智能使用之上,包括在使用数据中进行细粒度试验和识别模式的能力。早期的互联网公司可能迟迟没有意识到这一点,但现在这是一个既定的事实。我很幸运地拥有在这个环境中有用的技能组合。特别是,统计知识对于充分欣赏实验是必不可少的,这是(或应该是)互联网发展周期的核心。类似地,预测建模,或机器学习,是一种从数据中提取价值的好方法。


考虑到你从事互联网搜索项目的经验,这些年这个特定领域发生了什么变化?

很难意识到搜索的进步有多大,因为进化是渐进的,但如果你比较五年前和今天的搜索引擎,你会欣赏其中的差异。也许最大的变化是从返回一个相关文档列表,即经典的10个蓝色链接,到返回一个实际的答案。答案可能来自知识图,也可能来自文档。分析查询所需的NLP技术要求很高,但正确使用它可以帮助你回答一般问题,你可以在谷歌home和Amazon Alexa等纯语音家庭助手中看到这一点。

H机器学习对你的工作有何影响?

在我的职业生涯中,我一直在使用机器学习。我早期的工作都是关于将机器学习应用于自然语言处理任务,比如词性标注。在Alta Vista,我们是第一个使用梯度提升树大规模部署机器学习排名的搜索团队。微软必应的整个搜索堆栈都是基于机器学习的。它确实是一个非常棒的工具,应用范围非常广泛。


你为什么决定加入优步?

优步是一家将对世界产生积极影响的迷人公司。它已经成为一个重要的服务,使我们的生活更好,似乎无限的潜在的新业务和应用。

优步还因科技创新和对人工智能的承诺而在业内享有盛誉。我在优步人工智能实验室看到了很多有趣的机会,因为人工智能和机器学习对优步的业务至关重要。我还在学习过程中,但期待在不久的将来专注于与优步人工智能关键合作伙伴的合作项目。

有兴趣与Jan和Uber人工智能实验室合作吗?考虑申请一个角色在我们的团队!

评论