工程Uber系统以对抗欺诈|ti8 竞猜雷竞技appUber工程博客雷竞技到底好不好用

2016年6月30日

鸣叫35

投票

35分享

走进16楼的会议室Uber工程在旧金山市场街上建造。您可以在桌子周围与软件和数据工程师，数据科学家，建模专家甚至产品经理进行激烈的讨论。话题？如何确定欺诈用户。

预防欺诈是Uber增长最快的研发领域之一。雷竞技是骗人的随着我们平台的发展，国际黑社会试图破坏它。有骑手欺诈，驾驶员欺诈，有时都交织在一起。我们有一天在中国看到的东西可以到达下一届多伦多。很快，在三大洲的六个城市中出现了相同的欺诈模式。从这种欺诈中打击和学习的实时系统是什么样的？

工程领导者埃迪·马（Eddie MA）是Uber预防欺诈工作的最前沿，领导了几个相互联系的工程团队，这些团队在协调方面工作，以减少Uber软件平台的欺诈行为。他的团队还有更多关于Uber工程师系统如何在2016年及以后打击欺诈行为的信息。

埃迪，工程管理

埃迪·马（Eddie MA）：Uber的欺诈预防始于一小群工程师和数据科学家，建立了特定的生产规则，以检测已知的欺诈模式。随着Uber在国际和不同的垂直市场上的发展，我们的平台随着大数据处理，机器学习建模和平台的最新技术以及分布式实时交易系统的最新技术而迅速发展。

我们的成功依赖于机器学习，数据科学和大规模的分布式系统来在这些技术领域进行创新，而正是下一代的开发将创造我们的成功。经验丰富的系统工程师将把我们现有的基础架构转变为高度可扩展的在线机器学习平台，这些平台可以实时处理不断增加的交易需求。数据科学家和机器学习专家将建立复杂的模型，以检测使用实时和实时数据的模式。数据工程师将构建在线分析平台和管道，以处理我们快速四倍的数据。解决方案专家将找到扩散现实生活威胁的最佳方法，UX专家将设计和构建应用程序和工具，以标准化全球运营中的反欺诈过程。

Raja，系统工程师

Raja Shekhar Alli：目前，我专注于预防欺诈平台，建立可扩展的分布式系统，以实时与骑手和驾驶员欺诈。由于人们参加旅行，并且我们立即在完成后立即进行旅行，因此我们需要在毫秒内做出决定，以停止欺诈，甚至有机会发生。

欺诈需要许多创造性的解决方案，尤其是在机器学习系统中，这对我们的工作至关重要。开发大规模申请以进行雪貂欺诈并不直接。我们需要了解服务如何相互关联，以及数据如何在UBER基础架构生态系统中流动。我们的长期目标是构建可扩展的解决方案，从一开始就难以实施欺诈：预防欺诈，而不仅仅是发现和缓解。

Jinsong，机器学习和建模专家

Jinsong Tan：Uber欺诈预防是一个充满活力的环境。挑战很快，我们开发的解决方案也是如此。鼓励我们从头到尾解决问题。我可以在软件工程，机器学习，数据科学甚至某些游戏理论中充分锻炼自己的技能。

我研究了研究生院的行为经济学和游戏理论，在Uber，Bighting Draud意味着建立对欺诈行为经济学的见解。理想情况下，这需要设计一个在游戏理论术语中的系统激励兼容。我们希望使我们的平台弹性使它根本没有经济上的欺诈行动。在过去的一年中，通过调整调度算法，我们取得了真正的成功结果，以使我们的系统更具动力兼容（换句话说，欺诈性），而随着业务持续增长，这些结果只会更重要。

聚类可以帮助我们使用PCA派生的独立功能。

Alain，数据工程师

阿兰·罗德里格斯（Alain Rodriguez）：我确保用来制定减少欺诈决策的数据将准确，一致地流动。目前，我们正处于实时的时间（我们正在谈论几分钟和几小时）。实时数据越多，我们越快就可以阻止欺诈和坏演员消除公司其他成员所做的工作。

人们对人们试图欺骗我们的许多创造性方式感到惊讶。在国际市场中，有组织的欺诈环要求我们构建一个已经分发数据处理但可以在多个数据中心实时进行的系统。欺诈是全球性的。

在Zanier的一面，人们在狗身上戴了电话，并带了它在街上散步。或把它放在火车上。这些是带有真实驾驶员帐户的真实手机，因此归结为GPS跟踪：是狗吗？火车？还是合法的旅行？

塔拉，风险管理分析师

塔拉·米切尔（Tara Mitchell）：作为风险管理分析师，我们自己进行挖掘并找到欺诈模式。我的很多工作都是浏览帐户和数据。您必须像欺诈一样思考，并弄清楚什么是异常。我的工作取决于特定一天对Uber的最大财务影响。我负责美国，加拿大和东南亚市场，因此我与这些地区或附近的人合作。我定期与团队交谈吉隆坡，，，，雅加达，和澳大利亚城市。

我们从许多不同的背景中汲取灵感。我来自OPS，进行手动评论和学习模式。我们还吸引具有财务和分析技能的人，他们喜欢查看数据并识别模式和趋势。并非每个人都以前曾担任以欺诈为中心的角色，但是每个人都具有分析模式识别和调查技能。

当我确定模式时，我将查看30天的返回数据，并将行为隔离为不同特征的分布。通过数百种组合，我们测试了如何阻止大多数这种欺诈模式发生。然后，我建议您进行修复。我将建立一组逻辑，以预测他们将来是否会参与这种模式。我们进行分析，编写代码，对其进行审查，然后在几天之内部署。例如，我写了周一将在这个星期四上线的东西。我们必须进入这些模式，因为我们没有部署修复程序意味着损失金钱。

对解决方案的模式识别的端到端所有权是我工作的重要主题。自从这里以来，我需要成为SQL的专家，以测试不同数据集的模型。我不得不学习在Python编程，因为这就是科学家在这里使用的许多数据。我们将迁移到Hadoop，这是我必须学习的另一项技术。

Ting，数据科学家

Ting Chen：作为预防欺诈数据科学家，我们开发了用于识别大规模欺诈的模型。首先，我们必须定义与欺诈相关的指标：欺诈性旅行具有哪些共同特征？欺诈驾驶员或骑手的迹象是什么？

欺诈是一个有趣的问题，因为它就像变色龙。它试图随着时间的推移融合以避免被检测到。因此，随着伪装技术变得更加复杂，欺诈指标会随着时间而变化。在中国，欺诈黑市本身非常完整。欺诈用户提出了自己的在线广告，以聘请数据科学家和工程师来进行欺诈。他们在移动消息平台中有24/7全天候的客户服务，以帮助欺诈进行未发现的工作。

目前，我用来打击欺诈的主要工具是为驾驶员注册过程构建特定的机器学习模型。我们想在实际发生欺诈行为之前检测欺诈行为的信号。如果我们想预测新的驾驶员伙伴是否注册是高欺诈风险，我们可以根据从入职过程中收集的信息来预测这一点。例如，我们可以查看汽车的车牌号进行注册，用于注册的设备以及是否以前使用过同一牌，以及该人以前是否已经尝试注册。它从那里继续，但这就是我暂时可以与您分享的！

Gaurav，解决方案专家

Gaurav Agarwal：我在欺诈计划团队中工作。We are responsible for all business metrics associated with fraud at Uber, such as chargebacks (customers disputing charges on their credit cards), refunds, uncollectibles (when we can’t collect money at the end of the trip, such as when we attempt the charge, but the charge fails), and finally account takeovers (when someone tries to log into another customer’s account).

我们的平台使我们可以进行近实时的功能查找并运行机器学习风险引擎。我的构建将在骑手或驾驶员的生命周期中的其他决策点中使用。我专门研究与Uber的帐户登录相关的风险。这涉及构建端到端系统以减少这种情况的发生。

通常，欺诈从其他网站获取密码，然后在Uber Properties上尝试。另一家公司将有数据泄漏，这些登录和密码之后将在线分发，然后欺诈将在包括Uber在内的网络上检查类似的电子邮件和登录凭据。我的工作专注于有效地阻止不受信任的来源的这些登录尝试。

Uber鼓励端到端所有权。这意味着我们拥有与帐户接管相关的登录相关风险，从构建平台层和机器学习模型到该用例的构建体系结构，该架构对于Uber的其他用例都足够扩展。

Uber的欺诈预防工程师为团队郊游尝试另一种类型的冰壶。

本文与Mani Parkhe合着预防欺诈数据基础架构团队。

对我们如何与Uber欺诈感兴趣？在Uber职业页面上了解有关涉及预防欺诈，缓解和检测的Uber工程职位的更多信息。

有关商业智能工程的其他文章，请参见：认识Uber Amsterdam工程，，，，重写Uber工程：微服务提供的机会，和学习作为Uber工程资金团队的新毕业生。

注释

鸣叫35

投票

35分享